万维网由超文本构成,网页的关键部分

  • 时间:
  • 浏览:2
  • 来源:安徽大学教务系统_安徽大学教务处_安徽大学教务管理系统青大教务
阅读模式

关于爬虫的知识就告一段落了,在 爬虫的爬取数据 中,学记所记录的是 网页端的内容 ,也就是 WEB端的内容 。由于在爬虫的知识中web只是其中一个 数据源 ,因此对于 WEB 的知识没有很详细的进行讲述。

为此,在这篇文章中,我们就来详细的了解一下 web的相关知识。

在了解网页之前,先来了解一下网页的集合体—万维网。

万维网

万维网( W orld W ide W eb)亦作 WWW ,是一个通过互联网访问,由许多 互相链接 的超文本组成的 系统 。英国科学家 蒂姆 · 伯纳斯 - 李 于 1989 年发明了万维网。1990年他编写了 第一个网页浏览器 。网页浏览器于1991年 发行 ,1991年1月最先向研究机构发行,并于1991年8月在互联网上向公众开放。

蒂姆·伯纳斯-李

万维网是信息时代发展的 核心 ,也是数十亿人在互联网上进行交流的主要工具。

万维网 并不等同 于 互联网,万维网只是互联网所能提供的服务其中之一,是依附于互联网运行的一项 服务 。

万维网的起源

万维网最早的构想可以追溯到遥远的 1980年 ,蒂姆·伯纳斯-李构建的 ENQUIRE 项目。这是一个 类似 于 维基百科 的 超文本在线编辑数据库 。尽管这个项目与我们现在使用的万维网大不相同,但是它们之间有 许多相同 的核心思想。

1989年3月, 伯纳斯 . 李 撰写了《关于信息化管理的建议》一文,文中提及 ENQUIRE 并且描述了一个 更加精巧 的 管理模型 。1990年11月12日他和 罗伯特 · 卡里奥 合作提出了一个更加正式的 关于万维网 的建议。在 1990年11月13日 他在一台NeXT工作站上写了第一个网页以实现他文中的想法。

罗伯特·卡里奥设计的web图标

在1990年的 圣诞节 ,伯纳斯-李制作了要让网页工作的所有必要工具: 第一个网页浏览器 WorldWideWeb(同时也是网页编辑器)和 第一个网页服务器 。

世界上第一台作为网页服务器的NeXT电脑

万维网上需要 单项连接 而不是双向连接,这使得任何人可以在 资源拥有者 不作任何行动情况下链接该资源。和早期的网络系统相比,这一点对于减少实现 网络服务器 和 网络浏览器 的困难至关重要。万维网不像某些应用软件,它 不是私有的 ,这使得 服务器 和 客户端 能够 独立地发展 和 扩展 ,而不受许可限制。

1994年10月, 万维网联盟 (W3C)在 麻省理工学院计算机科学实验室 成立,创建者是万维网的发明者蒂姆·伯纳斯-李。到了 1994 年底,全球网站数量仍然 相对稀少 ,但是很多 著名网站 已经相当活跃,这些网站已经预示或者启发了当今最流行的服务。

万维工作室的标牌

通过 互联网 ,世界各地都创建了其他网站。这促进了 协议和格式化 的国际标准发展。伯纳斯-李 继续参与指导 万维网标准的开发,例如 编写网页的标记语言。 万维网通过一种易于使用和灵活的格式,使信息在互联网上传播。因此,万维网对于 互联网的普及 发挥了重要的作用。虽然这两个词语有时被混在一起使用,但万维网并不是互联网的同义词。万维网是一个 信息空间 (Information space),包含超链接文档和其他资源,由其 URIs 标识。它使用互联网协议如 TCP/IP 和 HTTP 实现为客户端和服务端服务。

那为什么World Wide Web 在 中文环境 中被称为 万维网 呢?

1994年6月,在北美留学的 李小文 (中国科学院院士)于中国新闻电脑网络(CND)的电子出版物 《华夏文摘》 上首次将“ W orld W ide W eb”称为“ 万维天罗地网 ”,简称“ 万维网 ”,这样其中文名称汉语拼音也是以WWW开始,自此“万维网”这一名称开始被广泛采用。

名副其实的扫地僧

万维网的核心部分是由三个标准构成的:

统一资源标识符 ( URI ),这是个为资源定位的标识系统。 超文本传送协议 ( HTTP ),此协议负责规定客户端和服务器之间的交流规则。 超文本标记语言 ( HTML ),此语言作用是定义超文本文档的结构和格式。

猜你喜欢