google率先提出网页等级

    Google从一开始,追求的就是一尊完美的搜索引擎。依照佩奇和布林的定义,所谓完美的搜索引擎,是指丝毫不差地了解你
的意思,也丝毫不差地给你想要的东西。

    他们的成就’在于拒绝接受科技施加的限制,埋首持续努力创新,开发出“Page Rank"技术,以抽丝剥茧的方法,决定哪些
网页可能有你最想要的信息,并在搜索结果网页上依相关性高低整理排序,最后改变了网络搜索的方式。

   "Page Rank”这套算法,是Google成功的核心要素。由于它,Google才能有别于以前所有的搜索引擎,也因此,它似乎具
有神奇的魔力,能够找到用户觉得最实用的网页信息。

   他们认为,一个炙手可热或实用的网页,来自其他网页的链接应该比较多;其他的网站认为某个网页具有参考价值,才会链接
到那个网页。所以,“PageRank”从分析网络本身庞大的全球链接结构做起,把链接当做个别网页价值的首要指标。

   全球信息网上数十亿页网页,都可以链接到其他的网页,或者被链接。和它链接的网站愈多,表示对它的“信心投票”愈多,
显得它的内容愈重要,在搜索结果中的排序当然愈高。具体地说,网页A链接到网页B,表示网页A对网页B投下一票。因此网页
B的重要性高低, 要看其他网页给它的“票数”多寡。
   但是Google不只看一个网站的得票数或者链接数量。它也分析“投 票网页”的重要性。网页A本身如果很重要,或者在网络
社群中被视为“卓然有成的公司”,它对某个网页投下的那一票,权数就比较高,进而有助于提升网页B或其他网页的重要性。也
就是说,如果有 CNN.com等非常有名的网站和网页B连结,网页B会得到“加分”。 网页A的流量愈高,给网页B加的分愈多。

   “卓然有成”的高品质网站,得到比较高的"PageRank”,Google 每次搜索的时候,都会记住这件事。当然了’如果和你想要
查询的信息风马牛不相及,再怎么重要的网页也不中用。所以Google结合了 “Page Rank"和复杂的文字比对技术,寻找既重要
,又和你的搜索具有高度关联性的网页。

   Google不只看一个词汇在网页出现的次氟更进而检查网页内容 的所有层面,以及链接到那个网页的其他网页内容,决定它
是否适合你的搜索需求。

   因此,佩奇和布林很早又做了另一个重要的创新,那就是考虑“链接文字” (anchor text)。所谓链接文字,是指传统上以
蓝色加底线表示的文字,用以从某个网页链接到另一个网页。这是它所引用网页的一部分,也是它实际所在网页的一部分。他们
认为,虽然不是很精确,链接文字却以极其简洁的方式,汇总了它所引用网页的内容。在寻找某个人或者某家公司的名称时,这
有助于进一步确保适当的网站出现在搜索结果清单的上方。

   换句话说,"PageRank"的数值是根据网络独特的民主特质而来,等于把网络看成民主政体,各网页之间的链接等于选票。
于是搜索变成抢选票的选战。网页的受欢迎程度(得票数),等同于它的品质。这么一来,电脑程序就能判断什么是“好东西”。
被链接最多的网站,自然 提升到搜寻结果的上方。

   布林和佩奇的突破性技术,起于一份标题耸动的论文:“大型超文本网络搜索引擎解剖”(Anatomy of a Large-Scale
Hypertextual Web Search Engine)。他们在论文中解释,依照网站被链接的次数多寡,建立索引和排序,以及按照那种
顺序显示搜索结果,需要做哪些复杂的数 学运算。
   Google发展出来的这套算法,是十分宝贵的资产,产生了难以望其项背的竞争优势,在搜索技术领域构成很高的“进入壁
垒”(entiy barrier)。Google专有的“PageRank”,以客观的方式,衡量网页的相关性和重要性时,必须运用的公式,含
有五亿多个变量和二十亿个词汇。 而且,这家公司永远不满足于现状,一直在精益求精。

   这个过程,没有人力介入或者操纵结果。Google表示,它的使命是“组织整理世界上的信息,任由普世取而用之”,"Pag
eRank"帮它实现了初步的理想。这台搜寻引擎现在可以用一百多种界面语言去使用。

  "Page Rank"隐含的一个重要观念是:随着网络的繁荣滋长,它也慢慢生长一种根深蒂固的智慧。网络显然不是有意识的
实体,却也不全然是一堆东西横七竖八随便堆放在那里。其中一部分和另一部分的链接方式,反映了网络用户的偏好。Goog
le正是对准这偏好下手,在它察觉网络有其“型态”之后,设法从一片混沌中理出意义来。
注:本文由深圳谷歌推广编辑,转载请注明来源http://www.google-guge.com/blog
This entry was posted in google成功的经验.

发表评论

电子邮件地址不会被公开。 必填项已用 * 标注

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>