Google的原罪--网页序列等级
来源:中国网络传播网 作者:Daniel Brandt
作者:Daniel Brandt
翻译:晓春
校对:几何
原文刊于:Google-Watch.org, Daniel Brandt 授权品牌几何网站翻译并拥有中文版权!
1998年,当时互联网正在高速发展,处于最光彩照人的阶段。1995年开始出现的搜索引擎引起世人关注,在当时被高科技的权威们(以及福布斯杂志)评判为另一个互联网神奇组合中又一个让大家富裕的利润增长点。然而,这样的创新除了意味着整个商业模式的终结之外没有其他。
事实的真相是,就像这些早期的预言家事后不得不承认的是:轻松的迅速致富的虚假诺言成为一种附加在优秀公司头上的最大压力,妨碍了他们本来可以了解得更多,做得更好。最早最成功的搜索引擎之一,数字设备公司(DEC)旗下的AltaVista,从1998年开始就迷失了它原有的方向,所有的网络先驱们都在谈论"门户",所以AltaVista也尝试成为一个门户网站,它忘却了继续在搜索引擎序列上寻求发展。
甚至到了1998年,搜索人在搜索引擎中键入一到两个关键字所获得的搜索结果过多这个问题已经变得非常明显。AltaVista提供了众多的方法以调整关键字的特定联系,但是它仍然极少关心到"序列或者排序"的问题。序列,或者说是按照一定标准的返回信息列,应该早就不成为问题了。搜索引擎用户们可不想进行布尔逻辑运算,同时他们也不会想看前二十个以外的搜索结果。所以,真正的问题是:相对于搜索引擎B,在搜索引擎A中输入相同的关键字,其首页显示结果如何能给用户更多有用的帮助。AltaVista在忙着尝试成为门户网站的同时根本无法注意到这么重要的一点。
进入Google
1998年初,斯坦福大学毕业生Larry Page和Sergey Brin已经在网上运用了一个独有的排列方法。他们在全球互联网大会上交了名为"超级文本搜索引擎网站的解析"一文。斯坦福作为指导而Larry Page作为发明者,并于1998年9月注册了专利。直到2001年9月4日被授予专利(专利号:第6,285,999),这种计算方法被成为"页面序列等级",而Google在当时拥有1亿5千万的日查询量。AltaVista则日暮西山;甚至连续两次易主都未能有所起色。
Goolge开始大肆宣传页面序列等级,因为这一个极为方便的流传词汇,使那些想知道为何Google的引擎确实能提供更好的搜索结果的人感到满意。甚至在今天,Google都在为他们所取得的进步而骄傲。所有的宣传都接近于一点,那些网络文章的发表者有时候不得不说明他们所使用的"PR"含义,是指页面序列等级(PageRank),一种计算方式,而非指Google所做的优秀的公共关系(Public Relations):
页面序列等级凭借了互联网特有的自由民主特性,将大量的链接指向作为判定单个网页价值的标准以及指向器。非常精髓之处在于:Google把从网页A通向网页B的链接作为一个A对B的投票。投票的多少决定在搜索引擎中的排名。但是,Google并不仅仅只注意一个绝对的链接量,或者是某个网页接到的链接要求有多少。一个网页本身在Google的重要性越高,将越能使其它被链接的网页显得重要。比如:品牌几何网站在Google的重要性指数为5,在中文网页中已经算较高,所以被品牌几何链接的网页的重要性会比其他被低于5的网站链接的重要性要高。
Google继而承认,除了网页序列等级之外,还有其它的变量被使用于决定网页的意义。当另外的这些变量的宏大外观易于被那些想知道如何提升自己网站排名的斑竹们辨识的时候,所有序列计算方法实际的细节将会被考虑作为Google公司的商业机密。使网站的管理者尽可能困难地探知他们的序列方法正是Google的兴趣所在。
万般皆序列
早在饱受怀疑之前,搜索引擎已经在网上日渐重要。电子商务与网页序列非常合拍,因为高位的网页序列等级能直接转化为销售成绩。各种不同的引擎设计出各种不同的方式使网页序列创造利益价值,诸如付费排名,点击付费广告以及付费的含有性链接。2002年6月27日,美国联邦交易委员会在讨论此类问题后要求:不论是按照客观公正的网页重要性标准进行排列,还是按照付费高低的网页序列等级,都应该清楚地被标识出来,从而保护消费者的利益。这表明,像网页序列等级这类总能被解释得合情合理的计算方式将会为搜索网站的未来维持一个重要的方向。 这样,搜索引擎网站不仅仅是改进了他们的排列方式,同时还使他们的网站成长得庞大以至于大多数网上冲浪的人每天都会使用搜索引擎数次。所有的门户网站都嵌入了搜索功能,而且他们中大多数都不得不依靠少数已有的搜索引擎提供商提供搜索结果。这是因为真正有能力经常检索和排列超过2亿个页面以保持数据时效性的网站屈指可数。Google也许是唯一被公认的持续性和规律性最好的搜索引擎,而实现这一点也只用了两年不到的时间。Google用一周时间覆盖现有的网页,同时再用一周时间计算排列每一个页面的序列等级。Google的一个更新周期大约是28天,这对那些对新闻如饥似渴的网虫们来说似乎是慢了一些。2001年8月,Google对新闻类网站开始了二次迷你检索,此类检索将会使新闻类网站每天均被检索一次。而每次检索的结果将会被混在一起,这样就会给搜索者一种更新的印象。
·上一篇文章:Google Dance启示:搜索引擎优化以用户为本
·下一篇文章:百度关键词竞价价格查询
转载请注明转载网址:
http://www.jmkt.cn/html/search/211925153.htm