Google的原罪--网页序列等级
来源:中国网络传播网 作者:Daniel Brandt
对于普通的网站管理者,从1996年到2002年,运营好一个网站的技巧被戏剧性地改变了。这完全是由于搜索引擎重要性的增加。尽管在2000年以及2001年大多数.COM神话开始崩溃(这对于那些对崩溃前的日子记忆犹新的非商业性网站的斑竹们是一个解脱),这个事实一直延续到现在,而搜索引擎几乎是所有网站页面设计与链接的基本要素。那也是为什么搜索引擎网站认为应该将联邦交易委员会所提出的公正客观的排序标准计算法则需要进一步审视。
什么样的客观标准才是有效的
序列标准评判分成三个部分。第一部分是链接受欢迎程度,这被大量的搜索引擎一定程度使用。Google的页面序列等级是"链接知名度"的最原始模式,并且保持着其最纯洁的表达方式。这第二个部分则是网页特色。这部分包括字体大小、网页标题、关键字、关键字出现频率、文字相近度、文件名、目录名以及域名。最后那部分是内容分析。通常这一步会将搜索结果即时分类后归入几个项目中,这使得搜索者可以通过更具体的样式得到数据。以上每一种方法都有自己的作用。搜索引擎使用第一和第二种方法的一些组合,或者是单独使用页面特性检索(第三种方法),又或者是三种方法全部使用。
内容分析是这三种方法中最最困难的一种,但它也是非常让人浮想联翩的。如果一切变得理想化,当使用这种方法时,图形的检索将会成为可能,这种方法会使搜索引擎因为其创新与卓越赢得辉煌的声誉。但在许多情况下,这种方法并不能正常运作,因为计算机对于自然语言的处理并不擅长。它们不会明白这一大堆来自于不相干的来源的语言之间有什么细微的差别。而且大部分顶级的搜索引擎都会使用成打的语言种类,而由于每一种语言都会有自己的不同之处,这使得内容分析更为困难。有一些搜索引擎已经对此做了一些有趣的改进,其中有些甚至还发展了图形搜索功能,但是Google并不是其中之一。其实内容分析最有希望的前景在于它能够被用于和链接知名度相结合,在特定的领域内排列网站。这可能为解决一些纯链接知名度的问题提供一个新的思考角度。 链接知名度,Google把它成为PageRank,很显然是Google的序列层最重要的部分。当一个页面的部分页面特性能够胜过其较其上位的竞争页面的页面序列时,一些按照通常标准具有十分完美页面关联的网页会因为极低的页面序列而被埋没将会成为十分正常的事。另一方面,一个在其标题、头条以及内部链接均有可查询元素的网站,也可能因为其母网站的链接知名度不够而在排列中遭到埋没,同时不能向这些相关网站过渡足够的页面序列等级。 2002年12月,Google发布了一个可供下载的工具栏,它可以看到任何网页相关的页面序列等级。实际上可下载的工具栏解析,以及针对竞争页面所做的页面排列研究,也涉及了对页面序列规律的相当洞察。
此外,页面序列等级驱使Google每月检索一次,相对于那些页面序列等级低的网站,页面序列等级高的网站将会被更早,更快,更深入地检索。对于那些拥有相对较低序列等级的大型网站,这确实是个阻碍。假如你的网页不被检索,那也就不会被编入序列索引中。假如不被编入Google的索引中,人们就不会知道。假如人们不知道,那么就没有足够的点数维持网站。Google另外对所有网页启动了28天的更新周期,所以错过的网页在下一轮更新还有机会。简单地说,页面序列等级是Google的核心与实质,对于非常重要的检索和排列也一样。到2002年Google已经被普遍认知为世界最知名的搜索引擎。
如何使页面序列等级达到标准?
首先,Google的单纯的宣言"页面序列等级完全是依赖于网站的独一无二的民主特性"必须被认真审视一番。在一个民主体制中,每一个人只有一次投票机会。而对于页面序列等级,富有的人比贫穷的人有更多的投票机会,或者,在网络范围内,页面序列等级高的网页所投的票会比页面序列等级低的网页所投的票重要。Google对此的解释是:"投票计算是投票方自身的重要性决定了投票本身的重要?quot;。换句话说其实就是,富人更富,而穷人几乎都不能被计算在内。这不是"独一无二的民主",而是独一无二的暴政。搜索引擎是美国的梦幻机器,是一个可以以大欺小的地方。页面序列等级只是看上去更贴合联邦交易委员会所标榜的 "公平、客观的序列标准"。
·上一篇文章:Google Dance启示:搜索引擎优化以用户为本
·下一篇文章:百度关键词竞价价格查询
转载请注明转载网址:
http://www.jmkt.cn/html/search/211925153.htm