不可否认,从实践中我们确实可以看到一些象"过滤"的结果,但我们有理由相信这样的结果实际上是Google新算法的一种"副产品",而非Google本意。新算法意图对商业性网站而不是公益性网站施加影响。稍后我会向大家详细解释…
Scroogle.org,这个由不喜欢Google的群体所建立的网站,原来可以通过一种巧妙的方式从Google上提取数据,并向用户提供一种可检查网站在Google上的"未过滤"的往日排名结果的工具。不过由于Google现已更新了算法以禁止此类查询,故Scroogle.org现已无法提供这样的工具。不过,该网站仍显示有一个从其网站上多方搜索而收集到的所谓"Filter Hit"名单。我研究过这个名单。 我觉得,它充其量也只能证明了Google并未使用任何如上所说之名单。不然的确话,如何解释"California Divorce Attorney"位于名单之首而"Books"或"Adult"却屈居最下席?难道在Google眼里,"California Divorce Attorney"比"Books"或"Adult"更有商业价值?
Google任何从正常的排名机制中过滤掉把商业性站点的企图都是对Google品牌,乃至对其公正的搜索结果信誉的严重损害。若真有这样的企图,那Google真是太短视了,根本配不上它的品牌和它的服务。Google的股票上市(IPO)和最终业绩都将因此而毁于一旦。此外,Google也说过,其"搜索服务"和"AdWords自助广告"服务分属两个不同的工作部门,且互不搭界、互不影响。对此我还是相信的。
2.Google搜索技术的几个明显变化
2.1 Google开始采用词干技术(stemming)
Google确已在搜索结果中采用了词干技术。在早先,如果搜索一个单数查询条件如"home garden",则搜索结果中不会出现如"home gardens","home gardening"这样的关键词变化形式,反之亦然。对于Google的用户来说,这种特性可能是一件好事情,因为搜索提供的结果更多了,但站在搜索引擎 优化的立场来看,由于搜索结果的骤然增加,对关键词的竞争亦骤然加剧。
2.2 Google于搜索结果中使用了拼写纠错工具
Google开始将其拼写检查工具用于搜索结果中。例如,当输入查询条件为"Search Engine Optimisation"后,以往Google只会提示你是否是要找"Search Engine Optimization",但显示的还是符合"Optimisation"的搜索结果。不过现在则能看到"Optimization"的搜索结果。再如:"e-mail solution"和"email solution"的搜索结果一致,而"e-commerce"则与"ecommerce"的搜索结果是一致的,这样就增加了数据的竞争性。
3.对Hilltop算法的分析和推测
3.1 为什么采用新算法
大多数网迷们都知道,页面等级算法是由Google的创始人Sergey Brin和Larry Page所倡起的,用以精良网站在搜索结果中的排名。这也是自1998年Google发布以来的取得种种骄人成绩的重要因素之一。
但页面等级系统亦存在着一个基本的缺陷,Google也深知这一点。它根据一个网页上被链接的站点数量和质量来给该网页分配一个绝对的"重要性值"。同时亦将链接页面的页面等级考虑在内。指向一个网页的外部链接页的页面等级越高,则该链接页面传递给该网页的页面等级值也就越高。但是,"页面等级值"并非针对查询词语,因而一个网页即使只是在内容中偶然提到了一个和查询主题偏离的关键词语,也会因其居高的页面等级值而获得一个比较高的排名。
美国加州的克利须那。伯哈拉特(Krishna Bharat) 意识到基于页面等级的排名系统中所存在的这种瑕玼,并于2000年提出了一种新算法,他称其为"Hilltop"算法,并于2001年的一月份申请了Hilltop专利权,Google成为受让方。不言而喻,Google已然意识到这种新算法与其页面等级系统的整合将为Google的排名系统带来良好的效果。
我深信,在Google最近的更新中,不但运用了Google自身的页面等级和相关性算法,而且还结合使用了Hilltop算法用于精工调整页面等级的效果,只不过Hilltop算法可能已迥异于它最初的模样了。
3.2 什么是Hilltop算法?
对此算法有兴趣了解并想挖根究底的人可以看看克利须那。伯哈拉特当年所写的Hilltop论文及详细的Hilltop专利信息。但对我们大多数人来说,只要知道Hilltop算法到底是个什么东东就可以了。简单地说,页面等级决定一个网页的"权威性",而Hilltop(LocalScore)则决定匹配一查询条件的一个网页的"权威性"。
Bharat提出:在利用"页面等级"来寻找"权威"网页时,不应单恳览涤谥档拇笮±炊ǘ幔氐惴旁谒氩檠魈獾南喙匦陨希?即不但需要考虑网页的页面等级,还要考虑该网页的页面等级与查询主题的相关性是否相称。若一个网页只与查询主题只沾点边,那么即使其页面等级非常之高,对用户来说也是没有意义的。如此一来,于网页而言,那些来自于"相关主题"的文档的链接就更有意义了 (Bharat称这种"相关主题"文档为"专家文档"),一个网页的所有外部"专家文档"链接构成了该网页的"权威性值"。Hilltop算法的意义在于:相同主题网站之间的链接应比非相关网站的链接具有更高的价值。
Hilltop算法以如下方式计算一个网页的"权威值"(这只是极为简单的一个例子):
上一篇:
“HillTop”论 - 探索Google排名新算法(一)下一篇:
“HillTop”论 - 探索Google排名新算法(三)
返回栏目:
谷歌(Google)优化推广