谷歌搜索引擎的原理
搜寻引擎有两个主要的功能:抓取与建立索引,以及提供用户最具关联的搜寻结果列表。
1.抓取与建立索引
全球的资讯网路如同是大城市的地铁系统。
每个车站都是一份文件(通常是网页,但有时是PDF,JPEG,或是其它档案)。而搜寻引擎需要一种方法去“检索”整个城市以及寻找各个站点的方法,最好的方法就是使用网页设计上的”连结”方式(Link)。
网站的LINK把所有的网页串连在一起。
“网页设计上的连结”能够让搜寻引擎的机器人(Robots),俗称“网路爬虫"或“网路蜘蛛"用来抓取网际网路上大量的连结网页。
当搜寻引擎找到这些网页,开始检索收录网页后,把资料储存在庞大的资料库中,让搜寻者之后可以马上搜寻到该资料。为了让庞大的网路资料瞬间被收录,所以搜寻引擎公司必须在世界各地建立了数据中心,让搜寻的时间缩得更短。
这些庞大的储存设备容纳了数千台能够迅速处理大量讯息的伺服器。当用户在进行搜索时,都希望马上得到结果,就算只是1秒或2秒的延迟都会造成他们的不满,所以搜寻引擎公司一直致力在最短的时间提供答案给用户。
2.提供解答
搜寻引擎是解答机。当用户在网路上进行搜索时,搜寻引擎会在庞大的数据库中执行两件事:第一,它只提供对用户最有用或最相关的搜寻结果;第二,它依照网站热门度而排序这些搜寻结果。
SEO就是为了影响搜寻引擎判断相关性与热门度的方式。 (在网页设计初期需规划好关键字并适当加入文章)
搜寻引擎如何判断相关性与热门度?
对于搜寻引擎来说,提供相关性搜寻结果,比提供用户搜索的关键字要有意义多了(给搜寻者需要的解答,而不是条列搜寻到的关键字列表)。在早期的搜寻方式来说,搜寻引擎并没有对此多著墨,而搜寻出来的结果也不尽理想。多年来,聪明的工程师们已经设计出更好的方式来媒合用户的搜索。今日,数以百计的因素影响着搜寻结果,我们之后会讨论几种最重要的因素。 (网页设计前期针对产品热门关键字度评估后挑选出重要关键字)
搜寻引擎会认定越热门的网站,网页,或档案越有丰富的资讯与价值。这个论点在用户满意度上是被证实的。
热门度与相关性并不是以人工判断。取而代之的,搜寻引擎利用数学公式(演算法)分类鉴别价值(相关性多寡),然后再依据质量(热门度)排序。
这些演算法通常包含数百个变数。在SEO搜寻引擎优化领域,我们把它们称为“排名因素”。 Moz在这主题上精心设计了一个专区:搜寻引擎的排名因素。
SEO网站优化要怎么做才会成功?
搜寻引擎复杂的演算法看似难以理解。但实际上,它们提供了一些关于“如何取得更好的结果与流量”的参考原则。以下是关于网站优化与做法的描述:
GOOGLE的SEO指南
想要在Google搜索引擎得到更好的排名,Google建议如下:
- 为用户经营网站,而不是为了搜寻引擎。不要欺骗您的搜寻者或是呈现不同的内容分别给搜寻引擎与搜寻者,而这样的做法通常称做“黑帽"。 (网页设计公司通常不会告知是使用何种方式,所以寻找SEO公司必须谨慎)
- 让网站有清楚的结构和文字连结。每个网页应该都至少要透过一个静态文字连结到。
- 建立一个实用的,资讯丰富的网站,并且每个网页内容必须清楚精确的呼应您的网页标题,确保您的〈title〉与ALT准确
- 使用关键字来制作有丰富内容与容易辨识的关键字连结URL。
- 提供一个URL的版本来让搜寻引擎了解哪个才是正确的网址,使用301重新定向或rel=”canonical”来解决重复的内容。
BING的SEO指南
想要在微软的搜索引擎得到更好的排名,Bing的建议如下:
- URL架构确保干净简洁并含关键字。
- 确保内容不要放在媒体里面(Adobe Flash Player, JavaScript, Ajax)且媒体内不要隐藏连结。
- 建立含关键字的内容与用户会搜寻的关键字。
- 定时更新内容。
- 避免把您想被搜索的文字放在图片里。例如:若您想把自己的公司名称与地址被搜索,请确保它们不是显示在公司商标的图片中。
这并不难,成为SEO搜寻引擎优化人员之一吧!
搜寻引擎公司除了提供这些建议以外,搜寻引擎已存在超过15年,在这期间,SEO搜寻引擎优化人员已经找到搜寻引擎如何排序网站的方法。SEO搜寻引擎优化人员们利用这些资料帮助自己与客户的网站有更好的网站自然排名。
虽然没有很明显,但是搜寻引擎也认同SEO搜寻引擎优化这种方式。在搜寻引擎商业大会上,例如Search Marketing Expo, Pubcon, Search Engine Strategies, Distilled和Moz自己的MozCon都吸引了工程师与主要搜寻引擎的代表参与讨论。搜寻引擎的代表偶尔也会在部落格,论坛,和社群帮助网站经营者。
实验时间
对于网站经营者来说,除了持续的实验与验证,没有更好的方式来研究搜寻引擎。在反覆实验的过程中,累积一点一滴的研究实验成果,来汇集成可观的知识。
我们曾做过的实验如下:
- 用一个无意义的字,注册一个新网站(例如:ishkabibbell.com)
- 在这个网站建立几个页面,并且全部使用无意义的词(例如:yoogewgally)
- 让所有页面越相似越好,只一个地方不同,例如改变文字的位置,格式,使用关键字,LINK,等。
- 建立连结到其他网域的网页(已被收录的网页)。
- 记录搜索引擎上的页面排名。
- 对页面做细部的改变,并评估改变对搜寻结果的影响,来确定影响排序上下的原因。
- 记录任何有用的结果,并在其他网域或用其他字重复测试。若测试的结果都相同,那你就发现了搜寻引擎使用的一个规律。
我们进行的一个实验
在我们的实验中,一开始我们最早建立(最上面)的连结的比重会比下面的连结更加重要。我们通过建立一个无意义的网站连结到三个网页,且每个网页都有一个同样的无意义关键字。在网路蜘蛛抓取了网页,我们发现最早的连结排名最高。
这个实验过程,不只是帮助SEO搜寻引擎优化人员。
除了这样的实验,SEO搜寻引擎优化人员也能够透过研究理解搜寻引擎向美国官方单位申请专利。其中最有名的是1990年代晚期,在史丹佛大学的学生宿舍催生Google,专利号为#6285999“Method for node ranking in a linked database.(连结资料库内的节点排序法)"的PageRank演算法。原始的论文主题,“Anatomy of a Large-Scale Hypertextual Web Search Engine(剖析大型网站搜寻引擎的原理)",已被认定为重要的研究。
透过规律分析,实验,和现场测试,做为SEO搜寻引擎优化人员的一份子已经开始了解许多搜寻引擎的基本原则以及如何建立高排名和拥有高流量的网站(网页)的关键要素。
接下来的这个指南会专门解释这些事项。请享用!