推荐实用
星期二
SEO 教程: I.1 搜索引擎如何工作
关于 SEO 你需要了解的基本事实是,搜索引擎不是人。这点很容易了解,人和搜索引擎查看网页的方式是不一样的。和人不一样,搜索引擎是文字驱动的。尽管技术飞速发展,搜索引擎还是不具有智能,它们无法感受到网站很酷的设计、无法欣赏影片中的声音和运动。相反,搜索引擎爬过网站,查看网站每一个条目,来了解网站的内容。这个大致解释并不精准,稍后我们将要看到,搜索引擎会执行几个动作将分离搜索结果 — 爬行(crawling),索引(indexing),处理(processing),计算相关度(calculating relevancy),重新检索(retrieving)。
首先,搜索引擎爬过(crawl)网站来看它在哪儿。这个工作是由软件来执行,被成为爬虫或蜘蛛(或者 Googlebot, 因为它与 Google 有关)。蜘蛛跟着链接从一个页面到另一个页面,并且索引(index)他们发现任何东西。要知道网上有海量的网页(大约200亿),对于蜘蛛而言,要每天访问一个网站查看是否有新的页面或已有页面是否被更改是不可能的。有时候,蜘蛛可能一两个月都不会访问你的页面,这么这段时间,你的 SEO 效果也不会有作用。但你也无能为力,保持镇定即可。
你所能够做的就是检查爬虫从你的网站看到了什么。如前所述,爬虫不是人,它们不能看图片,动画电影,Java脚本,框架,密码保护页面和目录;所以如果你的网站上有海量的类似信息,你最好运行下面的蜘蛛模拟器(Spider Simulator)来查看这些甜品是否被爬虫看到。如果没有看到,它们就不会被爬过,不会被索引,不会被处理等等。总之一句话,对于搜索引擎而言,它们是不存在的。
Spider Simulator
Enter URL to Spider
当页面被爬过以后,下一步就是索引它的内容。被索引的页面存放在海量数据库内,稍后会在那进行分离。基本来说,这个索引的过程是识别能够最好描述页面的文字和措辞,并归入特定的关键词。对于人而言,要处理如此大量的信息是不可能的;但对于搜索引擎而言,它们只要执行任务就行。有时候,它们无法理解页面的意思,但是如果你通过优化网页来帮助它们,它们会更容易对你的网页进行正确分类,给网页带来更好的评分。
当搜索请求来临的时候,搜索引擎处理它 — 比如说,将搜索请求中的字符串和数据库中已索引的相比较。由于不止一个(事实上有数百万个)类似的网页包含这个搜索字符串,搜索引擎开始计算相关度,关于已索引页面与搜索字符串之间的相关度。
有许多不同的算法可以计算相关度。不同的算法对于每个普通影响因素诸如关键词密集度(keyword density)、链接(links)、和元标签(metatags)都有不同的权重。这也是不同的搜索引擎搜索相同字符串,结果通常不一样的原因。并且,众所周知,所有主流的搜索引擎,如 Yahoo!,Google,MSN 等,都周期性地更改它们的算法;如果你希望自己的网页保持在顶端,就必须跟进最新的变化。这是让你不断投入 SEO 的一个原因(另外的原因是你的竞争对手),如果你希望呆在顶端的话。
搜索引擎的最后一步动作是重新检索结果。基本上,这一步只是简单将结果在浏览器中显示出来 — 无穷尽的搜索结果按照关联度从重到轻依次排列。
订阅:
博文评论 (Atom)
没有评论:
发表评论