简析搜索引擎工作原理

2017-07-25

一个合格的SEO一定要对搜索引擎的基本原理有一定的了解,很多看似复杂的SEO问题,如果从搜索引擎的原理出发,这些问题就可以迎刃而解了。想要有效地开展SEO工作,一定要知其然并且知其所以然。下面担路网小编就简单为大家介绍一下搜索引擎的工作原理。

搜索引擎的工作过程大概包括三个阶段:

1.爬行和抓取:spider按照一定的策略发现访问页面,将网页抓回服务器。

在这过程中蜘蛛要做的是抓取重要的页面,影响页面重要程度的因素主要包括:网站和页面的权重;页面的更新度;导入链接的数量以及质量;与首页的点击距离;URL结构。

2.预处理:对抓回来的网页进行文字提取、分词、消除噪声、索引、倒排索引等处理。

现在的搜索引擎还是主要以文字为基础的,蜘蛛先将抓回来的网页中的文字去标签、程序。当然除了中文文字,蜘蛛还会提取一些重要的标签:meta标签、alt标签等。然后是分词,将容易产生歧义的词加粗换字体等形式提示搜索引擎。消除噪声是指将对页面主题没有意义的版权声明、广告等。搜索引擎还要对页面进行去重处理:提取页面的特征关键词比对数据库中是否有重复的。然后是建立正向索引:将每个网页简化成一个个关键词,再形成倒排索引:一个关键词对应相应的网页。

3.排名:用户查询关键词,调用排名程序,经过相关计算,形成排名。

搜索引擎接收到用户输入的搜索词之后,将搜索词进行分词、去停止词、指令处理、拼写错误的矫正,然后结合用户用户的地理位置、检索历史等,如果用户的搜索词在缓存中存在就可以直接将缓存结果提供给用户,如果不存在,就从索引库中将网页调取排名呈现,并将该关键词以及对应的结果加入到缓存中去。

SEO要在保证用户体验度的基础下迎合搜索引擎,SEO既要站在用户的角度,也要站在搜索引擎的角度,这样才能更好的优化好网站。


担路云系统-D云系统

公司地址: 上海松江九亭九杜路349号417/418/419

友情链接:企信指数    担路云系统