当前位置:首页 > seo基础知识 > 正文

什么是搜索引擎

什么是搜索引擎,搜索引擎的工作原理是怎么样的?关于这些问题也是学习seo基础首先要掌握的知识点。小凯通过四个方面来解释什么是搜索引擎以及搜索引擎的工作原理,希望大家可以更加清楚的认识搜索引擎。

什么是搜索引擎

一般来说,搜索引擎的工作原理是通过四个步骤来完成一整套工作流程的,这四个步骤就是抓取、过滤、收录、排序。

1、抓取

搜索引擎抓取网站的工具叫做蜘蛛,不同的搜索引擎对此有不同的名称,比如:百度搜索引擎的蜘蛛叫做Baiduspider,常见百度旗下同类型蜘蛛还有下面这些:Baiduspider-mobile(抓取wap)、Baiduspider-image(抓取图片)、Baiduspider-video(抓取视频)、Baiduspider-news(抓取新闻)等;谷歌蜘蛛:Googlebot,还有Googlebot-Mobile,这是抓取wap内容的蜘蛛等;360蜘蛛:360Spider等等,但是工作原理是一样的。

这些蜘蛛主要是通过网站的外部链接,或者直接通过搜索引擎提交入口提交网站链接主动邀请蜘蛛抓取,还有一种抓取方式是因为网站优化的比较好,内容质量比较高,这样也会使得蜘蛛主动去抓取网站。不管是外部链接、搜索引擎提交入口、还是蜘蛛主动抓取,我们可以通过查看百度站长平台内的网页抓取数据或者网站的服务器的日志这两种方式来查询到相关的数据。
那么什么是影响蜘蛛抓取的原因呢?答案是由于网站地址的路径过长可以阻碍蜘蛛抓取的进度;还有一点是使用的空间访问速度低和使用中文路径等原因都是阻碍蜘蛛抓取的原因所在。

2、过滤

互联网世界的信息量是非常大的,搜索引擎为了避免出现过多的死链接和欺骗用户的垃圾链接,不浪费用户搜索访问的时间成本,同时为了节省搜索引擎的工作时间和节约搜索引擎服务器的资源,会对蜘蛛抓取到的信息进行一个质量的过滤。
搜索引擎过滤的原理是根据网页的受欢迎程度,内容的稀缺性,页面与标题的匹配度,也就是页面的质量,还有网站本身的权重和时间因素来判断是否需要把网页给过滤掉,从而建立高质量的信息数据。

3、收录

过滤完成之后,搜索引擎就开始对网页进行收录的工作,要通过SITE:域名或者百度站长平台来查询网页是否被搜索引擎收录了。一般情况下,搜索引擎会对网址、网站的标题、描述和关键词进行收录。在网页的空白处右键点击查看源代码后的页面也是会被搜索引擎记录下来的,所以在很大程度上不要轻易改动这些源代码,否则会使得搜索引擎对该网站的信任度降低,直接导致网站权重的下降。

这里面还出现了一个名词叫做收录率,也就是网站总页面与收录页面的比重,通过搜索引擎收录页面的数量和网站总页面的比例来判断收录率的多少。收录率越高越好,但是收录率越高并不代表网站排名越好,收录率的高低可以体现出页面内容质量的高低。

4、排序

搜索引擎对收录的网页进行最后的排序工作,用户体验好的,内容有价值的网页自然会排在前面。通过搜索引擎的排序工作原理定义自己网站的优化方向,这是一个周期的工作,所以站长一定要有一个时间上的心理准备。摆正好心态,因为排序是一个漫长的等待过程,不知道什么时候可以带来好的排名,网站可能很快有排名,也可能很久不会有排名。

根据搜索引擎工作原理的描述,我想大家都清楚的认识了什么是搜索引擎,如果对搜索引擎的问题还有什么不明白的地方直接联系小凯。

评论已关闭!