声明:网站内容纯原创,转载请注明出处http://cwg.1duiyi.cn
当前位置:首页 > seo基础 > 正文

seo基础入门搜索引擎抓取排名的流程

05-23 seo基础

抓取-------临时数据库--------筛选-------索引-------收录-------提供检索服务 (排名)
  1.页面可以正常打开------然后搜索引擎派蜘蛛(蜘蛛的本质是一个程序,用来抓取的工具)通过链接来到我们的网站,抓取的页面分为2种原则(1深度优先策略2.广度优先策略)蜘蛛看的是代码,蜘蛛走的路是链接,链接的层级不要超过5层,抓取网站的内容放到临时数据库形成快照。就是我们说的抓取。备注:抓取的影响因素(1.需要权限。2.网站打不开3.服务器空间主机不稳定4.404页面5.网站被黑6.robots文件禁止抓取)
seo基础入门搜索引擎抓取排名的流程蜘蛛广度优先策略
广度优先策略
深度优先策略
深度优先策略
  2.蜘蛛将抓取到的页面统统放到一个仓库当中,我们叫他临时数据库
 
  3.蜘蛛对文字识别最高,图片可以通过alt属性识别,目前蜘蛛是不能识别视频的,我们需要用文字在视频的下面加上中文说明,在重要的地方/链接,不能使用JS,而ifrane框架也不建议常用,ifrane通常是从一个内容调用过来的,尽量避免。搜索引擎通过处理后,将原来抓取的大量的无价值的页面,死链接,欺骗的页面(低质量的内容)扔掉,为了节省搜索引擎的空间。这就是所说的筛选
 
  4.筛选后的内容,搜索引擎会将这些内容放到索引数据库中,我们叫他索引,索引是质量较高的页面,查看索引量可以通过百度搜索资源平台查看。进入索引是有机会参加排名的。
 
  5.搜索引擎通过自己的算法,对索引数据库中的内容再次进行过滤,我们称之为收录。一般情况下索引量约等于收录量,也有特殊情况,分为2种情况,1索引量大于收录量,特别是新站(因为从索引到收录有一个过程)2.索引量小于收录量(原因是数据不准,多个快照)。
 
  6.用户搜索一个关键词,百度会通过算法对索引数据库中的页面进行质量得分,将得分高的页面进行排序展示给用户,用户看到的百度快照第一页,第二页,第三页。就是百度给提供检索服务(排名)
 
  补充:百度官方认为蜘蛛抓取的页面是收录量,而参与排名的是索引量

版权保护: 本文由 博主 原创,转载请保留链接: http://cwg.1duiyi.cn/jishu/1.html