抓取期
一般来说,蜘蛛不会一上线就爬。一般来说,有一个时间段,一周左右。
当然,也有可能是某个小程序上线后就没有被抓取过。其中一个可能的重要原因是小程序的域名之前被使用过,被K屏蔽了,也就是被百度列入黑名单,在检查期间被延迟。
如何确定一个域名以前是否被使用过?我们可以用百度和好乐搜索域名,看看有没有旧信息。之所以用goodle来搜索,是因为goodle的信息是****,其收款金额是****,比较全面。如果发现以前用过域名,果断换域名。
另外,在爬行周期中,也有一个失败周期。有可能域名是新的,网上提交的,蜘蛛也爬。但是爬行过程中存在问题。可能出现两种情况,一种是服务器空间提供者屏蔽蜘蛛,另一种是DNS有问题,就是域名解析服务器。当我们访问小程序时,我们首先解析IP地址,然后通过IP地址找到服务器。问题是在解析小程序时,如果IP无法解析,可能会被服务器空间商阻塞,尤其是一些小空间商或者不稳定的外来空间商,可能会导致这种情况。所以尽量选择稳定的家居空间。
如何判断空间提供商是否有屏蔽问题,两个小技巧,一个是小程序上线后验证百度站长平台,如果被屏蔽,会有消息提醒;另一种是抓取诊断,用于提交路径,测试抓取是否正确稳定。
包含期
蜘蛛爬行后,有一个周期,可能不会立即包括在内。而且收录的时候,第一页也会收录。有个沙盒概念,说是新小程序,会有检查期。沙盒期会导致一些页面不能立即发布,同时也可能导致包含期较长。
如何缩短沙盒周期要注意一些技巧
第一,在沙盒时期,知道蜘蛛是否会抓取内页是非常重要的。可能是看小程序日志分析出来的。如果搜索引擎抓取了内页,但是没有发布,那么我们的解决方案是发送外页链接,我们的意思是发送内页的链接。
投票期
投票期是指提高小程序综合得分。投票期也是有周期的。发现期为一周。权重越高,发现期越短,统计期一周,时间无法缩短,行动期不确定,死亡期发生。当链接失效时,将进入死亡期。
计算周期
与一个概念相关,搜索引擎优化的倒排索引,搜索引擎会对关键词进行预处理,先排列好,用户搜索的时候直接展示给客户,这也是为什么百度搜索关键词只需要不到一秒钟就出来,节省了很多时间,而不是你搜索的时候,百度只去数据库搜索结果。这就是所谓的倒指数,倒序来,不是赤手空拳。