咱们有一个网页3000多行中文+英文,快照显现不完好,通过站长渠道模仿抓取(注:这位同学指的是抓取确诊东西),文字也显现不完好,对网站影响会不会很大?院长把这个抽象的问题拆成了小问题,并向工程师进行了承认。
第一个问题:百度对网页内容多少巨细有约束吗?
答:对内容文字多少没有约束,但源码巨细上有必定的约束,过长的话,会取前面一部分,所以,源码仍是越简练越好
第二个问题:假如快照显现网页不完好,是不是阐明BaiduSpider没有完好录入网页?
答:不是的,快照的成生触及许多环节,显现不完好的原因会许多,不能简单地以为没有录入完好。
百度对网页内容大小和字符有要求吗?-八韵网络工作室
第三个问题:运用渠道抓取断东西也不能完好显现,是不是就可以以为没有录入完好了?
答:不是的,东西只展现前200K。咱们设计东西的时分对网页做过调研,一般来说展现前100K就够用了。
第四个问题:百度是否要求网页上不能有什么特殊字符?
答:没有这个约束。