说明:如果您有任何疑问或想咨询其他业务请拨打电话 400 685 0732
全网监测海量数据按需发布监测预警
实时把握舆情动态精准追溯信息源头
百度VIP大讲堂中贡献出了很多有价值的问答,我们可以从中解读出未来百度的算法动态。
问:我们是个平台,很多产品其实只是一个型号变更了,其实颜色都是一模一样的,对蜘蛛而言仅仅只是几个字符,会被识别为重复吗
答:如果是一个产品的结构化信息的话,应该不会被认为是重复。如果你是简单内容摘要的方式进行介绍的话,可能会存在重复问题。
解读:结构化数据是未来的大势所驱。结构化数据更有助于搜索引擎对网页的处理。
问:现在我的网站被很多蜘蛛爬,我想只让百度蜘蛛爬,百度蜘蛛IP多少?能设白名单么?
答:百度蜘蛛IP是不断变的,现在网上的确有一些白名单的说法,暂时是有效的,但不保证今后不会变,所以建议站点还是通过ua进行判断,我们百度站长平台上有相关的文章,你可以找一下。
解读:广大草根站长的智慧是强大的。
问:我网站有一些列表页,都没有链接,担心百度抓不到
答:现在百度站长平台的站内搜索工具有一个绿色收录通道,在那里提交种子页,我们知道的。
解读:从目前实际只能点看,即使列表页没有可抓取的链接,百度也能够正常抓取列表页面的内容。
问:现在很多网站都有自己的站内搜索,都会产生站内搜索结果页,百度不喜欢搜索结果页的话,我们用这个会不会对我们有影响?只是不喜欢还是对我们网站会有惩罚
答:蜘蛛会去抓,抓完之后重要是提取里面的链接。如果只有一两条这样的页面质量不好问题不大,如果整体质量较差,有可能受到惩罚。
解读:站内搜索可以让我们挖掘出更多用户的需求,建议站内搜索的优化更偏向用户需求优化。
搜索退出:可能为搜索结果相关度低,建议改进匹配方法;搜索产品超出心里承受,建议增加产品竞争力;搜索结果为空,建议优化产品匹配模式。
搜索优化:同一事物有多个名称,建议同义词匹配;错拼,错误匹配。
集中搜索:页面上提到的术语缺乏解释,建议补充术语说明;导航难用,建议结合搜索信息优化导航;用户需求迫切或短时间热门,建议增加热门搜索。
问:刚才说资讯内容页面,上面有个发布时间好,那如果页面上没有时间呢?
答:那我们往往是按当时抓取的时间来做判定。
解读:百度对文章发布时间的判断,文章发布时间的设置也是其中一个判断因素,虽然这个因素的权重值可能不是太高。
问:我网站的信息已经过时了,但网页返回的是200,会受惩罚?为什么呀?
答:用户在搜索结果里点了你的结果,导流导到你的网站,但没什么可看的,对用户没有用,百度当然不喜欢。
问:我们团购网站的确会有过期团购的页面,会受惩罚吗?
答:如果量特别大、点击量很大的话肯定会有惩罚的。有些可以当内容死链被分析出来,如果分析不出来,会被一些其他的策略挖出来,会有这样的问题。
解读:未来用户行为,如跳出率、退出率将会是搜索引擎判断页面价值的重要因素。
说明:如果您有任何疑问或想咨询其他业务请拨打电话 400 685 0732