说明:如果您有任何疑问或想咨询其他业务请拨打电话 400 685 0732
全网监测海量数据按需发布监测预警
实时把握舆情动态精准追溯信息源头
百度目前在站内搜索中支持5个数据模板的提交,分别是:通用、影视、小说、游戏、论坛。在实际的工作中处理过2个,所以分享下这2个的处理方法。 1、按照惯例,百度的这个提交是需要用xml地图集的形式,先来说说游戏模板
<?xml version=”1.0″ encoding=”UTF-8″?> | 备注 |
<urlset> | |
<url> | |
<loc>http://www.880sy.com/games/64929.html#gid.html</loc> | 着陆页 |
<lastmod>2013-01-01</lastmod> | 文件一次更新时间 |
<data> | |
<name>*</name> | 游戏名称 |
<url><![CDATA[http://www.880sy.com/games/64929.html#gid.html]]></url> | 着陆页 |
<gameCategory>移动游戏</gameCategory> | 可根据tag调整 |
<gameSubCategory>手机游戏</gameSubCategory> | 可根据tag调整 |
<description>《魔兽》(World of Warcraft)…</description> | 测试下来,站内搜索展示前140个字符正好,如果没有字符,别忘了要技术写个判断加上些类似“暂无介绍”的文字,不然会报错 |
<image> | |
<name>*图标</name> | 可以是图片的alt标签 |
<url><![CDATA[http://xxxxx.xxx.jpg ]]> </url> | 游戏的展示图片,例如手游的话是app图标 |
</image> | |
<datePublished>2011-12-20</datePublished> | 游戏的发布时间 |
<size>*MB</size> | 游戏大小 |
<tag>RPG,射击</tag> | 游戏类型,这个可以根据站点的tag标签调整 |
<developer><legalName>*</legalName></developer> | 开发商 |
<version>V2.4.0</version> | 版本号 |
<device>*</device> | 设备类型 |
</data> | |
</url> | |
</urlset> | |
<downloadUrl><![CDATA[ http://www.wowchina.com]]></downloadUrl> | 地址,有的话放上去,不是必填项 |
其他注意点:整个文档要字符串形式, 这种需要转义,自己注意。文件量太大的话用sitemapindex索引的xml。提交后很快能在百度站内搜索中看到结果。 这部分需要到样式自定义里面去把游戏样式调用出来。 2、通用模板样式
<?xml version=”1.0″ encoding=”UTF-8″?> | 备注 | |
<urlset> | ||
<url> | ||
<loc>http://ky.kaoyan.com/04/467393/</loc> | 着陆页 | |
<lastmod>2013-04-10</lastmod> | 更新时间 | |
<changefreq>always</changefreq> | 更新平率 | |
<priority>0.5</priority> | 重要值 | |
<data> | ||
<display> | ||
<title>【写给即将上战场的你们】努力为王,心态为皇</title> | 文章标题,建议用页面的title格式 | |
<content>略</content> | 可以全部提交正文,不用等蜘蛛来抓取了,注意把图片格式,链接格式全部去掉 | |
<tag>考研复习</tag><tag>经验</tag> | 根据tag标签 | |
<pubTime>2012-12-04T11:20:13</pubTime> | 发布时间 | |
<breadCrumb title=”考研加油站” url=”http://ky.kaoyan.com/”/> | 相当于面包屑的层级关系 | |
<breadCrumb title=”考研政治” url=”http://www.kaoyan.com/s/zhengzhi”/> | ||
<thumbnail loc=”http://docs.kaoyan.com/jpg/12/1204dde3cd949ccc.jpg”/> | 缩略图 | |
<image loc=”http://docs.kaoyan.com/jpg/12/12048543278e760d.jpg” title=”七个常用的泰勒展开式”/> | 文章的个图片,默认缺省的话会调用缩略图 | |
</display> | ||
</data> | ||
</url> | ||
</urlset> |
下图是通用模板的自定义结构化因子,可以增加展示整个通用模板里还有很多其他的信息。在其中还可以看到比如discount(折扣);price(价格)等影响的因素。有兴趣的可以去研究整个通用模板的数据结果,都包含在里面。 下图的面包屑的层级是用breadcrumb:title这个结构因子产生出来的。并且终还可以根据你的这些标签(比如price)进行排序。
说说重点的地方: 1、希望哪,这些提交的内容能在百度搜索引擎(不是自己的站内)结果展示上有一定的区别。
2、貌似阿拉丁百度开放平台里提交的数据和这个有些像,之后研究下,可以的话提交行业数据试试。
推荐阅读
百度站内搜索功能怎么用?用了有哪些好处?@steven | 文军营销整体按照这个思路来写这2篇文章:1、百度近期不断在推的这个站内搜索,做个简单的公告集合,有兴趣的大家可以自己去看细致的内容;2、一些简单的功能介绍和自己网站上的实例截图;3、站内搜索支持的结构化数据怎么处理(这个推荐有经验的人看) 所以篇抛个玉,讲讲大概“百度站内搜索”的基本情况,包含上面的1-2的两点...
说明:如果您有任何疑问或想咨询其他业务请拨打电话 400 685 0732