说明:如果您有任何疑问或想咨询其他业务请拨打电话 400 685 0732
全网监测海量数据按需发布监测预警
实时把握舆情动态精准追溯信息源头
接着上文,一般在站内优化的过程中,sitemap的位置都是直接放在网站的根服务器下的。例如 http://www.example.com/sitemap.xml下的sitemap不可包含來自 http://subdomain.example.com 的 URL。但如果使用的是端口的路径,也需要把端口的号作为路径中的一部分,包含在所有的sitemap的各个URL路径中,比如如果网站是http://www.example.com:100/,则sitemap列明的URL则都必须以具有100端口号的URL为开头。
在一定的情况下,某些公司因为更新权限等策略的问题,也许给操作人员一定的目录层级下的权限。比如说,如果我有权限变更http://example.com/path/的URL资讯,而这个时候的sitemap也位于http://example.com/path/sitemap.xml下。在其中被归纳为有效的URL应该类似于http://example.com/path/show?item=23,http://example.com/path/show?item=233&user=3453等,其中无效的举例为:http://example.com/image/show?item=23(跨目录),https://example.com/catalog/page1.html(https://通讯协议不标准)。
交叉提交
交叉提交的意义在什么地方,搜索了一下,对于为什么要这么做的技术文档十分少,查阅到可信服的:当一个站点的二级域名数量达到一个相当大的值的时候,不可能为每一个站点去做sitemap提交的,验证每一个站点的所有权,所以有意义用到交叉提交了。这一点和我猜想的差不多,是便于管理,而现在的百度站长平台不是每一个验证的站点都能做sitemap提交的,目前这个功能还不对所有的站点都开放。所以可以用有提交权限的站点做这件事情了,HOHO。
比如说手上有3个站点,一个主站,两个二级域名,分别的域名和对应的sitemap文件名为:
www.mainhost.com,Sitemap 文件 sitemap-mainhost.xml
www.host1.com,Sitemap 文件sitemap-host1.xml
www.host2.com,Sitemap 文件sitemap-host2.xml
将所有的sitemap放在拥有提交权限的站点下,即:
http://www.mainhost.com/sitemap-mainhost.xml
http://www.mainhost.com/sitemap-host1.xml
http://www.mainhost.com/sitemap-host2.xml
然后通过修改www.host1.com和www.host2.com的robots.txt文档,将其指向www.mainhost.com中的sitemap,可以间接证明拥有这2个站点的所有权。这个时候可以通过主站提交所有的sitemap了。
让搜索引擎知道我们的sitemap
3种方式,前2种是我们现在常用的。种是大家耳熟能详的站长工具的提交页面提交sitemap,第二种是robot.txt中指定位置,为此,添加下列行:Sitemap: http://www.example.com/sitemap.xml。此指令不受 user-agent 行的影响,因此可放在文件中的任意位置,不过一般我们放在末尾,没什么讲究。
种用HTTP请求的方式,要和服务器的知识有些关联,我也不会,所以不赘述,直接粘贴过来,有兴趣的请自己研究。
通过 HTTP 请求提交 Sitemap
要使用 HTTP 请求提交 Sitemap(使用搜索引擎提供的网址替换 <searchengine_URL>),请将请求发送到下列网址:
<searchengine_URL>/ping?sitemap=sitemap_url
例如,如果 Sitemap 位于http://www.example.com/sitemap.gz,则网址将变为:
<searchengine_URL>/ping?sitemap=http://www.example.com/sitemap.gz
网址编码 /ping?sitemap=: 之后的所有内容
<searchengine_URL>/ping?sitemap=http%3A%2F%2Fwww.yoursite.com%2Fsitemap.gz
您可以使用 wget、curl 或其他您选择的机制发出 HTTP 请求。请求成功的话会返回 HTTP 200 回应代码;如果收到其他回应,则应重新提交请求。HTTP 200 回应代码仅表示搜索引擎已收到您的 Sitemap,并不表示 Sitemap 本身或其中包含的网址有效。完成此操作的简单方法是设置自动执行的任务,定期生成并提交 Sitemap。
说明:如果您有任何疑问或想咨询其他业务请拨打电话 400 685 0732