说明:如果您有任何疑问或想咨询其他业务请拨打电话 400 685 0732
全网监测海量数据按需发布监测预警
实时把握舆情动态精准追溯信息源头
一个大型的资讯网站在发表文章时,如果是一条条的文章网上发,这不仅浪费时间,效率还不高,这时为了提高更新网站的效率,就出现了火车头采集器,可是火车头采集规则怎么写呢?接下来就由小编来详细的介绍吧。
火车头采集规则写法介绍
步骤一:新建一个文章采集节点
登录后台,依次点击 采集>>采集节点管理>>增加新节点>>选择普通文章>>确定
步骤二 :填写采集列表规则
1.节点名称:随便(注意你要能分清哦,因为节点多了的话,有可能会搞得自己混乱)
2.目标页面编码:看目标页面的编码
3.匹配网址:去到采集目标列表页面,查看它的列表规则!比如说很多网站的列表的第一面跟其它内页是有很大的差别的,所以我一般不采集目标列表的第一页!
最好是从第二页开始(虽然可以找出第一页,但很多的网站是根本没第一页的,所以,这里就不说怎么找第一页了)
4.区域结束的HTML:在采集目标列表页打开源代码!在要采集的文章标题后面的附近找一段在本页是唯一并且其它要采集的的页面也是唯一的html标签!
写好了,点击保存信息并进入下一步!如果写正确了规则的话,那这些就会出现一个有内容的网址获取规则测试
再按下一步!进入填写采集内容规则
步骤三:采集内容规则
1.文章标题:在文章标题前后找两个标签,能识别出标题的!
2.文章内容:在文章内容前后找两个标签,能识别出内容的!我采集的网站的文章内容前后唯一标签是<div class=”content”>…<ul class=”page clearfix”>,所以就写成<div class=”content”>[内容]<ul class=”page clearfix”>!
其它的功能,也不用管!这里只分享怎么能采到文章!然后,点击保存配置并预览,如果前面的列表规则跟内容规则都写对了的话,那现在就会预览到内容了!
点击仅保存,如果你要马上采集的话,也可以点击隔壁的保存并马上采集!
火车头采集规则导入方法
1.导入规则方法一
右键点击刚才新建的分组,选择“导入任务至该分组”(记住:不是“导入分组规则”),在弹出的对话框中选择已经采集规则文件(后缀为.ljobx)。
2.导入规则方法二
也可以选择刚才新建的分组,然后依次点击菜单“分组”->“导入任务至该分组” 在弹出的对话框中选择已经采集规则文件(后缀为.ljobx)。
3.导入分组规则
如果你手上的规则文件后缀名为“.lgrp”,那么你需要通过菜单或右键快捷菜单选择“导入分组规则”,而不是“导入任务至该分组”。
好了,有关火车头采集规则写法就介绍到这里了,当然想要掌握这个写法的可不是马上就能完成的事情,是需要在不断的实践中去掌握和运用的,所以想要掌握格则写法的,现在就开始练习吧。如果想了解更多的内容,欢迎关注我们文军营销的官网。
推荐阅读
火车头采集规则写法介绍 火车头采集规则如何导入? | 文军营销点击仅保存,如果你要马上采集的话,也可以点击隔壁的保存并马上采集! 火车头采集规则导入方法 1.导入规则方法一 右键点击刚才新建的分组,选择“导入任务至该分组”(记住:不是“导入分组规则”),在弹出的对话框中选择已经采集规则文件(后缀为.ljobx)。 2.导入规则方法二 也可以选择刚才新建的分组,然后依次点击菜单“...火车头采集器教程步骤 火车头采集器使用教程介绍 | 文军营销1点击右下角的“网址采集测试”, 2测试后,如果网址是这么显示出来的,那就是采集成功了。点击其中一个网址左边的“+”符号,可以看到该栏目页面采集到的内容。 火车头采集器教程之数据采集步骤 火车采集器采集数据是分成两个步骤的,一是采集数据,二是发布数据。这两个过程是可以分开的。 1、采集数据,这个包括采集...火车头采集图片方法 火车头采集图片步骤是什么 | 文军营销言归正传,火车头使用的步骤是:新建站点—新建任务—填写你要采集的网站文章列表—点下面的开始测试网址—如果有采集到很多文章,看各个地址相同部分(如system/2012/03/07),点返回修改,把system/2012/03/07这部分加到“文章内容必须包含”那里,再测试一下,就可以采集到3月7日的文章地址了—前面准备好网址后接下来...火车头采集器视频教程大全 火车头采集器v9使用视频教程 | 文军营销好好填写任务列表的规则。下面教大家如何填写 END 火车头采集器教程步骤(4)填写采集列表页的规则 1 找到顶头的“起始网址”,可先不填。可以在右边点击”向导添加”里面填写,如图: 2 点击“批量网址”,如下图: 3 (1)在“地址格式”空白栏里,复制想要采集的列表栏目网址 ,(先去对方网站某个栏目看 ...火车头采集器 火车头采集器是什么 | 文军营销火车头采集器的四种保存方法 方式一:Web在线发布到网站 这种发布方式类似于在网站后台手工添加数据一样。采集器将数据发送给网站后台程序,由网站后台程序去处理数据通常后台程序讲数据存入网站数据库中。 方式二:保存为本地文件 这种方式可以将采集的数据发布到本地的文件中,采集器支持保存成Txt格式、Csv格式和Html格式...
说明:如果您有任何疑问或想咨询其他业务请拨打电话 400 685 0732