以東方網(wǎng)為例,使用天線貓·萬能文章采集器
本教程所使用到的天線貓軟件有:萬能文章采集器
采集步驟:
1.首先,生成標(biāo)題列表的列表頁地址:
2.然后單篇采集一個(gè)列表頁以確定能采集到標(biāo)題列表(使用精確標(biāo)簽所有):
在列表頁復(fù)制到的第一個(gè)鏈接的代碼是:
<a href="http://news.eastday.com/c/20161105/u1a12249849.html" target="_blank" class="blue14">
這里可以簡化為 <a class="blue14"> 作為精確標(biāo)簽:
3.最后就是將全部的列表頁地址放到批量采集區(qū)里開始采集:
采集好之后,一個(gè)列表頁的標(biāo)題列表是保存一個(gè)文件的。
如果想要多個(gè)列表頁文件合并為一個(gè)文件,可以使用天線貓分割合并助手
如果您覺得 如何采集標(biāo)題列表 這篇文章對(duì)您有用,請(qǐng)分享給您的好友,謝謝
文章地址:http://www.meyanliao.com/course/1043.html
文章地址:http://www.meyanliao.com/course/1043.html