萬能文章采集器
-
軟件大小:
2.41MB
-
軟件編號:
3
-
軟件授權(quán):
免費(fèi)版
-
應(yīng)用平臺:
/Win8/Win7/WinXP
-
軟件等級:
-
官方主頁:
www.meyanliao.com
-
安全檢測:
-
軟件價(jià)格:
¥388 / 終身
天線貓軟件出品的一款萬能文章采集軟件,可以只需輸入關(guān)鍵字就能采集各種網(wǎng)頁和新聞,還可以采集指定列表頁(欄目頁)的文章。
注意:微信引擎限制嚴(yán)格,采集線程數(shù)請?jiān)O(shè)置為1個,否則非常容易出驗(yàn)證碼。
功能特點(diǎn):
1. 依托于天線貓軟件獨(dú)家萬能正文識別智能算法,可實(shí)現(xiàn)任何網(wǎng)頁正文自動提取準(zhǔn)確率95%以上。
2. 只需輸入關(guān)鍵詞,就能采集到微信文章、今日頭條、一點(diǎn)資訊、百度新聞和網(wǎng)頁、搜狗新聞和網(wǎng)頁、360新聞和網(wǎng)頁、谷歌新聞和網(wǎng)頁、必應(yīng)新聞和網(wǎng)頁、雅虎新聞和網(wǎng)頁;可批量關(guān)鍵詞全自動采集。
3. 可定向采集指定網(wǎng)站欄目列表下的所有文章(如百度經(jīng)驗(yàn)、百度貼吧),智能化匹配,無需編寫復(fù)雜規(guī)則。
4. 文章轉(zhuǎn)譯功能,可對采集好的文章,將其翻譯到英文再翻譯回中文,實(shí)現(xiàn)翻譯偽原創(chuàng),支持谷歌和有道翻譯。
5. 史上最簡單最智能文章采集器,更多特點(diǎn)一試就知!
2.9.0.0:全新增加正文過濾功能,可以屏蔽掉絕大多數(shù)不屬于正文的內(nèi)容;合并嚴(yán)格和標(biāo)準(zhǔn)的正文識別,并強(qiáng)化正文識別能力(現(xiàn)在識別的正文沒有再帶父層的p標(biāo)簽了,都是取內(nèi)部的代碼了);增強(qiáng)對部分特意偽裝的網(wǎng)站標(biāo)題的提取能力;其他更新。
2.9.1.0:采集文章URL,強(qiáng)化相對路徑的處理,比如../ 和 ../../ 等,經(jīng)過本版本強(qiáng)化處理后,相對路徑將完全轉(zhuǎn)化為絕對路徑,與瀏覽器中鼠標(biāo)移到鏈接上查看到的一致。
2.9.2.0:修復(fù)谷歌改動導(dǎo)致采集失敗的問題。
2.9.3.0:修復(fù)關(guān)鍵詞采集文章欄目選定精確標(biāo)簽時沒有彈出輸入的問題(前面版本造成);根據(jù)URL采集文章欄目新增刪除外層代碼可選選項(xiàng)(之前默認(rèn)啟用);調(diào)試模式更改為文章來源;疑點(diǎn)說明更新;其他。
2.9.5.0:修復(fù)微信采集失敗問題。
2.9.6.0:增強(qiáng)分頁采集識別能力。
2.9.7.0:新增谷歌地址前綴指定,可自行設(shè)置能使用的谷歌域名。
2.9.8.0:采集設(shè)置的正則替換支持使用<#sm#>隔開多個匹配和替換表達(dá)式。
2.9.9.0:增強(qiáng)正文識別能力,識別準(zhǔn)確度有所提升;增加對特殊編碼響應(yīng)的識別。
2.9.10.0:增加對二次加載圖片的新屬性“original”識別轉(zhuǎn)換。
2.9.11.0:外置文件更新谷歌翻譯使用的域名;修正谷歌tk參數(shù)變動翻譯失敗的問題。
2.10.0.0:修復(fù)部分情況因系統(tǒng)原因無法跳轉(zhuǎn)網(wǎng)址導(dǎo)致百度網(wǎng)頁無法采集的問題;新增自動去除網(wǎng)址的#后綴部分,該部分會導(dǎo)致網(wǎng)頁讀取錯誤;采集文章URL新增左邊和右邊插入選項(xiàng);修復(fù)前面版本導(dǎo)致的正文提取的過濾存在的一些問題;其他更新。
2.10.1.0:增強(qiáng)對部分采用<meta>跳轉(zhuǎn)的網(wǎng)頁識別。
2.10.2.0:增加標(biāo)題字?jǐn)?shù)限制為最多100字,以免字?jǐn)?shù)超長導(dǎo)致的一些問題;其他更新。
2.10.3.0:修復(fù)必應(yīng)新聞采集失敗問題;修復(fù)部分網(wǎng)頁的分頁格式錯誤導(dǎo)致重復(fù)采集的問題;更換網(wǎng)頁訪問方式(以前https使用WiniNet,http使用WinHttp,現(xiàn)在都用WinHttp);其他更新。
2.10.5.0:修復(fù)軟件對部分網(wǎng)頁跳轉(zhuǎn)代碼錯判而讀取失敗的問題;采集文章URL列表欄目的導(dǎo)入導(dǎo)出配置功能新增支持同步導(dǎo)入導(dǎo)出根據(jù)URL采集文章欄目的配置。
2.11.0.0:新增動態(tài)加載的列表頁URL的采集功能(如今日頭條toutiao.com);讀取網(wǎng)頁時增加USC2解碼(如新浪微博需要解碼才能采集);其他多項(xiàng)更新。
2.11.1.0:文章查看器的文件列表框改進(jìn)以便看全長標(biāo)題,并且如果讀取的文件數(shù)量不全,請?jiān)谇袚Q目錄讀取時按住Ctrl鍵即可增強(qiáng)讀取;采集文章URL列表的導(dǎo)入導(dǎo)出配置增加對生成列表頁URL和采集列表頁URL的配置同步功能(各窗口處于打開狀態(tài)才能同步配置)。
2.11.2.0:修復(fù)過濾正文功能遇到個別網(wǎng)頁的特殊代碼過濾不正常的問題。
2.11.3.0:修復(fù)部分DZ論壇自動識別錯誤的問題;修復(fù)刪除外層代碼時個別頁面自動識別錯誤的問題
2.11.3.1:修復(fù)class過濾的一個細(xì)節(jié)問題;默認(rèn)打勾刪除外層代碼
2.12.0.0:增強(qiáng)分頁采集對分頁的識別能力(尤其是圖片類的分頁);生成列表頁功能新增支持倒序生成
2.12.1.0:新增采集列表頁的文章URL時支持POST方法
2.13.0.0:文章保存格式全新增加txt帶圖片排版;新增圖片二次加載的新屬性識別 data-original;文章來源改為在文章末尾追加;新增智能忽略版權(quán)信息被識別為正文;調(diào)整界面組件位置;其他更新。
2.13.1.0:修復(fù)xp系統(tǒng)不能采集淘寶網(wǎng)頁的問題;修復(fù)//類型鏈接轉(zhuǎn)換錯誤問題;更新谷歌地址前綴文件。
2.13.2.0:修復(fù)txt格式保存時沒有自動轉(zhuǎn)換網(wǎng)頁轉(zhuǎn)義符的問題
2.13.3.0:新增【優(yōu)先標(biāo)題標(biāo)簽.txt】外部配置文件以解決一些混亂網(wǎng)頁識別標(biāo)題錯誤的問題
2.13.8.0:【采集文章URL列表】新增ContentType自定義設(shè)置支持以解決有些網(wǎng)頁之需(該設(shè)置位于【采集列表頁URL】);新增【指定標(biāo)題位置.txt】外部配置文件,自動識別不了標(biāo)題時能手動指定標(biāo)題的開始和結(jié)束標(biāo)記;搜狗修改為每頁10個網(wǎng)址采集,并新增搜狗驗(yàn)證碼識別彈出;其他更新。
2.13.9.0:修復(fù)關(guān)鍵詞采集完全無結(jié)果時陷入死循環(huán)的問題。
2.13.10.0:采集列表頁URL功能新增高級參數(shù)(兩個值用空格隔開,如果值1空白自動使用值2)。
2.15.0.0:URL采集文章面板的精確標(biāo)簽新增模糊匹配功能;新增計(jì)劃任務(wù)功能,可以設(shè)定多個時間點(diǎn),到點(diǎn)自動開始采集(當(dāng)前被顯示面板的開始采集)。
2.15.1.0:修復(fù)微信采集失敗問題。
2.15.2.0:修復(fù)360網(wǎng)頁和新聞的部分問題。
2.15.3.0:搜索引擎讀取增加超時50秒設(shè)置;嘗試修復(fù)部分情況下關(guān)鍵詞采集崩潰的問題。
2.15.5.0:采集文章URL列表,新增來路設(shè)置;更新谷歌鏡像地址。
2.15.8.0:修復(fù)百度網(wǎng)頁搜索時間設(shè)置失效問題并取消百度新聞時間設(shè)置(已不支持);微信采集時增加正文最少字?jǐn)?shù)的設(shè)置支持(原先只有自動識別的可以設(shè)置字?jǐn)?shù),而微信是內(nèi)置精確標(biāo)簽的所以不能設(shè)置字?jǐn)?shù),現(xiàn)在可以了);【文章查看】切換顯示時增加自動刷新目錄樹;關(guān)鍵詞采集正文字?jǐn)?shù)不足時補(bǔ)充提示設(shè)置的字?jǐn)?shù)值
2.15.9.0:修復(fù)360新聞采集失敗問題。
2.15.10.0:修復(fù)微信采集失敗問題。
2.15.11.0:因有道翻譯失效且無法更新,故新增百度翻譯;其他更新
2.16.0.0:關(guān)鍵字采集文章新增今日頭條、一點(diǎn)資訊等自媒體平臺
2.16.1.0:修復(fù)上次升級導(dǎo)致的采集分頁功能異常
2.16.2.0:修復(fù)今日頭條圖片鏈接問題;微信增加登錄采集。
2.16.3.0:修復(fù)設(shè)置采集篇數(shù)時容易出現(xiàn)無法繼續(xù)采集下一個關(guān)鍵詞的問題。
2.17.0.0:修復(fù)谷歌無法采集的問題(仍需翻墻);修復(fù)百度轉(zhuǎn)譯失效問題(更改為搜狗轉(zhuǎn)譯,翻譯效果最好的人工智能翻譯引擎)。
2.17.1.0:對今日頭條增加了嘗試次數(shù),并且自動線程為1,以避免被限制
2.17.1.1:嘗試修復(fù)關(guān)鍵詞采集出現(xiàn)的數(shù)組錯誤問題
2.17.2.0:修復(fù)上次升級導(dǎo)致的采集錯誤
-
天線貓電商評論采集器產(chǎn)品功能涵蓋淘寶評論采集軟件,天貓?jiān)u論采集,蘇寧評論采集等.憑借專業(yè)的技術(shù)和售后隊(duì)伍,天線貓京東評論采集工具不斷推出新的適合潮流發(fā)展的采集器,提升服務(wù)水平,全年365天不間斷快速響應(yīng)服務(wù)
-
天線貓新浪微博數(shù)據(jù)采集產(chǎn)品功能涵蓋新浪微博內(nèi)容采集助手.憑借專業(yè)的技術(shù)和售后隊(duì)伍,天線貓新浪微博信息采集器不斷推出新的適合潮流發(fā)展新浪微博信息采集器 ,提升服務(wù)水平,全年365天不間斷快速響應(yīng)服務(wù)
-
天線貓網(wǎng)絡(luò)圖片采集器產(chǎn)品功能涵蓋采集圖片工具,網(wǎng)站圖片采集軟件,圖片采集程序,采集工具圖片等.憑借專業(yè)的技術(shù)和售后隊(duì)伍,天線貓圖片采集軟件秉承“誠信、專業(yè)、創(chuàng)新、合作”的企業(yè)精神.天線貓圖片采集器愿與各位合作伙伴一起攜手并進(jìn),共創(chuàng)輝煌!
-
天線貓關(guān)鍵詞網(wǎng)址采集器產(chǎn)品功能涵蓋關(guān)鍵詞搜索引擎標(biāo)題采集軟件等.憑借專業(yè)的技術(shù)和售后隊(duì)伍,天線貓秉承“誠信、專業(yè)、創(chuàng)新、合作”的企業(yè)精神.天線貓描述采集愿與各位合作伙伴一起攜手并進(jìn),共創(chuàng)輝煌!
-
天線貓京東商品采集器,京東商城信息采集,京東商品信息采集產(chǎn)品功能涵蓋等.憑借專業(yè)的技術(shù)和售后隊(duì)伍,天線貓秉承“誠信、專業(yè)、創(chuàng)新、合作”的企業(yè)精神.天線貓?jiān)概c各位合作伙伴一起攜手并進(jìn),共創(chuàng)輝煌!