關鍵詞網址采集器
軟件介紹
輸入關鍵字采集各搜索引擎的網址、域名、標題、描述等信息
支持百度、搜狗、谷歌、必應、雅虎、360等。每個關鍵詞600到800條,采集例子
關鍵詞可以附帶搜索引擎參數,就跟網頁里輸入關鍵詞搜索一樣,
如百度里搜索結果網址中必須包含bbs的關鍵詞,則輸入“關鍵詞 inurl:bbs.”
保存模板可引用的數據:
#網址#采集的原始網址
#標題#網址對應的網頁標題
#域名#原始網址的域名部分,如“http://test.shuimiao.net/123.htm”中的“test.shuimiao.net”
#頂級域名#取原始網址的頂級域名部分,如“http://test.shuimiao.net/123.htm”中的“shuimiao.net”
#描述#網頁標題下面的一段描述文字
Excel導出:
csv是一種文本表格,能被Excel兼容顯示為多列多行的數據。只要在保存模板中設置為:
"#網址#","#標題#","#描述#"
這種格式就是csv格式,使用引號圍住每個項目,多個項目使用逗號隔開,然后保存擴展名填為csv即可
問題集錦:
1.為什么采集一段時間之后,無法采集?
這可能采集多了被搜索引擎限制。一般換個IP(如使用VPN換IP)即可繼續采集,如果不換,只能等待搜索引擎取消屏蔽之后才能繼續采集。百度的屏蔽時間通常半小時到數小時。
不過,現在即使出現驗證碼屏蔽,軟件也會彈出驗證碼手動輸入的(百度、谷歌)
2.不同批次關鍵詞采集的結果為什么會存在部分網址重復?
尤其是只引用了 #域名# 或 #頂級域名# 之后,這種部分網址重復的情況比較多。這也是正常的,因為每個網站的內頁可能包含很多主題,不同關鍵詞都可能采集到該網站的不同內頁,當引用域名后,相同網站的不同內頁的域名結果自然就相同了。
另外,軟件里的自動去重,是針對本次采集的結果內部進行去重,以前采集的結果是不在本次去重范圍的。如果兩次采集的結果存在部分網址重復,可以把他們合并一起,使用軟件去重(天線貓·文本去重打亂器)。
3.為什么采集回來的網址的主題與關鍵詞不符?
是因為引用了 #域名# 或 #頂級域名# 后,取的是域名部分,域名打開的是該網站的首頁,而采集的原網址可能不是首頁,而是該網站的某一篇文章的內頁,該內頁包含關鍵詞主題,因此被搜索引擎收錄,軟件才能采集得到。但取域名后,你打開的域名首頁就不一定包含該關鍵詞。
為了比對采集是否正確,可以在保存模板里輸入:<a href="#網址#" target="_blank">#標題#</a>
,保存為htm文件,采集完后可以自己打開該文件查看比對。
1.7.0.0:增加必應和雅虎采集;多項改動
1.7.1.0:將必應、雅虎、谷歌改為https請求以避免一些情況下的采集失敗問題。
1.7.2.0:增加百度新聞采集。
1.7.2.1:一些更新。
1.7.3.0:增加關鍵詞分割線選項。
1.7.4.0:修復百度最新變動無法采集的問題。
1.7.5.0:修復必應改動采集失效問題;修復某些電腦不能使用xmlhttps的問題(涉及谷歌、必應、雅虎)。
1.7.5.1:改進注冊機制,使用硬盤+網卡全識別模式(同時兼容舊版注冊碼),可解決部分情況重裝、換VPN所導致的機器碼變的問題;其他更新。
1.7.6.0:增加每頁采集數設置;引入新算法可以讓搜狗極速搜索永不被封(當然如果搜狗修改了算法可能會不行,屆時再說)。
1.8.0.0:增加#描述#項采集;增加搜狗延時時間避免搜狗最新規則限制。
1.8.1.0:修復雅虎采集失效問題
1.8.1.1:將每頁采集數的默認值設置為50,以應對百度變動問題;增加采集失敗的代碼顯示。
1.8.1.2:嘗試修復部分電腦取硬盤碼失敗的問題。
1.8.2.0:修復雅虎采集失效問題
1.8.3.0:修復百度新聞改動采集失敗的問題。
1.8.5.0:修復360在部分電腦返回不同網址格式導致采集失敗的問題。
1.8.6.0:修復谷歌變動采集失敗問題,并增加判斷谷歌驗證碼彈出由用戶手動解除再繼續采集的功能。
1.8.8.0:新增必應和谷歌的英文站搜索選項。
1.9.0.0:修復雅虎改動采集失敗問題;增加谷歌必應雅虎無等待高速采集選項;調整界面。
1.9.1.0:修改谷歌判斷驗證碼的方式以更準確捕獲驗證碼出現。
1.9.2.0:修復site百度時部分描述不能正確采集的問題。
1.9.3.0:修復描述的空格被清除的問題。
1.9.3.1:修復部分電腦上無法解析百度最新的https鏈接問題
1.9.5.0:修復因谷歌改動導致部分電腦取法采集谷歌的問題。
1.9.6.0:新增百度驗證碼彈出輸入
1.9.7.0:新增谷歌地址前綴指定,可自行設置能使用的谷歌域名。
1.9.7.1:更新谷歌地址前綴文件;修復部分系統異常導致百度采集錯誤的問題。
1.9.7.3:修復必應采集失敗問題。
1.9.8.0:修復谷歌因改動導致采集不全的問題。
1.9.8.1:增加谷歌英文驗證碼提示識別。
1.9.9.0:增加搜狗新聞引擎;嘗試修復百度部分電腦采集不了的問題;增加取頂級域名時不包括www選項;其他更新
1.9.11.0:增加搜狗驗證碼識別彈出
1.9.12.0:將百度http修改為https
1.9.13.0:修復百度改動導致百度鏈接轉換失敗問題
1.9.16.1:修復百度采集可能存在的一些問題
1.9.20.0:再修復百度采集在部分電腦上可能存在的一些問題
1.9.21.0:升級搜狗驗證碼新改動的識別彈出。
1.9.22.0:升級對360跳轉網址的識別轉換。
1.9.23.0:升級對百度知道跳轉網址的二次識別轉換。
1.9.25.0:如果沒有引用#網址#、#域名#時免去轉換百度網址的過程以節省時間。
1.9.26.0:增加#關鍵詞#引用。
1.10.0.0:增加#網頁關鍵詞#引用。
1.11.0.0:修復谷歌無法采集的問題(仍需翻墻);取消谷歌地址前綴,只能使用VPN翻墻的方式才能采集谷歌。
1.11.1.0:修復百度只采集標題且忽略自家網站時無法采集的問題。
-
天線貓關鍵詞網址采集器產品功能涵蓋關鍵詞搜索引擎標題采集軟件等.憑借專業的技術和售后隊伍,天線貓秉承“誠信、專業、創新、合作”的企業精神.天線貓描述采集愿與各位合作伙伴一起攜手并進,共創輝煌!
-
天線貓全自動文章采集軟件產品功能涵蓋萬能文章采集,文章采集程序插件等.憑借專業的技術和售后隊伍,天線貓一鍵文章采集秉承“誠信、專業、創新、合作”的企業精神.天線貓文章采集助手愿與各位合作伙伴一起攜手并進,共創輝煌!
-
-
天線貓電商評論采集器產品功能涵蓋淘寶評論采集軟件,天貓評論采集,蘇寧評論采集等.憑借專業的技術和售后隊伍,天線貓京東評論采集工具不斷推出新的適合潮流發展的采集器,提升服務水平,全年365天不間斷快速響應服務
-
天線貓淘寶數據包采集軟件產品功能涵蓋一鍵采集淘寶信息,淘寶關鍵字采集等.憑借專業的技術和售后隊伍,天線貓不斷推出新的適合潮流發展淘寶商品采集助手,提升服務水平,全年365天不間斷快速響應服務