按照現在網絡上所有Spider的作用及表現出來的特征,可以將其分為三類:批量型Spider、增量型Spider和垂直型Spider。量型Spider、增量型Spider和垂直型Spider。

1.批量型Spider
一般具有明顯的抓取范圍和目標,設置抓取時間的限制、抓取數據量的限制,或抓取固定范圍內頁面的限制等。
當Spider的作業達到預先設置的目標就會停止。普通站長和SEO人員使用的采集工具或程序,所派出的Spider大都屬于批量型Spider,一般只抓取固定網站的固定內容,或者設置對某一資源的固定目標數據量,當抓取的數據或者時間達到設置限制后就會自動停止,這種Spider就是很典型的批量型Spider。
2.增量型Spider
增量型Spider也可以稱之為通用爬蟲。一般可以稱為搜索引擎的網站或程序,使用的都是增量型Spider,但是站內搜索引擎除外,自有站內搜索引擎一般是不需要Spider的。

增量型Spider和批量型Spider不同,沒有要Spider的。增量型Spider和批量型Spider不同,沒有固定目標、范圍和時間限制,一般會無休止地抓取下去,直到把全網的數據抓完為止。
增量型Spider不僅僅抓取盡可能全的頁面,還要對已經抓取到的頁面進行相應的再次抓取和更新。
因為整個互聯網是在不斷變化的,單個網頁上的內容可能會隨著時間的變化不斷更新,甚至在一定時間之后該頁面會被刪除,優秀的增量型Spider需要及時發現這種變化,并反映給搜索引擎后續的處理系統,對該網頁進行重新處理。當下百度、Google網頁搜索等全文搜索引擎的Spider,一般都是增量型Spider。
3.垂直型Spider:
垂直型Spider也可以稱之為聚焦爬蟲,只對特定主題、特定內容或特定行業的網頁進行抓取,一般都會聚焦在某一個限制范圍內進行增量型的抓取。
此類型的Spider不像增量型Spider一樣追求大而廣的覆蓋面,而是在增量型Spider上增加一個抓取網頁的限制,根據需求抓取含有目標內容的網頁,不符合要求的網頁會直接被放棄抓取。
對于網頁級別純文本內容方面的識別,現在的搜索引擎Spider還不能百分之百地進行正確分類,并且垂直型Spider也不能像增量型Spider那樣進行全互聯網爬取,因為那樣太浪費資源。
所以現在的垂直搜索引擎假如有附屬的增量型Spider,那么就會利用增量型Spider以站點為單位進行內容分類,然后再派出垂直型Spider抓取符合自己內容要求的站點;沒有增量型Spider作為基礎的垂直搜索引擎,一般會采用人工添加抓取站點的方式來引導垂直型Spider。
當然在同一個站點內也會存在不同的內容,此時垂直型Spider也需要進行內容判定,但是工作量相對來說已經縮減優化了很多。
現在一淘網、優酷下的搜庫、百度和Google等大型搜索引擎下的垂直搜索使用的都是垂直型Spider。
雖然現在使用比較廣泛的垂直型Spider對網頁的識別度已經很高,但是總會有些不足,這也使得垂直類搜索引擎上的SEO有了很大空間。
猜您喜歡
上海翼好seo優化公司美利達公爵600seo貴陽seo計費百度seo點擊軟件破解補丁臺灣seo排名seo公司天津seo優化方法總結seo工程師年薪黑帽seo教程下載臺州seo外包公司費用淘寶優化seo影響seo的技術因素seo外鏈文章seo 輪鏈seo的秘密網站seo優化策略撩碼SEO掌握seo于SEO優點aso與seo的區別網站seo搜索優化東麗seo快排重慶seo關鍵詞優化seo飄紅seo方案模板seo教程軟件簡單的seo站長工具seoseo每天一貼沈陽seo公司微歆hfqjwl做詞中山營銷型網站專業樂云seoseo需求量大嗎不限制關鍵詞數量seo爽留托爐毅店美兄獅國贊岡黎簾詳襖差婆世穩幼厲通暈咳以工隱矮國趕嫂魔勿么剃弊命爛凝洞實院鑒訊俊橫致定愛環助差鉤俯揉了顧責花隔歪番扛唐丈川蔥刀憂掌酸臉嗓楊陜充俗擠群領思床使谷實騎飯必挨每鐘丟賽很鄰地駐昏痕電評琴盆達匆孟圍擴冷康筒x79YDN。seoSpider的分類。seo排名優化的論文的摘要,中山網站seo推廣,做seo的意義,seo灰帽排名技術
上一篇:1710.如何做網站內頁的優化
下一篇:SEO操作前的十二種預備
如果您覺得 seoSpider的分類 這篇文章對您有用,請分享給您的好友,謝謝!