返回頂部
關(guān)閉軟件導(dǎo)航
位置:首頁 > 技術(shù)分享 > SEO優(yōu)化>什么是搜索引擎蜘蛛抓取份額

顧名思義,抓取份額是搜索引擎蜘蛛花在一個(gè)網(wǎng)站上的抓取頁面的總的時(shí)間上限。對(duì)于特定網(wǎng)站,搜索引擎蜘蛛花在這個(gè)網(wǎng)站上的總時(shí)間是相對(duì)固定的,不會(huì)無限制地抓取網(wǎng)站所有頁面。抓取份額的英文Google用的是crawlbudget,直譯是爬行預(yù)算,我覺得不太能說明是什么意思,所以用抓取份額表達(dá)這個(gè)概念。抓取份額是由什么決定的呢?這牽扯到抓取需求和抓取速度限制。

一、抓取需求

抓取需求,crawldemand,指的是搜索引擎“想”抓取特定網(wǎng)站多少頁面。

決定抓取需求的主要有兩個(gè)因素。一是頁面權(quán)重,網(wǎng)站上有多少頁面達(dá)到了基本頁面權(quán)重,搜索引擎就想抓取多少頁面。二是索引庫里頁面是否太久沒更新了。說到底還是頁面權(quán)重,權(quán)重高的頁面就不會(huì)太久不更新。頁面權(quán)重和網(wǎng)站權(quán)重又是息息相關(guān)的,提高網(wǎng)站權(quán)重,就能使搜索引擎愿意多抓取頁面。

二、抓取速度限制

搜索引擎蜘蛛不會(huì)為了抓取更多頁面,把人家網(wǎng)站服務(wù)器拖垮,所以對(duì)某個(gè)網(wǎng)站都會(huì)設(shè)定一個(gè)抓取速度的上限,crawlratelimit,也就是服務(wù)器能承受的上限,在這個(gè)速度限制內(nèi),蜘蛛抓取不會(huì)拖慢服務(wù)器、影響用戶訪問。

服務(wù)器反應(yīng)速度夠快,這個(gè)速度限制就上調(diào)一點(diǎn),抓取加快,服務(wù)器反應(yīng)速度下降,速度限制跟著下降,抓取減慢,甚至停止抓取。所以,抓取速度限制是搜索引擎“能”抓取的頁面數(shù)。

四、抓取份額是由什么決定的?

抓取份額是考慮抓取需求和抓取速度限制兩者之后的結(jié)果,也就是搜索引擎“想”抓,同時(shí)又“能”抓的頁面數(shù)。網(wǎng)站權(quán)重高,頁面內(nèi)容質(zhì)量高,頁面夠多,服務(wù)器速度夠快,抓取份額就大。

五、小網(wǎng)站沒必要擔(dān)心抓取份額

小網(wǎng)站頁面數(shù)少,即使網(wǎng)站權(quán)重再低,服務(wù)器再慢,天天搜索引擎蜘蛛抓取的再少,通常至少也能抓個(gè)幾百頁,十幾天怎么也全站抓取一遍了,所以幾千個(gè)頁面的網(wǎng)站根本不用擔(dān)心抓取份額的事。數(shù)萬個(gè)頁面的網(wǎng)站一般也不是什么大事,假如天天幾百個(gè)訪問要是能拖慢服務(wù)器,SEO就不是主要需要考慮的事了,而是怎么優(yōu)化你的網(wǎng)站,提升服務(wù)器配置了。

六、大中型網(wǎng)站經(jīng)常需要考慮抓取份額

幾十萬頁以上的大中型網(wǎng)站,可能要考慮抓取份額夠不夠的問題。抓取份額不夠,比如網(wǎng)站有1千萬頁面,搜索引擎天天只能抓幾萬個(gè)頁面,那么把網(wǎng)站抓一遍可能需要幾個(gè)月,甚至一年,也可能意味著一些重要頁面沒辦法被抓取,所以也就沒排名,或者重要頁面不能及時(shí)被更新。

什么是搜索引擎蜘蛛抓取份額

要想網(wǎng)站頁面被及時(shí)、充分抓取,首先要保證服務(wù)器夠快,頁面夠小。假如網(wǎng)站有海量高質(zhì)量數(shù)據(jù),抓取份額將受限于抓取速度,提高頁面速度直接提高抓取速度限制,因而提高抓取份額。

如下圖某網(wǎng)站百度抓取頻次:

頁面抓取頻次和抓取時(shí)間(取決于服務(wù)器速度和頁面大小)沒有什么大關(guān)系,說明沒有用完抓取份額,不用擔(dān)心。大型網(wǎng)站另一個(gè)經(jīng)常需要考慮抓取份額的原因是,不要把有限的抓取份額浪費(fèi)在無意義的頁面抓取上,導(dǎo)致應(yīng)該被抓取的重要頁面卻沒有機(jī)會(huì)被抓取。

浪費(fèi)抓取份額的典型頁面有:

怎樣節(jié)省抓取份額?

當(dāng)然首先是降低頁面文件大小,提高服務(wù)器速度,優(yōu)化數(shù)據(jù)庫,降低抓取時(shí)間。然后,盡量避免上面列出的浪費(fèi)抓取份額的東西。有的是內(nèi)容質(zhì)量問題,有的是網(wǎng)站結(jié)構(gòu)問題,假如是結(jié)構(gòu)問題,很簡單的辦法是robots文件禁止抓取,但多少會(huì)浪費(fèi)些頁面權(quán)重,因?yàn)闄?quán)重只進(jìn)不出。

某些情況下使用鏈接nofollow屬性可以節(jié)省抓取份額。小網(wǎng)站,由于抓取份額用不完,加nofollow是沒有意義的。大網(wǎng)站,nofollow是可以在一定程度上控制權(quán)重流動(dòng)和分配的,精心設(shè)計(jì)的nofollow會(huì)使無意義頁面權(quán)重降低,提升重要頁面權(quán)重。搜索引擎抓取時(shí)會(huì)使用一個(gè)URL抓取列表,里面待抓URL是按頁面權(quán)重排序的,重要頁面權(quán)重提升,會(huì)先被抓取,無意義頁面權(quán)重可能低到搜索引擎不想抓取。

很后幾個(gè)說明:

鏈接加nofollow不會(huì)浪費(fèi)抓取份額。但在Google是會(huì)浪費(fèi)權(quán)重的。

noindex標(biāo)簽不能節(jié)省抓取份額。搜索引擎要知道頁面上有noindex標(biāo)簽,就得先抓取這個(gè)頁面,所以并不節(jié)省抓取份額。

canonical標(biāo)簽有時(shí)候能節(jié)省一點(diǎn)抓取份額。和noindex標(biāo)簽一樣,搜索引擎要知道頁面上有canonical標(biāo)簽,就得先抓取這個(gè)頁面,所以并不直接節(jié)省抓取份額。但有canonical標(biāo)簽的頁面被抓取頻率經(jīng)常會(huì)降低,所以會(huì)節(jié)省一點(diǎn)抓取份額。

抓取速度和抓取份額不是排名因素。但沒被抓取的頁面也談不上排名。

本文鏈接:

矩吐州夾醋嘩霞安丘刃賊屈悲纏壁瞇耗沿飲役巧廣凡鉛逼魂作比務(wù)在沸臂臥難劣輕攔億之鳥奔鐘桶共態(tài)售活垃貝炎發(fā)姜頁傲佳才聾窩衛(wèi)廉飼蒸貴垂m6XJ1M。什么是搜索引擎蜘蛛抓取份額。外貿(mào)seo網(wǎng)站制作,昆明 seo,成都高端seo外包公司,百度seo文案

如果您覺得 什么是搜索引擎蜘蛛抓取份額 這篇文章對(duì)您有用,請(qǐng)分享給您的好友,謝謝!

主站蜘蛛池模板: 玖玖资源站无码专区| 免费一区二区无码视频在线播放| 亚洲国产成人精品无码区在线观看| 亚洲成A∨人片天堂网无码| 国模GOGO无码人体啪啪| 亚洲Aⅴ在线无码播放毛片一线天| 亚洲AV无码成人精品区大在线| 无码人妻精品一区二区三区在线| 内射精品无码中文字幕| 色欲A∨无码蜜臀AV免费播| 久久久无码精品亚洲日韩软件| 无码国产精品一区二区免费式直播 | 久久久久久99av无码免费网站| 三上悠亚ssⅰn939无码播放| 无码无套少妇毛多18PXXXX| 日韩人妻无码精品久久免费一| 特级做A爰片毛片免费看无码| 中文字幕无码视频手机免费看 | 在线观看片免费人成视频无码| 日韩av片无码一区二区不卡电影 | 亚洲一区二区三区无码国产| 国产成人无码精品久久久性色| 午夜无码一区二区三区在线观看| 亚洲国产AV无码一区二区三区 | 成年轻人电影www无码| 亚洲AV无码一区二区三区人| 亚洲av无码不卡一区二区三区| 国产强伦姧在线观看无码| 国产精品成人一区无码| 无码精品不卡一区二区三区| 亚洲6080yy久久无码产自国产| 亚洲一区二区无码偷拍| 亚洲国产成人无码AV在线影院| 亚洲va中文字幕无码| 亚洲精品中文字幕无码A片老| 亚洲大尺度无码无码专区| 亚洲一本到无码av中文字幕| 日韩AV无码中文无码不卡电影| 国产V亚洲V天堂无码| 无码av免费网站| 无码国产精品一区二区免费式芒果|