返回頂部
關閉軟件導航
位置:首頁 > 技術分享 > SEO優化>關于搜索引擎蜘蛛的seo基礎內容解析

大寶seo博客上線有一年多的時間了,也和朋友們分享了很多關于seo基礎知識方面的內容,今天卻發現沒有和朋友們分享關于搜索引擎蜘蛛這樣一個重要的基礎概念,這一概念雖然對seo優化操作沒有很直接的關系,但是通過對蜘蛛的熟悉和理解,我們可以在進行seo方案的實施過程中更加知道怎樣來應對搜索引擎的抓取和收錄方面的問題。

今天這篇內容的主題來源于百度站長平臺的一篇關于百度spider的介紹,正文部分如下:

1.什么是Baiduspider

Baiduspider是百度搜索引擎的一個自動程序,它的作用是訪問互聯網上的網頁,建立索引數據庫,使用戶能在百度搜索引擎中搜索到您網站上的網頁。

2.Baiduspider的user-agent是什么?

百度各個產品使用不同的user-agent:

產品名稱對應user-agent

網頁搜索?Baiduspider

無線搜索?Baiduspider

圖片搜索?Baiduspider-image

視頻搜索?Baiduspider-video

新聞搜索?Baiduspider-news

百度搜藏?Baiduspider-favo

百度聯盟?Baiduspider-cpro

商務搜索?Baiduspider-ads

3.Baiduspider對一個網站服務器造成的訪問壓力如何?

為了達到對目標資源較好的檢索效果,Baiduspider需要對您的網站保持一定量的抓取。我們盡量不給網站帶來不合理的負擔,并會根據服務器承受能力,網站質量,網站更新等綜合因素來進行調整。假如您覺得baiduspider的訪問行為有任何不合理的情況,您可以反饋至反饋中心。

4.為什么Baiduspider不停的抓取我的網站?

對于您網站上新產生的或者持續更新的頁面,Baiduspider會持續抓取。此外,您也可以檢查網站訪問日志中Baiduspider的訪問是否正常,以防止有人惡意冒充Baiduspider來頻繁抓取您的網站。假如您發現Baiduspider非正常抓取您的網站,請通過反饋中心反饋給我們,并請盡量給出Baiduspider對貴站的訪問日志,以便于我們跟蹤處理。

5.如何判定是否冒充Baiduspider的抓取?

建議您使用DNS反查方式來確定抓取來源的ip是否屬于百度,根據平臺不同驗證方法不同,如linux/windows/os三種平臺下的驗證方法分別如下:

5.1在linux平臺下,您可以使用hostip命令反解ip來判定是否來自Baiduspider的抓取。Baiduspider的hostname以*.baidu.com或*.baidu.jp的格式命名,非*.baidu.com或*.baidu.jp即為冒充。

$host123.125.66.120

120.66.125.123.in-addr.arpadomainnamepointer

baiduspider-123-125-66-120.crawl.baidu.com.

host119.63.195.254

254.195.63.119.in-addr.arpadomainnamepointer

BaiduMobaider-119-63-195-254.crawl.baidu.jp.

5.2在windows平臺或者IBMOS/2平臺下,您可以使用nslookupip命令反解ip來判定是否來自Baiduspider的抓取。打開命令處理器輸入nslookupxxx.xxx.xxx.xxx(IP地址)就能解析ip,來判定是否來自Baiduspider的抓取,Baiduspider的hostname以*.baidu.com或*.baidu.jp的格式命名,非*.baidu.com或*.baidu.jp即為冒充。

5.3在macos平臺下,您可以使用dig命令反解ip來判定是否來自Baiduspider的抓取。打開命令處理器輸入digxxx.xxx.xxx.xxx(IP地址)就能解析ip,來判定是否來自Baiduspider的抓取,Baiduspider的hostname以*.baidu.com或*.baidu.jp的格式命名,非*.baidu.com或*.baidu.jp即為冒充。

6.我不想我的網站被Baiduspider訪問,我該怎么做?

Baiduspider遵守互聯網robots協議。您可以利用robots.txt文件完全禁止Baiduspider訪問您的網站,或者禁止Baiduspider訪問您網站上的部分文件。注重:禁止Baiduspider訪問您的網站,將使您的網站上的網頁,在百度搜索引擎以及所有百度提供搜索引擎服務的搜索引擎中無法被搜索到。

您可以根據各產品不同的user-agent設置不同的抓取規則,假如您想完全禁止百度所有的產品收錄,可以直接對Baiduspider設置禁止抓取。

以下robots實現禁止所有來自百度的抓取:

User-agent:Baiduspider

Disallow:/

以下robots實現禁止所有來自百度的抓取但答應圖片搜索抓取/image/目錄:

User-agent:Baiduspider

Disallow:/

User-agent:Baiduspider-image

Allow:/image/

請注重:Baiduspider-cpro抓取的網頁并不會建入索引,只是執行與客戶約定的操作,所以不遵守robots協議,假如Baiduspider-cpro給您造成了困擾,請聯系。

Baiduspider-ads抓取的網頁并不會建入索引,只是執行與客戶約定的操作,所以不遵守robots協議,假如Baiduspider-ads給您造成了困擾,請聯系您的客戶服務專員。

7.為什么我的網站已經加了robots.txt,還能在百度搜索出來?

因為搜索引擎索引數據庫的更新需要時間。雖然Baiduspider已經停止訪問您網站上的網頁,但百度搜索引擎數據庫中已經建立的網頁索引信息,可能需要數月時間才會清除。另外也請檢查您的robots配置是否正確。

假如您的拒絕被收錄需求非常急迫,也可以通過反饋中心反饋請求處理。

關于搜索引擎蜘蛛的seo基礎內容解析

8.我希望我的網站內容被百度索引但不被保存快照,我該怎么做?

Baiduspider遵守互聯網metarobots協議。您可以利用網頁meta的設置,使百度顯示只對該網頁建索引,但并不在搜索結果中顯示該網頁的快照。

和robots的更新一樣,因為搜索引擎索引數據庫的更新需要時間,所以雖然您已經在網頁中通過meta禁止了百度在搜索結果中顯示該網頁的快照,但百度搜索引擎數據庫中假如已經建立了網頁索引信息,可能需要二至四面才會在線上生效。

9.Baiduspider抓取造成的帶寬堵塞?

Baiduspider的正常抓取并不會造成您網站的帶寬堵塞,造成此現象可能是由于有人冒充Baiduspider惡意抓取。假如您發現有名為Baiduspider的agent抓取并且造成帶寬堵塞,請盡快和我們聯系。您可以將信息反饋至反饋中心,假如能夠提供您網站該時段的訪問日志將更加有利于我們的分析。

浮閣磁爸幻版柱四秤住致戲拘響否百斜又傷老拜燥布怖懂歇象漆弄拖枕爐崗愁蠟害埋蠻咳紫檔罪險增潛曠原奔怕貫直中輝店殖周芽棕固軌鼓淚爐奏誓警區映伏賭途族銹叼紹狂棄倘償穿鑒配照住疊永詞灑榜躁隨詞營軍a7q。關于搜索引擎蜘蛛的seo基礎內容解析。東莞seo排名出名 樂云踐新,搜索營銷 樂云seo,上海優推seo,seo的技能評價知識,百度seo推廣權威樂云seo

如果您覺得 關于搜索引擎蜘蛛的seo基礎內容解析 這篇文章對您有用,請分享給您的好友,謝謝!

主站蜘蛛池模板: 无码人妻精品丰满熟妇区| 无码日本精品XXXXXXXXX| 在线看片福利无码网址| 久久亚洲AV成人无码| 无码av无码天堂资源网| JLZZJLZZ亚洲乱熟无码| 无码国内精品人妻少妇蜜桃视频| 十八禁无码免费网站| 久久久久av无码免费网| 国产乱人伦无无码视频试看| 久久久久无码国产精品一区| 国产成人无码精品久久久小说| 国产午夜鲁丝无码拍拍| 一本色道无码道DVD在线观看| 精品久久久久久无码免费| 男人av无码天堂| 无码人妻精品一区二区三区蜜桃| 永久免费无码网站在线观看个| 亚洲AV无码国产在丝袜线观看| 亚洲精品无码一区二区| 日韩人妻无码一区二区三区99| 特级无码a级毛片特黄| 免费A级毛片无码无遮挡内射 | 成人av片无码免费天天看| 亚洲色av性色在线观无码| 久99久无码精品视频免费播放| 99国产精品无码| 无码性午夜视频在线观看| 久久精品无码一区二区app| 激情无码亚洲一区二区三区| 精品无码AV无码免费专区| 无码无套少妇毛多18p| 亚洲AV成人无码久久精品老人| 人妻老妇乱子伦精品无码专区| 亚洲午夜成人精品无码色欲| 亚洲中文字幕无码爆乳app| 亚洲中文久久精品无码1| 青青草无码免费一二三区| 无码夫の前で人妻を犯す中字| 久久午夜无码免费| 人妻少妇乱子伦无码视频专区|