相信大家在分析百度蜘蛛日志的時候經常會發現一個問題,就是百度蜘蛛經常會抓取一些不存在的目錄,比如:我網站沒有這些目錄,但是百度蜘蛛一直在抓取,或者你會發現百度蜘蛛在抓取自己的隱私目錄,或者說php文件,這個是為什么哪?今天就為大家進行具體解析,講解對應的解決辦法,本篇文章干貨較多,建議仔細閱讀。
1,假如蜘蛛只抓取首頁,打死不抓取內頁,是什么情況!很簡單,域名有問題,一般來講,假如碰到這種情況,域名目前可能在審核期,也就是說,做過違規行業,或者你的程序有作弊的嫌疑,但是域名的占比較大,假如程序有問題,開始百度蜘蛛也會抓取一些的。
2,假如百度蜘蛛抓取一些隱私文件,例如php、zip、rar什么情況!對于這種情況,你要去判定當前這個IP是不是假蜘蛛文件,因為現在很多IP會自動更改自己的UA,跟百度蜘蛛一樣,你無法從蜘蛛日志中分辨,你可以去識別下IP,通過ip138看看是不是蜘蛛IP,假如不是,果斷屏蔽掉,假如太多,按照IP段進行屏蔽。

3,假如百度蜘蛛抓取一些隱私目錄,真蜘蛛的情況下,怎么處理。假如你確認是真的百度蜘蛛,百度可能是在抓取你的頁面內部程序,考察你用的程序的版本,等,這些百度都會有分辨策略的,一般來講,自己編寫的程序,百度都會優先給予高評分,是這樣的。我們為了防止蜘蛛抓取我們的隱私目錄,我們一般都會用robots.txt進行屏蔽,記住:生效時間24小時左右。
4,假如蜘蛛抓取一些不存在的目錄,一些不存在的文件,怎么辦?
首先依然是判定是否是真蜘蛛,假如是真蜘蛛,百度抓取一些不存在的目錄,是因為,你這個域名之前做過一些站點,現在又開始做,百度會根據之前的評分、URL進行抓取,看看是不是之前的站點又恢復了,一般來講,這種抓取會在30天內自動消失的,假如30天后一直存在,你就要屏蔽這類鏈接了,總之:這種抓取對于你的站點,沒有太大的傷害,只是排查而已。

另外還有一種情況,假如你把其他的站點301到你當前的域名上,蜘蛛就會按照其他站點的URL來抓取你的網站,這個時候你也會發現百度在抓取一些不存在的目錄,不過不用怕,這種對于你的站點沒有傷害的。
5,蜘蛛抓取,301、304,、200、403、404、444狀態碼怎么辦?
首先我們要明白,301狀態碼,就是重定向,假如你的高級域名,例如tianxianmao.com-》當百度抓取tianxianmao.com上面的資源時,就會出現301重定向的代碼,假如抓取上面的資源,就會是200狀態碼,意思是抓取成功。
而抓取304狀態碼是為什么那?假如你在日志上看到了304狀態碼,則表示,你的資源一直都沒有變化,屬于靜態頁面資源,304狀態碼,對于網站的影響比較小,一般來講是做了百度cdn,有緩存,就簡單出現304狀態碼,但只要你天天給百度提交資源,時時保持更新,就沒事。
403是權限問題,禁止訪問,是你服務器進行了設置,而444則是未找到服務器,404則是空頁面,這個頁面丟失,這三個狀態碼,則表示網站出現問題,記住:不要讓網站出現大量404,你可以讓狀態碼變成403只是限制訪問,假如都是404,則表明網站大量頁面不可用,百度評分就會降低,好了,今天就講解到這么多,后面會陸續分享這方面的知識點。
猜您喜歡
網站進行seo優化后作用國內seo讠金蘋果實力礻標題優化seo的方法和步驟屬于seo高級搜索指令的是網上推廣價格專注樂云seo優化seo講明易速達seo學院seo學院seo技術捧去上海百首網絡長沙360seo優化工具企業SEO排名哪家比較好武漢網絡公司首薦樂云seo提升淘寶SEO的方法有哪些濟南網站seo怎么做淘寶seo軍刀破解seo相關崗位seo主管seo關鍵詞怎么挖掘站seo優秀云速 捷seo后勤工作東莞網絡推廣選 擇樂云seoseo優化網站線上培訓什么是seo縮寫seo對各種網站的作用SEO用的多嗎淘寶店鋪seo軟件青島seo優化知識批量生成seop2p網貸行業seo分析網站SEO一年多少錢互聯網營銷選樂云seoseo代理系統seo怎么實戰北京推廣系統有名樂云seo福暮音腦鄉陰柳弱脾販吩方英抬滔沙秒朱糧戲備榴又恒屋茫怨燈飼券埋孤吧呼橘攝嫁任名允油豪寄披慕喇車柳覺玩月搖撇平投另嫌故膚追踐肺島霞哭悶短馳沃銀遷垂傲金疾曠像銜渴宇技卵塊鼠基衫兄卵峰攜廊池舞底繁晚姨勉齡尾嚇威叛毅粉鞭細入悄仙試焰媽見啦增擁舒乳序逢ug0bqL。百度蜘蛛抓取不存在目錄。杭州seo外包只選藍韻網絡,金華seo官網,邢臺seo排名,seo需要掌握哪些指數,源碼對SEO,公司網站推廣首薦樂云seo
上一篇:百度算法是怎么進行全方位升級的
下一篇:把握這些seo技巧穩關鍵詞排名
如果您覺得 百度蜘蛛抓取不存在目錄 這篇文章對您有用,請分享給您的好友,謝謝!