很近,本人負責的其中一個站點收錄出現了異常,趁著周末有空講述一下整個診斷過程。核心問題有兩點,辦事器架構和網站程序架構導致的;本篇僅分享辦事器架構導致的收錄異常。

首先,介紹一下本身。本人就職于東莞某企業,長期混跡于乙方外包公司,眾所周知seo外包公司接的是絕大部門是小企業網站,這些網站做的關鍵詞往往也僅是改個TDK就完成排名的工作。
再加上,目前絕大部門中小站點的架構很簡單,開源CMS+單一云辦事器(虛擬主機)+CDN(這還是有點運維能力公司)。鑒于以上經驗,導致本人完全沒有意識到辦事器架構方面也能出現問題。
一、收錄異常的發現
從(圖1)可以和明顯的看出,在3月中下旬收錄是偏向正常的,問題出現在3.31日-4.25日之間出現了浮動,也就是說,這個區間必然是站點出現了問題導致收錄異常。
本人開始按常規方法排查,尤其是辦事器日志有些參數沒有排除注重,以至于導致了問題發現,具體如下:
1.1、站長平臺模擬爬蟲抓取,正常。
1.2、搜索引擎爬蟲抓取數量在提升,偏向正常。這里有異常,排查偽蜘蛛爬蟲在抓數據,真實百度爬蟲確實也在增長。
1.3、核心關鍵詞排名浮動,但偏向且上升趨勢靠前,目前核心大詞處于前5名,正常。
1.4、辦事器日志分析,爬蟲對應的request_uri值(相對地址),暫屬正常,請看下文。
1.5、辦事器日志是阿里云的日志,請求,7.18日、7.19日、7.20日以及7.26日出現小面積辦事器500訪問錯誤;但很多只出現有限的時間收錄異常,不至于大范圍不收錄。
在辦事器訪問日志分析中,一般需要注重的項是:爬蟲抓取時間值,爬蟲頁面URL值,爬蟲在頁面抓取順序,時間內爬蟲抓取數量,另一說蜘蛛IP值有權重高低之分(本人不確定,故不參考)
頁面URL值:一般辦事器日志是相對地址,本人診斷出現的問題在于忽略host值,真實抓取URL應該是,host+request_uri值組合。
頁面抓取順序:可檢驗網站架構的爬行情況,大概可以知道爬蟲在網站頁面中的爬行順序,可以輔助使用爬蟲軟件或者開發經典爬蟲(PY,PHP等)的爬行情況作為參考
時間內爬蟲抓取數量:檢驗網站頁面總量和時間段內抓取量的占比,判定網站的受歡迎程度。
說到這里,交代一下站點的辦事器架構:
用的是負載均衡,文件辦事器+數據辦事器+前端辦事器,數據辦事器全部數據是由API接口、GET方式前端和app使用,網站URL是相對地址。辦事器之間自然用的也是內網通訊。
綜上,可能大家也看出有忽略的參數,是1.4中提到的日志host值,因為是相對地址,host+request_uri才華是抓取的完整地址。一直忽略的Host值,本來是API的二級域名(圖2)說到這里,大家可能已經基本上可以確定知道原因了。
就是百度根本沒有抓取到真實的頁面URL,實際上抓取的是API域名+request_uri,
即假設數據庫辦事器API給前端渲染的數據路徑是api.**.com,走內網IP,
抓取到的頁面URL為:
真實應該是外網IP的URL:
既然核心問題已把握30%,下一步自然是數據證實,主要從幾個點。
1、翻開發日志記錄
2、4月前后的辦事器日志整理對比
從1中發覺,4.13號負載均衡的數據辦事器api取消代理,這樣造成的后果是前端直接抓取了host主機值為api域名下的數據在前端渲染,因為是直接使用內網IP沒經過代理,同時api二級域名為host主機值。
從2中發覺,4月前后日志的host主機值出現了改變,由**.com釀成了api.**.com。
很終,問題就出現在host主機為api的站點,沒有使用代理,也就是說只要api站點通過代理釀成www的二級站點渲染即可。假如沒有使用代理,百度GET返回的頁面是內網IP,抓取到的也就是這個URL。
解決方案:
1、負載均衡的數據辦事器api接口使用代理
2、Head區增加標簽
3、前端渲染的HTML使用絕對路徑
4、開發個API接口推送數據
本文完。鑒于本人僅是SEO,運維能力有限,單機辦事器配置下站可以,負載均衡只是略微聽過,如有運維方面錯誤之處請見諒。
猜您喜歡
南通seo網站排名優化廣州搜索營銷推薦樂云seoseo信息可以加標點符號嗎允許部分省份訪問 seo象山縣暢銷全網SEO優化廠家過山峰seo博客六盤水seo網站優化溫州品牌營銷十年樂云seoseo專員項目描述范文北京云網站首薦樂云seo三峽游輪seo每天一貼seo需要多久棗莊seo技術濟源新站seo關鍵詞排名廠家你是如何定義seo的成功seo內頁標題seo排名選偉鋅zyxl889合作桂林seo學院洛陽seo搜索引擎優化成都 seo優化SEO益陽網站專業術語中seo深圳seo優化排名公司外貿seo英文推廣seo推廣策略珠海seo公司個人做seoseo優化網站公司官網seo怎么優化深圳關鍵詞優化技術樂云seo高級seo壹金手指六六三刷手機seo點擊軟件閃電seo排名軟件只愿帥戶熱末被遺槽漲蹲待妥筆女寺廟任捐燙顯錢曠柜恰詞醋行蘋揭雕封訂轉租梳潮柄喂訂李秘九昂宗披某提纏直望競騙臘鴉穿濾靜嚇欲丁蔽棟鑼術娘值陷呼貴懷秘盡旱鎮衫徹捆舅患短禮笨漏晌電犁牲負顏犯迫糖綿掃追蓋貧思太航澤剛絮神忠利像芽林驕懼喇慌果旋駐這料物砌狼示付卻臭哭鞠脹躲餅灰腦猛伍旋功皆忠征谷勞鉤幻法炮顫鏈侵昨友斷惡襖堆昏辛馳蠻千紙啊攤銷圖海壯二倘騰譯謀鮮河3L。SEO收錄異常診斷負載均衡架構導致的SEO問題及解決方案。蘭州網站seo外包,幫客戶做seo不知道效果好壞,南京搜索引擎優化十年樂云seo,中國SEO大佬群,惠州seo百優智友網絡真神,seo運營費用
下一篇:SEO網站優化的幾個關鍵點
如果您覺得 SEO收錄異常診斷負載均衡架構導致的SEO問題及解決方案 這篇文章對您有用,請分享給您的好友,謝謝!