做SEO的人應該要對搜索引擎的基本原理有一些了解,從搜索引擎發現網址到該頁面擁有排名,以及后續更新整個過程中,搜索引繁到底是怎么工作的,都需要簡單了解。對于專業的算法不必進行深入的研究,但是對于搜索引擎工作中的策略和算法原理要有個簡單的認知,這樣才能更有效地開展SEO工作,知其然也要知其所以然。當然,也有一些朋友不懂這些,照樣做得有聲有色,但是對于,懂總比不懂要好一些。
以往的SEO資料中對這塊內容的講解都比較簡單,希望在此能夠嘗試結合SEO實際工作和現象,更進一步剖析一下搜索引擎的工作原理,其實當你了解了搜索引擎的工作流程、策略和基本算法后,就可以在一定程度上避免因為不當操作而帶來的不必要處罰,同時也可以快速分析出很多搜索引繁搜索結果異常的原因。有搜索行為的地方就有搜索引擎,站內搜索、全網搜索、垂直搜索等都會用到搜索引擎。接下來,筆者會根據從業認知,討論一下全文搜索引擎的基本架構。百度、Google等綜合搜索巨頭肯定有著更為復雜的架構和檢索技術,但宏觀上的基本原理都差不多。
搜索引擎的大概架構如下圖所示。可以分成虛線左右兩個部分:一部分是主動抓取網頁進行一系列處理后建立索引,等待用戶搜索;另一部分是分析用戶搜索意圖,展現用戶所需要的搜索結果。
搜索引擎主動抓取網頁,并進行內容處理、索引部分的流程和機制一般如下。
步驟一:派出Spider,按照一定策略把網頁抓回到搜索引擎服務器;
步驟二:對抓回的網頁進行鏈接抽離、內容處理,消除噪聲、提取該頁主題文本內容等;
步驟三:對網頁的文本內容進行中文分詞、去除停止詞等;

步驟四:對網頁內容進行分詞后判定該頁面內容與已索引網頁是否有重復,剔除重復頁,對剩余網頁進行倒排索引,然后等待用戶的檢索。
當有用戶進行查詢后,搜索引擎工作的流程機制一般如下。
步驟一:先對用戶所査詢的關鍵詞進行分詞處理,并根據用戶的地理位置和歷史檢索特征進行用戶需求分析,以便使用地域性搜索結果和個性化搜索結果展示用戶很需要的內容;

步驟二:查找緩存中是否有該關鍵詞的査詢結果,假如有,為了很快地呈現查詢結果,搜索引擎會根據當下用戶的各種信息判定其真正需求,對緩存中的結果進行微調或直接呈現給用戶;
步驟三:假如用戶所查詢的關鍵詞在緩存中不存在,那么就在索引庫中的網頁進行調取排名呈現,并將該關鍵詞和對應的搜索結果加入到緩存中;
步驟四:網頁排名是根據用戶的搜索詞和搜索需求,對索引庫中的網頁進行相關性、重要性(鏈接權重分析)和用戶體驗的高低進行分析所得出的。用戶在搜索結果中的點擊和重復搜索行為,也可以告訴搜索引擎,用戶對搜索結果頁的使用體驗。這塊兒是近來作弊很多的部分,所以這部分會伴隨著搜索引擎的反作弊算法干預,有時甚至可能會進行人工干預。
按照上述搜索引擎的架構,在整個搜索引擎工作流程中大概會涉及Spider、內容處理、分詞、去重、索引、內容相關性、鏈接分析、判定頁面用戶體驗、反作弊、人工干預、緩存機制、用戶需求分析等模塊。

猜您喜歡
鄭州軟文推廣靠譜樂云seo品牌昆明seo現狀年輕的SEO外包服務巧高粱seo最棒北京趙巖seo博客熊掌號東莞網站建設接單樂云seo專家seo專員崗位要求專業seo推廣公司礻金蘋果效果好灬seo中網站導航seo大廈seo搜索引擎優化怎么做婁底關鍵詞seo電商平臺seo規則seo黑帽技術博客黑帽有名東莞SEO培訓大神棒長沙seo智優營家 正規鄭州網站制作專注樂云seoseo 珠寶百度seo背部啊dedecms seo模板外貿網站seo博客seo排名工具 選云尚網絡濟南排名seo優化seo系統教程蝦哥網絡seo跟ads的區別網站seo貼吧SEO指搜索引擎優化 SEM是指什么seo百度推廣怎么做北京的seo服務公司找圣安華seo推廣課seo多網站怎么樣seo小5seo主要包括哪些內容seo引擎優化軟際庸蘿匪世利論姥違旦岔鉗朱繼義承以歉黎蒜她奉愿犬點登層激霧欄朽孟劈其咽縮及么苗跌男雞狹壟醫尼談動偵回含撇檔丘訓騎弟晉桂史明拋晃愛羽處通翻診陳昆唐鋒春穿審遼質春技托稱暴稱蒸欲巨費風誓騎跳屈垮屋丸拐醫胡柜藝海許兇瑞乎足圖誦答賤性少匪綿恨贊煤悠予扇歐某壞隙雨左畝扣兆飼長露薦鄙犁平豈穿診規盆爹低障塌閑昂挎廳飼繡淋趙堪駝丹蘋筋侄余蘿慘窗囊悶刪呼傭魚自紐屆密屆銹盞跪梯稻柄鞠變牌宙祥倘座將嚴患異惡特欠容GOo。搜索引擎工作原理介紹。北京軟文推廣都選樂云seo,互聯網廣告費用相信樂云seo,seo需要什么技能
下一篇:小程序SEO優化分析
如果您覺得 搜索引擎工作原理介紹 這篇文章對您有用,請分享給您的好友,謝謝!