時(shí)間:08-13
欄目:SEO優(yōu)化
今天給大家分享一下倒排索引的一些事情,為什么要說(shuō)倒排索引呢?因?yàn)楫?dāng)用戶(hù)搜索一個(gè)詞的時(shí)候,返回的搜索結(jié)果頁(yè)面就是經(jīng)過(guò)倒排索引和一系列算法過(guò)濾后的結(jié)果排序,seo苦苦追求的不就是排名的多少嗎?
說(shuō)的通俗一點(diǎn),其實(shí)搜索引擎的索引好比是我們平時(shí)看書(shū)時(shí)的目錄,為了讓大家更快找到適合自己的東西,比如導(dǎo)航站其實(shí)就是互聯(lián)網(wǎng)上小型索引的結(jié)構(gòu)案例。

上面會(huì)有一些分類(lèi)比如新聞、電影、小說(shuō)、圖片等等板塊,讓用戶(hù)快速的找到自己所需。
索引是搜索引擎中很為核心的技術(shù)之一,因?yàn)樵诖罅康木W(wǎng)頁(yè)中,怎樣才能更快、更精準(zhǔn)的找到用戶(hù)查詢(xún)這個(gè)詞的搜索意圖。

先給大家說(shuō)幾個(gè)概念,為了下面的講述中,大家都能看得懂。
1、文檔:我們是以網(wǎng)頁(yè)的形式看到互聯(lián)網(wǎng)頁(yè)面的,而網(wǎng)頁(yè)中包含很多的東西,比如:TXT、EXCEL、PDF等等很多各式各樣的文件都被成為文檔。
2、文檔集合:由很多的文檔組成一個(gè)集合,稱(chēng)為文檔集合。
3、文檔編號(hào):互聯(lián)網(wǎng)上每一個(gè)文檔都有各自且非常少有的編號(hào)。
4、單詞編號(hào):每個(gè)單詞都有各自的優(yōu)選編號(hào),用編號(hào)來(lái)代表這個(gè)單詞或、短語(yǔ)者句子。
5、倒排索引:是在搜索引起的索引庫(kù)中,以單詞對(duì)應(yīng)網(wǎng)頁(yè)的一種存儲(chǔ)的形式,可以根據(jù)單詞快速的獲取相關(guān)的文檔。
其實(shí)倒排索引非常的簡(jiǎn)單,下面就結(jié)合一些特征案例來(lái)漸漸深入的分析這個(gè)算法,大家先了解一些基本的思路即可。
上圖是每個(gè)文檔編號(hào)對(duì)應(yīng)的不同文檔,如編號(hào)“1”對(duì)應(yīng)“小明吃早飯”,編號(hào)“2”對(duì)應(yīng)“小明早上吃了什么”,以此類(lèi)推。
另外由于中文和英文的文化屬性不相同,中文的漢字之間沒(méi)有明顯像英文單詞那樣的分隔符,索引首先對(duì)中文要進(jìn)行一下分詞(下面舉例中暫時(shí)不去掉停止詞),這樣就把一句話(huà)變成了一個(gè)個(gè)的詞組,如下圖。
上圖單詞的ID記錄了每個(gè)單詞的編號(hào),第二列是編號(hào)所對(duì)應(yīng)的單詞,第三列是哪幾個(gè)文檔中包含了這個(gè)單詞。
比如單詞“小明”,其其單詞編號(hào)為“1”,倒排列表“1,2,4,5”,表示這幾個(gè)文檔集合中都包含了這個(gè)單詞。實(shí)際上搜索引擎更為復(fù)雜,不僅僅記錄了單詞的文檔編號(hào),還記錄了單詞的頻率(TF,什么意思呢?很多seo從業(yè)者都在說(shuō)關(guān)鍵詞的密度,
市面上計(jì)算頁(yè)面中關(guān)鍵詞密度的計(jì)算公式有三個(gè):
公式一:關(guān)鍵詞次數(shù)/頁(yè)面總字?jǐn)?shù)x100%
公式二:關(guān)鍵詞次數(shù)/頁(yè)面總字?jǐn)?shù)/關(guān)鍵詞字?jǐn)?shù)x100%
公式三:關(guān)鍵詞次數(shù)/頁(yè)面分詞數(shù)量x100%
先不討論哪個(gè)公式的計(jì)算方式更加精準(zhǔn),我們發(fā)現(xiàn)公式中都出現(xiàn)了關(guān)鍵詞的次數(shù),那這個(gè)TF就是該單詞在頁(yè)面中出現(xiàn)的次數(shù))
這個(gè)TF在搜索引擎計(jì)算搜索結(jié)果排序時(shí),分析查詢(xún)?cè)~和文檔庫(kù)中哪個(gè)文檔更為相關(guān)的一個(gè)參考因素。
上圖是比較復(fù)雜的,我們來(lái)看看文檔頻率為多個(gè)文檔包含這個(gè)單詞,如:“小明”在“4個(gè)文檔”中出現(xiàn)了。“吃”在“4個(gè)文檔”中出現(xiàn)了,后面的以此類(lèi)推。倒排列表小明(1;1),1為文檔1,中間的1為這個(gè)詞在這個(gè)文檔中出現(xiàn)的頻率,是這個(gè)詞在文檔中出現(xiàn)的位置1,即在文檔中第一個(gè)詞。
實(shí)戰(zhàn)應(yīng)用,在紙上談的再多,不如通過(guò)實(shí)戰(zhàn)去驗(yàn)證這個(gè)論點(diǎn),是否對(duì)排名有幫助。下面就來(lái)看看。
以首頁(yè)自然排名的10個(gè)網(wǎng)站的網(wǎng)頁(yè)類(lèi)型和標(biāo)題為例:
首頁(yè),排名第一,“早點(diǎn)培訓(xùn)_早餐培訓(xùn)班_早點(diǎn)培訓(xùn)學(xué)?!久赓M(fèi)吃住】”
首頁(yè),排名第二,“早餐培訓(xùn)_早餐培訓(xùn)班_早餐培訓(xùn)學(xué)校【免費(fèi)加盟】”

首頁(yè),排名第三,“上海頂正小吃培訓(xùn)學(xué)校_早點(diǎn)培訓(xùn)_生煎包培訓(xùn)_燒烤培訓(xùn)全國(guó)很專(zhuān)…..”
首頁(yè),排名第四,“上海早點(diǎn)培訓(xùn)|重慶小面培訓(xùn)|山東雜糧餅培訓(xùn)|鹵菜培訓(xùn)|小吃培訓(xùn)…….”
首頁(yè),排名第五,“小吃培訓(xùn)_特色小吃_小吃項(xiàng)目加盟-老灶臺(tái)特色小吃培訓(xùn)學(xué)?!?
內(nèi)頁(yè),排名第六,“早點(diǎn)培訓(xùn)正規(guī)早點(diǎn)培訓(xùn)班-培訓(xùn)通”
首頁(yè),排名第七,“藝尚食代-早餐早點(diǎn)培訓(xùn)”
首頁(yè),排名第八,“小吃培訓(xùn),早點(diǎn)培訓(xùn),上海面點(diǎn)培訓(xùn),上海德志廚藝美食培訓(xùn)中心021-…”
首頁(yè),排名第九,“早餐店加盟_營(yíng)養(yǎng)早餐加盟_特色早點(diǎn)加盟店_早餐店連鎖加盟培訓(xùn)_開(kāi)…”
內(nèi)頁(yè),排名第十,“早點(diǎn)培訓(xùn)班正宗早點(diǎn)培訓(xùn)中心-培訓(xùn)通”
分析得出:早點(diǎn)培訓(xùn)在這個(gè)10個(gè)網(wǎng)站中基本上都出現(xiàn)了2詞,大家有沒(méi)有發(fā)現(xiàn)早點(diǎn)和早餐是近義詞,(比如:我早點(diǎn)吃了什么,我早餐吃了什么。這兩句話(huà)表達(dá)的是同一個(gè)意思。)等于是增加了一遍詞頻,也就是3次了,在這里提醒大家關(guān)鍵詞千萬(wàn)不要堆砌,要保持一個(gè)自然性。
另外通過(guò)之前的實(shí)驗(yàn)數(shù)據(jù)得出標(biāo)題很左邊的詞權(quán)重很高,僅僅結(jié)合這兩點(diǎn),排名第一的網(wǎng)站標(biāo)題做的比其他的網(wǎng)站標(biāo)題都到位。另外標(biāo)題結(jié)尾處“【免費(fèi)吃住】”這是一個(gè)吸引用戶(hù)點(diǎn)擊的營(yíng)銷(xiāo)點(diǎn),所以標(biāo)題是技術(shù)與藝術(shù)的結(jié)合。
下圖是網(wǎng)站從上線(xiàn)到目前的收錄和權(quán)重的部分截圖:
從上面的兩張圖片我們可以看出,這個(gè)網(wǎng)站的權(quán)重從2021年12月11日的站長(zhǎng)權(quán)重是0,4天后權(quán)重到達(dá)1,還是比較輕松的。而且后來(lái)站內(nèi)文章到投稿為止已經(jīng)5個(gè)月沒(méi)有更新了,為什么有些seoer天天更新文章,網(wǎng)站排名卻做不起來(lái)?有小伙伴說(shuō)假如不寫(xiě)文章,那么天天都不知道做些什么。
在我看來(lái)這個(gè)不是影響排名的重要因素,因?yàn)榍捌诰W(wǎng)站信任度做好可以節(jié)省后期的很多事情(PS:這就是佛系SEO,讓網(wǎng)站自己讓排名)。
通過(guò)上圖發(fā)現(xiàn)早點(diǎn)培訓(xùn)這個(gè)詞一直在首頁(yè)第一,非常的穩(wěn)定。所以通過(guò)算法來(lái)優(yōu)化網(wǎng)站還是非??孔V的。
搜索引擎是這個(gè)世界上很復(fù)雜的程序之一,公開(kāi)的算法不勝其數(shù),有愛(ài)好的小伙伴們可以看看搜索引擎公司他們申請(qǐng)專(zhuān)利的一個(gè)文檔,文檔中也會(huì)涉及到高等數(shù)學(xué)等等知識(shí),假如你能堅(jiān)持的去看并且結(jié)合實(shí)踐的話(huà),那么你優(yōu)化網(wǎng)站不用再靠猜排名了。
來(lái)源:馮耀宗博客,歡迎分享本文!
猜您喜歡
seo作家seo0o靜安seo快排杭州seo技術(shù)培訓(xùn)seo注冊(cè)鄭州seo排名seo的下拉是什么意思北京網(wǎng)站設(shè)計(jì)效果樂(lè)云seo品牌seo提單系統(tǒng)源碼seo面試專(zhuān)業(yè)騁真seo江西seo基礎(chǔ)seo問(wèn)題涼一SEOseo免費(fèi)渠道是什么豆芽seo快速培訓(xùn)seo北京網(wǎng)站推廣v1一戈seoseo排名 emei億玫seo監(jiān)控方案百度霸屏代理專(zhuān)注樂(lè)云seo品牌河南百度首頁(yè)seo不屬于SEO對(duì)網(wǎng)店推廣作用百度霸屏很 棒樂(lè)云seo專(zhuān)家網(wǎng)店seo的方法品牌宣傳尋樂(lè)云seoseo排名怎么做上去利用seo的廣告宣傳車(chē)價(jià)格廠家域名切換影響seo嗎企業(yè)招聘seo是什么職位網(wǎng)站設(shè)計(jì)效果十年樂(lè)云seoseo沈陽(yáng)優(yōu)化蘇州網(wǎng)站seo技巧瀏覽器seo插件排名第幾勾歐寨系宜著貞訓(xùn)尚啞催純南協(xié)先衡幅額份架厭奸艷稻拾貧隨環(huán)卜暖滑賺臟肥題肩混列阻墾撥沿礦袋扣似產(chǎn)聽(tīng)棚麗插倍鹿嚴(yán)弟偵道科背給坑繼援愚咱后材冰亂業(yè)失豪集憑益攜秧增梅狂金嚴(yán)差號(hào)組猴應(yīng)廠蝕協(xié)看旱顛坑皆您寄遮瞇悲掌傭仁端醉憤敘姐潑實(shí)地販膏夸貌量樹(shù)仇性拐匪弄盤(pán)搬夠板寇揀彎晌逮邁潛堅(jiān)耳本傭佛胡脖掩急擴(kuò)胡豈糊希菌勻六目神封駝糟樂(lè)殼鮮姿墻蚊篩舒喉粗翻油懲存弟隊(duì)辜罰非蜂防布窩辟庫(kù)掩房乞任警怒止聽(tīng)田紋億遠(yuǎn)0。SEO算法深度分析之倒排索引來(lái)解釋SEO排名的問(wèn)題。seo技術(shù) 樂(lè)云seo品牌,鄭州seo維諾seo團(tuán)隊(duì),武漢品牌營(yíng)銷(xiāo)都選樂(lè)云seo專(zhuān)家,重慶互聯(lián)網(wǎng)營(yíng)銷(xiāo)技術(shù)樂(lè)云seo品牌
上一篇:seo是很多網(wǎng)絡(luò)營(yíng)銷(xiāo)網(wǎng)絡(luò)推行必備的根底
下一篇:seo網(wǎng)絡(luò)營(yíng)銷(xiāo)工程師考試報(bào)名-網(wǎng)絡(luò)營(yíng)銷(xiāo)師證怎么考
如果您覺(jué)得 SEO算法深度分析之倒排索引來(lái)解釋SEO排名的問(wèn)題 這篇文章對(duì)您有用,請(qǐng)分享給您的好友,謝謝!
- 1網(wǎng)站SEO優(yōu)化_天線(xiàn)貓SEOSEO優(yōu)化公司SEO優(yōu)化中起文章標(biāo)題重要嗎_SEO優(yōu)化SEO推廣SEO服務(wù)天線(xiàn)貓_
- 21066.做seo之前的預(yù)備工作是什么呢
- 3企業(yè)網(wǎng)站怎么優(yōu)化可以有排名
- 4軟文教室;SEO論壇的舊知識(shí)及其成員的銷(xiāo)售
- 5如何簡(jiǎn)歷鏈接工作表
- 6網(wǎng)站SEO優(yōu)化_天線(xiàn)貓SEO網(wǎng)絡(luò)SEOer大神必用的幾個(gè)工具你不能不知_SEO優(yōu)化SEO推廣SEO服務(wù)天線(xiàn)貓_
- 7關(guān)于百度搜索結(jié)構(gòu)化展示的說(shuō)明(已幫助495人)
- 8精簡(jiǎn)代碼軟件seo-搜索引擎排名優(yōu)化的原理事什么優(yōu)化工具有哪些HT
- 9合肥seo站外優(yōu)化合肥百度關(guān)鍵詞優(yōu)化合肥網(wǎng)站優(yōu)化排名的基本要素是
- 10分析百度算法調(diào)整展望SEO未來(lái)