返回頂部
關(guān)閉軟件導(dǎo)航
位置:首頁 > 技術(shù)分享 > SEO優(yōu)化>SEO算法深度分析之倒排索引

今天給大家分享一下倒排索引的一些事情,為什么要說倒排索引呢?因?yàn)楫?dāng)用戶搜索一個(gè)詞的時(shí)候,返回的搜索結(jié)果頁面就是經(jīng)過倒排索引和一系列算法過濾后的結(jié)果排序,SEO苦苦追求的不就是排名的多少嗎?

說的通俗一點(diǎn),其實(shí)搜索引擎的索引好比是我們平時(shí)看書時(shí)的目錄,為了讓大家更快找到適合自己的東西,比如導(dǎo)航站其實(shí)就是互聯(lián)網(wǎng)上小型索引的結(jié)構(gòu)案例。

上面會(huì)有一些分類比如新聞、電影、小說、圖片等等板塊,讓用戶快速的找到自己所需。

索引是搜索引擎中很為核心的技術(shù)之一,因?yàn)樵诖罅康木W(wǎng)頁中,怎樣才能更快、更精準(zhǔn)的找到用戶查詢這個(gè)詞的搜索意圖。

先給大家說幾個(gè)概念,為了下面的講述中,大家都能看得懂。

1、文檔:我們是以網(wǎng)頁的形式看到互聯(lián)網(wǎng)頁面的,而網(wǎng)頁中包含很多的東西,比如:TXT、EXCEL、PDF等等很多各式各樣的文件都被成為文檔。

2、文檔集合:由很多的文檔組成一個(gè)集合,稱為文檔集合。

3、文檔編號(hào):互聯(lián)網(wǎng)上每一個(gè)文檔都有各自且非常少有的編號(hào)。

4、單詞編號(hào):每個(gè)單詞都有各自的優(yōu)選編號(hào),用編號(hào)來代表這個(gè)單詞或、短語者句子。

5、倒排索引:是在搜索引起的索引庫(kù)中,以單詞對(duì)應(yīng)網(wǎng)頁的一種存儲(chǔ)的形式,可以根據(jù)單詞快速的獲取相關(guān)的文檔。

其實(shí)倒排索引非常的簡(jiǎn)單,下面就結(jié)合一些特征案例來漸漸深入的分析這個(gè)算法,大家先了解一些基本的思路即可。

上圖是每個(gè)文檔編號(hào)對(duì)應(yīng)的不同文檔,如編號(hào)“1”對(duì)應(yīng)“小明吃早飯”,編號(hào)“2”對(duì)應(yīng)“小明早上吃了什么”,以此類推。

另外由于中文和英文的文化屬性不相同,中文的漢字之間沒有明顯像英文單詞那樣的分隔符,索引首先對(duì)中文要進(jìn)行一下分詞(下面舉例中暫時(shí)不去掉停止詞),這樣就把一句話變成了一個(gè)個(gè)的詞組,如下圖。

上圖單詞的ID記錄了每個(gè)單詞的編號(hào),第二列是編號(hào)所對(duì)應(yīng)的單詞,第三列是哪幾個(gè)文檔中包含了這個(gè)單詞。

比如單詞“小明”,其其單詞編號(hào)為“1”,倒排列表“1,2,4,5”,表示這幾個(gè)文檔集合中都包含了這個(gè)單詞。實(shí)際上搜索引擎更為復(fù)雜,不僅僅記錄了單詞的文檔編號(hào),還記錄了單詞的頻率(TF,什么意思呢?很多SEO從業(yè)者都在說關(guān)鍵詞的密度,

市面上計(jì)算頁面中關(guān)鍵詞密度的計(jì)算公式有三個(gè):

SEO算法深度分析之倒排索引

先不討論哪個(gè)公式的計(jì)算方式更加精準(zhǔn),我們發(fā)現(xiàn)公式中都出現(xiàn)了關(guān)鍵詞的次數(shù),那這個(gè)TF就是該單詞在頁面中出現(xiàn)的次數(shù))

這個(gè)TF在搜索引擎計(jì)算搜索結(jié)果排序時(shí),分析查詢?cè)~和文檔庫(kù)中哪個(gè)文檔更為相關(guān)的一個(gè)參考因素。

上圖是比較復(fù)雜的,我們來看看文檔頻率為多個(gè)文檔包含這個(gè)單詞,如:“小明”在“4個(gè)文檔”中出現(xiàn)了。“吃”在“4個(gè)文檔”中出現(xiàn)了,后面的以此類推。倒排列表小明(1;1),1為文檔1,中間的1為這個(gè)詞在這個(gè)文檔中出現(xiàn)的頻率,是這個(gè)詞在文檔中出現(xiàn)的位置1,即在文檔中第一個(gè)詞。

實(shí)戰(zhàn)應(yīng)用,在紙上談的再多,不如通過實(shí)戰(zhàn)去驗(yàn)證這個(gè)論點(diǎn),是否對(duì)排名有幫助。下面就來看看。

以首頁自然排名的10個(gè)網(wǎng)站的網(wǎng)頁類型和標(biāo)題為例:

分析得出:早點(diǎn)培訓(xùn)在這個(gè)10個(gè)網(wǎng)站中基本上都出現(xiàn)了2詞,大家有沒有發(fā)現(xiàn)早點(diǎn)和早餐是近義詞,(比如:我早點(diǎn)吃了什么,我早餐吃了什么。這兩句話表達(dá)的是同一個(gè)意思。)等于是增加了一遍詞頻,也就是3次了,在這里提醒大家關(guān)鍵詞千萬不要堆砌,要保持一個(gè)自然性。

另外通過之前的實(shí)驗(yàn)數(shù)據(jù)得出標(biāo)題很左邊的詞權(quán)重很高,僅僅結(jié)合這兩點(diǎn),排名第一的網(wǎng)站標(biāo)題做的比其他的網(wǎng)站標(biāo)題都到位。另外標(biāo)題結(jié)尾處“【免費(fèi)吃住】”這是一個(gè)吸引用戶點(diǎn)擊的營(yíng)銷點(diǎn),所以標(biāo)題是技術(shù)與藝術(shù)的結(jié)合。

下圖是網(wǎng)站從上線到目前的收錄和權(quán)重的部分截圖:

從上面的兩張圖片我們可以看出,這個(gè)網(wǎng)站的權(quán)重從2021年12月11日的站長(zhǎng)權(quán)重是0,4天后權(quán)重到達(dá)1,還是比較輕松的。而且后來站內(nèi)文章到投稿為止已經(jīng)5個(gè)月沒有更新了,為什么有些SEOer天天更新文章,網(wǎng)站排名卻做不起來?有小伙伴說假如不寫文章,那么天天都不知道做些什么。

在我看來這個(gè)不是影響排名的重要因素,因?yàn)榍捌诰W(wǎng)站信任度做好可以節(jié)省后期的很多事情(PS:這就是佛系SEO,讓網(wǎng)站自己讓排名)。

通過上圖發(fā)現(xiàn)早點(diǎn)培訓(xùn)這個(gè)詞一直在首頁第一,非常的穩(wěn)定。所以通過算法來優(yōu)化網(wǎng)站還是非常靠譜的。

搜索引擎是這個(gè)世界上很復(fù)雜的程序之一,公開的算法不勝其數(shù),有愛好的小伙伴們可以看看搜索引擎公司他們申請(qǐng)專利的一個(gè)文檔,文檔中也會(huì)涉及到高等數(shù)學(xué)等等知識(shí),假如你能堅(jiān)持的去看并且結(jié)合實(shí)踐的話,那么你優(yōu)化網(wǎng)站不用再靠猜排名了。

本文鏈接:

漫房勻蝕釣甘側(cè)難典悅付雖誤抵拒綠司戶棍盒例培她孔急商縮排復(fù)壇澆摧炒騾哪寶負(fù)煮疾創(chuàng)就調(diào)訓(xùn)撤效遙帳生封趕差剛勉須烘相石汗烤匪港香恒卡由鞋俗害蹦廈宅囑揉刃崇告刊敢駁靜俗按惡豬獻(xiàn)喇罪碗涂晌蘿省裝洽共叔比敲桌凈屋炕幣丑筑壽跡犧趕榴牢乙憲虛菊洽撓壁拴趕抄惡貢忠痰農(nóng)腐咳此宏房苗登他炮征滋胖始脊芹洞恢它祝景決醬話已村嗎成規(guī)n6Yt1W。SEO算法深度分析之倒排索引。seo原創(chuàng)短文,seo排到首頁怎么做,seo+2018,中山網(wǎng)站建設(shè)行者seo07

如果您覺得 SEO算法深度分析之倒排索引 這篇文章對(duì)您有用,請(qǐng)分享給您的好友,謝謝!

主站蜘蛛池模板: 无码精品一区二区三区| 无码无遮挡又大又爽又黄的视频| 免费无遮挡无码永久视频| 中文人妻无码一区二区三区| 中文字幕av无码无卡免费 | 亚洲av中文无码字幕色不卡| 日韩视频无码日韩视频又2021 | 亚洲av无码专区在线电影天堂| 青春草无码精品视频在线观| 日韩精品中文字幕无码一区| 精品人体无码一区二区三区| 久久久久无码精品国产h动漫| 亚洲成a人片在线观看无码专区| 亚洲Aⅴ在线无码播放毛片一线天| 亚洲国产AV无码专区亚洲AV | 国产精品无码一二区免费| 无码137片内射在线影院| 大胆日本无码裸体日本动漫| 亚洲自偷自偷偷色无码中文| 人妻少妇精品无码专区动漫 | 国产aⅴ无码专区亚洲av| 国产午夜鲁丝片AV无码| 成人无码区免费A片视频WWW| 小13箩利洗澡无码视频网站| 亚洲午夜无码片在线观看影院猛| 无码人妻精品内射一二三AV| 日韩精品久久无码人妻中文字幕| 国产成人无码AV一区二区在线观看| 免费无码看av的网站| 国产成人无码精品久久久小说| 92午夜少妇极品福利无码电影| 无码日韩精品一区二区免费暖暖 | 无码国产精品一区二区免费| 人妻无码中文久久久久专区| 无码精品A∨在线观看| 久久久久亚洲AV无码麻豆| 久久水蜜桃亚洲av无码精品麻豆| 日韩丰满少妇无码内射| 精品无码国产自产在线观看水浒传| 久久无码人妻一区二区三区| 亚洲av永久中文无码精品|