TF-IDF算法為什么對SEO很重要?值得一看
在過去一年左右的時間里,你可能已經看到TF-IDF這個詞被扔了出去,許多搜索引擎優化的潮流來了又去,一些很有趣的搜索引擎優化很終會招致懲罰,對嗎?
但是TF-IDF有點不同。
TF-IDF算法不是對搜索引擎的操縱,而是一種分析內容主題的方法,它基于與搜索引擎本身相同的原則。因此,需要一種真正客觀的方法來衡量和改進其內容的SEOer具有驚人的潛力。
我剛剛將案例研究完全納入我的能力范圍,結果非常有趣。
在我從個人實驗中學到東西之前,我想確定我了解TF-IDF以及它是如何使用的。
TF-IDF是什么?
字面意思是術語頻率乘以逆文檔頻率。
TF-IDF是一個結合了這兩種度量的等式,它度量一個術語在頁面上的使用頻率(TF)和該術語在集合的所有頁面中的出現頻率(IDF),以指定一個分數或權重,即該術語對頁面的重要性。
這個等式在學術界由來已久。語言學和信息架構領域的研究人員使用它作為一種方法,在時間的短時間內分析了大量的文檔庫。
它也被信息檢索程序(包括所有的搜索引擎)用來有效地分類和判定數百萬個結果的相關性。
對于相同的信息,你想做什么和搜索引擎想做什么有很大的區別。
搜索引擎想要考慮網絡上所有結果的集合,而你想要將一個網頁或網站與表現不佳的網站進行比較.前十名。
仔細看看TF和IDF的等式.你可能需要做一些數學計算來得到所有的測量值,即TF和IDF。但我保證不會那么難。根據不同的應用,TF-IDF的等式可能比我下面使用的例子要復雜得多。
無論是否簡化,假如你試圖優化你的網站,你通常不希望被手動捕捉。這些方程將幫助你理解TF-IDF的功能,但它是我在很后討論的工具,真正打開了潛力。
通過計算一個術語在頁面上出現的次數來確定第一個術語的出現頻率。然后,將數字插入下面的等式中:
期限頻率=(原始計數)/(文件總字數)
反向文檔頻率(術語)=log(文檔數//(包含關鍵字的文檔)
通過將術語出現的文檔數除以所選集合中的文檔總數來計算文檔的倒排頻率,如下:
為什么TF-IDF對SEO很重要?
使用TF-IDF增強關鍵字研究
如何使用TF-IDF?
TF
通過對測量的頁面進行評分,你幾乎可以理解谷歌和百度是如何對同一主題的網站進行評分的。
目前還不清楚谷歌或百度等搜索引擎是否在其算法中使用TF-IDF。假如是,它是一種變體嗎?換句話說,有一些私人相關性研究,我已經知道他們的數據表明這是可能的。TF-IDF分析答應您基于算法已經授予的內容來優化術語的平衡。
(PPC)=(12/100)=0.12
IDF
例如,假設你已經完成關鍵詞研究,優化“搜索引擎優化培訓”頁面。大多數關鍵詞研究工具都會吐出“搜索引擎優化培訓”、“搜索引擎優化培訓”等關鍵詞。
當你使用我將在后面介紹的TF-IDF工具時,你也可以在首頁上找到相關的非SEO術語,這些術語在使用常規關鍵詞研究之前你從未找到過。“法律”、“經驗”、“權利”和“實踐”等術語。單詞
不會出現在關鍵詞搜索工具中,因為文章本身不會對它們進行排名,但是它們需要講述搜索意圖的故事。
(PPC)=log(10,000,000/300,000)=1.52
(PPC)=0.12*1.52=0.182
TF(是)=(12/100)=0.12
現在,假設您想知道這種用法與網絡的其他部分相比如何。從10,000,000的樣本量來看,這些頁面中至少有一些是關于網絡服務的,并且會包含對PPC的引用。例如,30萬。
我們可以用這些數字來完成反文檔頻率方程。
IDF(是)=log(10,000,000/8,000,000)=0.09
現在,您可以使用TF-IDF公式根據這個術語
TF-IDF(是)=0.12*0.09=0.010
對頁面進行評分。事實是,這不是一個滿足限制的問題。你想在第一頁上用很好的網站來平衡目標詞的得分。
一個學期的高分不一定是件好事(究竟,100個單詞中有12個被大量使用)。
像“是”、“這個”或“和”這樣的常用詞怎么樣?由于方程的結構,這種噪聲不是真正的問題。
這些詞經常在整個文檔中使用,因此這些詞的重要性大大降低。
讓我們回到這個等式。為了真正說明這種差異,我們會說頁面上有同樣多的“是”和“PPC”。

結論010-59000
但是看看當我們完成IDF等式時會發生什么,我們知道大多數結果將包含單詞“是”,例如8,000,000。
010-59000010-59000
這將導致很終的TF-IDF值:
TF-IDF010-59000
TF-IDF值與文檔中使用的短語數成比例增加,但是在這種情況下,它被整個集合的其余部分中的單詞頻率所抵消,并且它的值得分與很后一個示例相同。
換句話說,這個詞越常見,IDF越小?!岸陶Z”怎么樣?
搜索引擎傾向于在單個術語上賦予多詞短語額外的權重。
考慮到語言的自然品質,這尤其正確。
當然,您希望使用這些考慮因素來執行TF-IDF評估。
幸運的是,你不需要額外的努力,大多數TF-IDF工具可以將關鍵詞計算成兩個詞和三個詞的版本。
當TF-IDF專門用于學術和研究目的時,該術語被計算為稱為雙字母組的兩個單詞組或稱為三字母組的三個單詞組。搜索引擎也是這樣做的,所以用和他們一樣的方式分析你的內容是非常重要的。
使用上一個PPC頁面的例子,讓我們看看可能出現在頁面上的短語以及這些短語可能對主題提出的建議。
“PPC廣告系列需要許多廣告”
這個短語中的每一組兩個單詞可以被計算為一組兩個字母的組合。
活動要求
活動要求
活動要求
當添加第三個單詞時,當考慮更長的短語時,將會更清楚地添加多少重要的上下文。
當添加第三個單詞時,當考慮更長的短語時,將會更清楚地添加多少重要的上下文。
PPC活動要求
活動要求
etc
當添加第三個單詞時,當考慮更長的短語時,將會更清楚地添加多少重要的上下文。
在開始構建內容之前,這是一種學習更多內容的方法,然后知道在哪里以及如何再次完善它。
一旦你選擇了工具,你只需要知道一步一步選擇每個關鍵詞的過程。假如您沒有選擇TF-IDF工具,您可以在下一節中找到我用它們執行的測試中的數據。
1)writecontent

按照您所知的很高標準編寫內容,或者引用您為客戶優化的內容。創建一個包含一個、兩個或三個單詞的主題列表,并將其添加到您選擇的TF-IDF工具中。
你的目標是找到關鍵詞和高級域名的網址,以揭示你遺漏了哪些主題,哪些主題你沒有深入討論過。
2)插入TF-IDF工具
每個工具的工作方式都有所不同,它們跟蹤不同的信息,但很有用的信息是幫助您了解競爭對手如何通過使用關鍵詞取得成功。
使用您選擇的工具的任何功能來幫助您找到與前10-20個網站相關聯的單詞,然后生成一個反映它所使用的每個其他單詞的權重的分數。
3)重新優化內容
現在,您已經完全理解了每個競爭對手的主題以及這些詞語的使用頻率,您可以使用這些信息來優化您自己的內容。
第二次交付內容,并找到一種自然的方式來介紹你還沒有涉及的主題。請記住,你的動機不是不自然的,而是為了恢復他們目前缺失的自然聯系。
4)發布
使用您很近從搜索中收集的見解發布更新的內容。從這里,你可以繼續分析它和排名的任何變化。

5)在TF-IDF圖之前和之后顯示
TF-IDF的好處之一是,它答應您在非常小的級別跟蹤性能。在每次內容調整之前和之后,您可以生成關于頁面上主題平衡如何變化的圖表。對于那些有愛好查看您對其內容所做更改的特定指標的客戶來說,這些非常有用。
TF-IDF工具
blogger只找到了一些針對谷歌等英文搜索引擎優化的TF-IDF工具,但目前還沒有針對中文的TF-IDF工具。
1.text-tools
2.ftf.agency
010-59000
我希望本文能幫助我們清楚地理解TF-IDF分析。
你不僅學會了它背后的數學,還學會了如何將它應用于搜索引擎優化,并在你的文章中創造相關性。
本文介紹了TF-IDF算法為什么對SEO很重要?的內容,希望對您有所幫助。以上分析只是冰山一角,僅供參考!
猜您喜歡
專業seo公司拾首選金手指五站內seo是什么SEO個人單頁武漢網絡接單佳選樂云seo十年魔貝凡seo課程怎么樣都勻網站優化推廣seoseo文章采集工具咸陽網站seo優化方案seo南沙seoseo培訓有用嗎seo按天計費系統源碼興化seo西安seo服務信陽seoseo優化招人分工鄭州網站制作效果樂云seo完美日記SEO優化建議什么是SEO思維武漢seo_三優面試自我介紹SEO廣州seo#1t宙斯di詞seo基礎教程毫金手指科杰五無錫seo公司排名鄭州seo軟件效果樂云seo品牌成都網站建設有名樂云seoseo公司 創業黑帽seo站群推送工具網站seo網站分析濟南騷東seo網站設計選擇樂云seoseo頁面優化外包人人都是seo總監壓提趁叔滾協舒其惡感柳浙牛卵竊益喜徑捐舊賭拍厘慰述露抬定未烏偵黨戶餓組子乳肢陪巧律察沖苗擺麥煎慎李醒販漁么返撇氏奇三腔谷18。TF-IDF算法為什么對SEO很重要。360seo優化軟件,通過簡書seo外鏈,新鄉seo優化軟件,無錫seo外包行者seo08
如果您覺得 TF-IDF算法為什么對SEO很重要 這篇文章對您有用,請分享給您的好友,謝謝!