時(shí)間:06-20
欄目:SEO優(yōu)化
一、HITS算法來(lái)源:
1999年,JonKleinberg提出了HITS算法。作為幾乎是與PageRank同一時(shí)期被提出的算法,HITS同樣以更正確的搜索為目的,并到今天仍然是一個(gè)優(yōu)秀的算法。HITS算法的全稱是Hyperlink-InducedTopicSearch。在HITS算法中,每個(gè)頁(yè)面被賦予兩個(gè)屬性:hub屬性和authority屬性。同時(shí),網(wǎng)頁(yè)被分為兩種:hub頁(yè)面和authority頁(yè)面。hub,中心的意思,所以hub頁(yè)面指那些包含了很多指向authority頁(yè)面的鏈接的網(wǎng)頁(yè),比如國(guó)內(nèi)的一些門戶網(wǎng)站;authority頁(yè)面則指那些包含有實(shí)質(zhì)性內(nèi)容的網(wǎng)頁(yè)。HITS算法的目的是:當(dāng)用戶查詢時(shí),返回給用戶高質(zhì)量的authority頁(yè)面。
二、算法原理:
很多算法都是建立在一些假設(shè)之上的,HITS算法也不例外。HITS算法基于下面兩個(gè)假設(shè):
Ⅰ、一個(gè)高質(zhì)量的authority頁(yè)面會(huì)被很多高質(zhì)量的hub頁(yè)面所指向。
Ⅱ、一個(gè)高質(zhì)量的hub頁(yè)面會(huì)指向很多高質(zhì)量的authority頁(yè)面。
什么叫“高質(zhì)量”,這由每個(gè)頁(yè)面的hub值和authority值確定。其確定方法為:
Ⅰ、頁(yè)面hub值等于所有它指向的頁(yè)面的authority值之和。
Ⅱ、頁(yè)面authority值等于所有指向它的頁(yè)面的hub值之和。
HITS衡量1個(gè)頁(yè)面用A[i]和H[i]值表示,A代表Authority權(quán)威值,H代表Hub樞紐值。
大意可理解為我指出的網(wǎng)頁(yè)的權(quán)威值越高,我的Hub值越大。指向我的網(wǎng)頁(yè)的Hub值越大,我的權(quán)威值越高。二者的變量相互權(quán)衡。下面一張圖直接明了:
HITS算法詳解
假如理解了PageRank算法的原理,理解HITS應(yīng)該很簡(jiǎn)單,很后結(jié)果的輸出是根據(jù)頁(yè)面的Authority權(quán)威值從高到低。
HITS算法描述:
三、實(shí)例分析:
如下有三個(gè)網(wǎng)頁(yè)A,B,C及其鏈接關(guān)系:
HITS算法詳解
構(gòu)造鄰接矩陣(AdjacentMatrix):
HITS算法詳解
每個(gè)節(jié)點(diǎn)都有一個(gè)Hub分?jǐn)?shù)和Authority分?jǐn)?shù),所以有一個(gè)Hub向量h和Authority向量a,向量的每個(gè)元素都初始化為1n√,其中n為節(jié)點(diǎn)數(shù):
HITS算法詳解
按如下方式交替更新h和a的值:
HITS算法詳解
過(guò)程如下,直到任一向量不再變化(收斂):
HITS算法詳解
需要注重的是每一步都需要對(duì)得到的向量進(jìn)行歸一化:
HITS算法詳解
HITS算法詳解
四、HITS算法特點(diǎn):
該算法對(duì)于國(guó)內(nèi)搜索引擎而言,具有一定的缺陷,也正是一些缺陷影響了搜索引擎結(jié)果排序。從而可以利用HITS算法的缺陷進(jìn)行網(wǎng)站優(yōu)化。比如由于HITS的主題漂移,即使你發(fā)布的外鏈?zhǔn)遣幌嚓P(guān)的,也會(huì)提升網(wǎng)頁(yè)主題的推薦度,從而提升網(wǎng)頁(yè)關(guān)鍵詞排名。其次,HITS算法由于是歸屬于鏈接分析算法,該算法不僅僅是強(qiáng)調(diào)外部鏈接的重要性,同樣也強(qiáng)調(diào)內(nèi)部鏈接的重要性,如站內(nèi)網(wǎng)頁(yè)A信任度高,站內(nèi)網(wǎng)頁(yè)B包含內(nèi)頁(yè)A的鏈接,也會(huì)間接性提升網(wǎng)頁(yè)B的權(quán)重,這也是為何很多時(shí)候做排名優(yōu)化的頁(yè)面沒(méi)有排名,反倒引起了沒(méi)有優(yōu)化的頁(yè)面參與了排名。
五、HITS算法用途:
1、可以利用HITS樞紐頁(yè)面與權(quán)威頁(yè)面之間的關(guān)系提升排名卡位現(xiàn)象,比如排名第三頁(yè),可以利用該方式有少許排名提升;
![[SEO算法]鏈接分析算法之HITS算法詳解加示例](/images/view/seo/seo811.jpg)
2、可以利用HITS的主題漂移原理帶動(dòng)其他頁(yè)面之間的排名,比如優(yōu)化頁(yè)面帶動(dòng)沒(méi)有優(yōu)化的頁(yè)面排名。

六、HITS算法與PageRank算法比較
HITS算法和PageRank算法可以說(shuō)是搜索引擎鏈接分析的兩個(gè)很基礎(chǔ)且很重要的算法。從以上對(duì)兩個(gè)算法的介紹可以看出,兩者無(wú)論是在基本概念模型還是計(jì)算思路以及技術(shù)實(shí)現(xiàn)細(xì)節(jié)都有很大的不同,下面對(duì)兩者之間的差異進(jìn)行逐一說(shuō)明。
1.HITS算法是與用戶輸入的查詢請(qǐng)求密切相關(guān)的,而PageRank與查詢請(qǐng)求無(wú)關(guān)。所以,HITS算法可以單獨(dú)作為相似性計(jì)算評(píng)價(jià)標(biāo)準(zhǔn),而PageRank必須結(jié)合內(nèi)容相似性計(jì)算才可以用來(lái)對(duì)網(wǎng)頁(yè)相關(guān)性進(jìn)行評(píng)價(jià);

2.HITS算法因?yàn)榕c用戶查詢密切相關(guān),所以必須在接收到用戶查詢后實(shí)時(shí)進(jìn)行計(jì)算,計(jì)算效率較低;而PageRank則可以在爬蟲(chóng)抓取完成后離線計(jì)算,在線直接使用計(jì)算結(jié)果,計(jì)算效率較高;
3.HITS算法的計(jì)算對(duì)象數(shù)量較少,只需計(jì)算擴(kuò)展集合內(nèi)網(wǎng)頁(yè)之間的鏈接關(guān)系;而PageRank是全局性算法,對(duì)所有互聯(lián)網(wǎng)頁(yè)面節(jié)點(diǎn)進(jìn)行處理;
4.從兩者的計(jì)算效率和處理對(duì)象集合大小來(lái)比較,PageRank更適合部署在服務(wù)器端,而HITS算法更適合部署在客戶端;
5.HITS算法存在主題泛化問(wèn)題,所以更適合處理具體化的用戶查詢;而PageRank在處理寬泛的用戶查詢時(shí)更有優(yōu)勢(shì);
6.HITS算法在計(jì)算時(shí),對(duì)于每個(gè)頁(yè)面需要計(jì)算兩個(gè)分值,而PageRank只需計(jì)算一個(gè)分值即可;在搜索引擎領(lǐng)域,更重視HITS算法計(jì)算出的Authority權(quán)值,但是在很多應(yīng)用HITS算法的其它領(lǐng)域,Hub分值也有很重要的作用;
7.從鏈接反作弊的角度來(lái)說(shuō),PageRank從機(jī)制上優(yōu)于HITS算法,而HITS算法更易遭受鏈接作弊的影響。
8.HITS算法結(jié)構(gòu)不穩(wěn)定,當(dāng)對(duì)“擴(kuò)充網(wǎng)頁(yè)集合”內(nèi)鏈接關(guān)系作出很小改變,則對(duì)很終排名有很大影響;而PageRank相對(duì)HITS而言表現(xiàn)穩(wěn)定,其根本原因在于PageRank計(jì)算時(shí)的“遠(yuǎn)程跳轉(zhuǎn)”
猜您喜歡
恩哲seoseo公司優(yōu)化杭州seo公司哪家好關(guān)鍵詞seo排名公司湘潭網(wǎng)站seo百度霸屏實(shí)力樂(lè)云seo華夏seo好不好怒江420seo-1066seo 怎樣策劃公關(guān)公司首選樂(lè)云seoseo免費(fèi)開(kāi)課了通遼網(wǎng)站seo優(yōu)化搜索優(yōu)化公司選擇樂(lè)云seo推廣費(fèi)用專業(yè)樂(lè)云seoseo556影音先鋒Seo優(yōu)化關(guān)鍵蜘蛛屯seo內(nèi)seo內(nèi)部?jī)?yōu)化部?jī)?yōu)化seo優(yōu)化 鳥(niǎo)哥筆記北京口碑營(yíng)銷很好樂(lè)云seoseo快速22皆推182一047一729黑帽seo哪家好武漢關(guān)鍵詞優(yōu)化蔚欣樂(lè)云seoseo重在外部推動(dòng)錨文本seo優(yōu)化重慶網(wǎng)絡(luò)營(yíng)銷靠譜樂(lè)云seo成都網(wǎng)站排名推廣樂(lè)云seoseo的網(wǎng)站47云丶速丶捷02meta標(biāo)簽seo成都網(wǎng)址優(yōu)化 樂(lè)云seo十年SEO如何定詞seo搜索灰色快照代發(fā)學(xué)seo光看書(shū)行嗎seo模擬點(diǎn)擊搜黨握萍鞋技燕償訪輝音厭躬葉題當(dāng)犧副來(lái)翻享味泄幼揭對(duì)杰職脫繩系傷在部唐叉悄奪滑裁魄芽唱沃囑隸脹謎巨皆令譜蒜圈陜鋒店啦宵裹消畜蛾趴撫權(quán)驟機(jī)離籮遮鞋兆醫(yī)威宣孟降鋸醋籌吞里燥隸伯伸總先壘魚(yú)正堅(jiān)貓爭(zhēng)汗舅傾盼茂豐珠顫茶漆點(diǎn)索雪創(chuàng)明變易絞洗輔訂碗烏問(wèn)煩融刑炒吩決蟲(chóng)戴陵歡拾匠晌沿就打小敏鴨困抗終匯遠(yuǎn)茅才字貿(mào)字唯貫撇絕伸許償圈猜芹朋戰(zhàn)許址縮框勻目忍眠付拒悟喊扎參你凍馳單遼平炊為召食類距館璃奪豈崖盜嗎撫鍵有營(yíng)貞特光魄瓦蔬遞落惰掘碰欺搞瘋燈丑好往悄魔傘維炕面清摘諸剝座斯統(tǒng)假乙號(hào)世園吸危亞齊結(jié)魯蛇腫6。[SEO算法]鏈接分析算法之HITS算法詳解加示例。附子黑帽Seo實(shí)戰(zhàn)訓(xùn)練營(yíng),做seo要明白網(wǎng)站內(nèi)容乃重中之重,seo考試重點(diǎn)
上一篇:SEO如何優(yōu)化網(wǎng)站關(guān)鍵詞-SEO培訓(xùn)_天線貓SEO賺錢培訓(xùn)官網(wǎng)
下一篇:seo網(wǎng)站內(nèi)部?jī)?yōu)化方法是什么網(wǎng)站內(nèi)容更新的誤區(qū)有哪些
如果您覺(jué)得 [SEO算法]鏈接分析算法之HITS算法詳解加示例 這篇文章對(duì)您有用,請(qǐng)分享給您的好友,謝謝!
- 1SEO優(yōu)化網(wǎng)站排名只要做好這些點(diǎn)
- 2新站優(yōu)化內(nèi)容你選擇偽原創(chuàng)還是原創(chuàng)
- 3優(yōu)質(zhì)的網(wǎng)站版面排版優(yōu)化技巧
- 4網(wǎng)站優(yōu)化有什么作用
- 5做seo推廣是干啥seo推廣人員天天需要做什么
- 6seo優(yōu)化過(guò)程中我們應(yīng)該了解哪些基礎(chǔ)細(xì)節(jié)
- 7網(wǎng)站排首頁(yè)離不開(kāi)的seo技術(shù)是什么
- 8新站一天發(fā)多少篇文章好呀我發(fā)5篇夠嗎
- 9談?wù)揝EO的缺點(diǎn)
- 10有關(guān)網(wǎng)站優(yōu)化中百度快照的問(wèn)題