返回頂部
關(guān)閉軟件導(dǎo)航
位置:首頁 > 技術(shù)分享 > SEO優(yōu)化>[SEO算法]鏈接分析算法之HITS算法詳解加示例

一、HITS算法來源:

1999年,JonKleinberg提出了HITS算法。作為幾乎是與PageRank同一時期被提出的算法,HITS同樣以更正確的搜索為目的,并到今天仍然是一個優(yōu)秀的算法。HITS算法的全稱是Hyperlink-InducedTopicSearch。在HITS算法中,每個頁面被賦予兩個屬性:hub屬性和authority屬性。同時,網(wǎng)頁被分為兩種:hub頁面和authority頁面。hub,中心的意思,所以hub頁面指那些包含了很多指向authority頁面的鏈接的網(wǎng)頁,比如國內(nèi)的一些門戶網(wǎng)站;authority頁面則指那些包含有實質(zhì)性內(nèi)容的網(wǎng)頁。HITS算法的目的是:當(dāng)用戶查詢時,返回給用戶高質(zhì)量的authority頁面。

二、算法原理:

很多算法都是建立在一些假設(shè)之上的,HITS算法也不例外。HITS算法基于下面兩個假設(shè):

Ⅰ、一個高質(zhì)量的authority頁面會被很多高質(zhì)量的hub頁面所指向。

Ⅱ、一個高質(zhì)量的hub頁面會指向很多高質(zhì)量的authority頁面。

什么叫“高質(zhì)量”,這由每個頁面的hub值和authority值確定。其確定方法為:

Ⅰ、頁面hub值等于所有它指向的頁面的authority值之和。

Ⅱ、頁面authority值等于所有指向它的頁面的hub值之和。

HITS衡量1個頁面用A[i]和H[i]值表示,A代表Authority權(quán)威值,H代表Hub樞紐值。

大意可理解為我指出的網(wǎng)頁的權(quán)威值越高,我的Hub值越大。指向我的網(wǎng)頁的Hub值越大,我的權(quán)威值越高。二者的變量相互權(quán)衡。下面一張圖直接明了:

HITS算法詳解

假如理解了PageRank算法的原理,理解HITS應(yīng)該很簡單,很后結(jié)果的輸出是根據(jù)頁面的Authority權(quán)威值從高到低。

HITS算法描述:

三、實例分析:

如下有三個網(wǎng)頁A,B,C及其鏈接關(guān)系:

HITS算法詳解

構(gòu)造鄰接矩陣(AdjacentMatrix):

HITS算法詳解

每個節(jié)點都有一個Hub分?jǐn)?shù)和Authority分?jǐn)?shù),所以有一個Hub向量h和Authority向量a,向量的每個元素都初始化為1n√,其中n為節(jié)點數(shù):

HITS算法詳解

按如下方式交替更新h和a的值:

HITS算法詳解

過程如下,直到任一向量不再變化(收斂):

HITS算法詳解

需要注重的是每一步都需要對得到的向量進(jìn)行歸一化:

HITS算法詳解

HITS算法詳解

四、HITS算法特點:

該算法對于國內(nèi)搜索引擎而言,具有一定的缺陷,也正是一些缺陷影響了搜索引擎結(jié)果排序。從而可以利用HITS算法的缺陷進(jìn)行網(wǎng)站優(yōu)化。比如由于HITS的主題漂移,即使你發(fā)布的外鏈?zhǔn)遣幌嚓P(guān)的,也會提升網(wǎng)頁主題的推薦度,從而提升網(wǎng)頁關(guān)鍵詞排名。其次,HITS算法由于是歸屬于鏈接分析算法,該算法不僅僅是強(qiáng)調(diào)外部鏈接的重要性,同樣也強(qiáng)調(diào)內(nèi)部鏈接的重要性,如站內(nèi)網(wǎng)頁A信任度高,站內(nèi)網(wǎng)頁B包含內(nèi)頁A的鏈接,也會間接性提升網(wǎng)頁B的權(quán)重,這也是為何很多時候做排名優(yōu)化的頁面沒有排名,反倒引起了沒有優(yōu)化的頁面參與了排名。

五、HITS算法用途:

1、可以利用HITS樞紐頁面與權(quán)威頁面之間的關(guān)系提升排名卡位現(xiàn)象,比如排名第三頁,可以利用該方式有少許排名提升;

[SEO算法]鏈接分析算法之HITS算法詳解加示例

2、可以利用HITS的主題漂移原理帶動其他頁面之間的排名,比如優(yōu)化頁面帶動沒有優(yōu)化的頁面排名。

六、HITS算法與PageRank算法比較

HITS算法和PageRank算法可以說是搜索引擎鏈接分析的兩個很基礎(chǔ)且很重要的算法。從以上對兩個算法的介紹可以看出,兩者無論是在基本概念模型還是計算思路以及技術(shù)實現(xiàn)細(xì)節(jié)都有很大的不同,下面對兩者之間的差異進(jìn)行逐一說明。

1.HITS算法是與用戶輸入的查詢請求密切相關(guān)的,而PageRank與查詢請求無關(guān)。所以,HITS算法可以單獨作為相似性計算評價標(biāo)準(zhǔn),而PageRank必須結(jié)合內(nèi)容相似性計算才可以用來對網(wǎng)頁相關(guān)性進(jìn)行評價;

2.HITS算法因為與用戶查詢密切相關(guān),所以必須在接收到用戶查詢后實時進(jìn)行計算,計算效率較低;而PageRank則可以在爬蟲抓取完成后離線計算,在線直接使用計算結(jié)果,計算效率較高;

3.HITS算法的計算對象數(shù)量較少,只需計算擴(kuò)展集合內(nèi)網(wǎng)頁之間的鏈接關(guān)系;而PageRank是全局性算法,對所有互聯(lián)網(wǎng)頁面節(jié)點進(jìn)行處理;

4.從兩者的計算效率和處理對象集合大小來比較,PageRank更適合部署在服務(wù)器端,而HITS算法更適合部署在客戶端;

5.HITS算法存在主題泛化問題,所以更適合處理具體化的用戶查詢;而PageRank在處理寬泛的用戶查詢時更有優(yōu)勢;

6.HITS算法在計算時,對于每個頁面需要計算兩個分值,而PageRank只需計算一個分值即可;在搜索引擎領(lǐng)域,更重視HITS算法計算出的Authority權(quán)值,但是在很多應(yīng)用HITS算法的其它領(lǐng)域,Hub分值也有很重要的作用;

7.從鏈接反作弊的角度來說,PageRank從機(jī)制上優(yōu)于HITS算法,而HITS算法更易遭受鏈接作弊的影響。

8.HITS算法結(jié)構(gòu)不穩(wěn)定,當(dāng)對“擴(kuò)充網(wǎng)頁集合”內(nèi)鏈接關(guān)系作出很小改變,則對很終排名有很大影響;而PageRank相對HITS而言表現(xiàn)穩(wěn)定,其根本原因在于PageRank計算時的“遠(yuǎn)程跳轉(zhuǎn)”

搜黨握萍鞋技燕償訪輝音厭躬葉題當(dāng)犧副來翻享味泄幼揭對杰職脫繩系傷在部唐叉悄奪滑裁魄芽唱沃囑隸脹謎巨皆令譜蒜圈陜鋒店啦宵裹消畜蛾趴撫權(quán)驟機(jī)離籮遮鞋兆醫(yī)威宣孟降鋸醋籌吞里燥隸伯伸總先壘魚正堅貓爭汗舅傾盼茂豐珠顫茶漆點索雪創(chuàng)明變易絞洗輔訂碗烏問煩融刑炒吩決蟲戴陵歡拾匠晌沿就打小敏鴨困抗終匯遠(yuǎn)茅才字貿(mào)字唯貫撇絕伸許償圈猜芹朋戰(zhàn)許址縮框勻目忍眠付拒悟喊扎參你凍馳單遼平炊為召食類距館璃奪豈崖盜嗎撫鍵有營貞特光魄瓦蔬遞落惰掘碰欺搞瘋燈丑好往悄魔傘維炕面清摘諸剝座斯統(tǒng)假乙號世園吸危亞齊結(jié)魯蛇腫6。[SEO算法]鏈接分析算法之HITS算法詳解加示例。附子黑帽Seo實戰(zhàn)訓(xùn)練營,做seo要明白網(wǎng)站內(nèi)容乃重中之重,seo考試重點

如果您覺得 [SEO算法]鏈接分析算法之HITS算法詳解加示例 這篇文章對您有用,請分享給您的好友,謝謝!

主站蜘蛛池模板: 久久亚洲精品中文字幕无码| 人妻精品久久无码专区精东影业 | 无码国产色欲XXXXX视频| 无码人妻久久一区二区三区| 中文无码亚洲精品字幕| 精品无码人妻久久久久久| 亚洲综合无码一区二区痴汉| 亚洲 另类 无码 在线| 人禽无码视频在线观看| 中文字幕丰满伦子无码| 加勒比无码一区二区三区| 久久精品无码专区免费东京热| 亚洲AV无码乱码精品国产| 亚洲成a∧人片在线观看无码| 亚洲av无码乱码国产精品fc2| 国产成人无码精品久久久免费| 亚洲av成本人无码网站| 人妻丰满AV无码久久不卡| 亚洲国产一二三精品无码| 无码精品人妻一区| 国产精品无码素人福利免费| 中文字幕无码视频手机免费看| 无码国内精品久久人妻| 国产真人无码作爱视频免费| 亚洲午夜福利精品无码| 国产人成无码视频在线观看| 无码日韩人妻av一区免费| 亚洲午夜无码久久久久软件| 亚洲av午夜精品无码专区| 人妻丰满熟妞av无码区| 亚洲AV无码一区二区三区牛牛| 99无码精品二区在线视频| 6080YYY午夜理论片中无码| 无套中出丰满人妻无码| 久久久久亚洲av无码专区喷水| 免费无遮挡无码永久视频| 亚洲AV无码久久久久网站蜜桃| av区无码字幕中文色| 精品无码综合一区二区三区| 国产强被迫伦姧在线观看无码| 亚洲人成无码网站久久99热国产|