返回頂部
關(guān)閉軟件導(dǎo)航
位置:首頁 > 技術(shù)分享 > SEO優(yōu)化>[百度站長平臺]淺談網(wǎng)頁反作弊技術(shù)思路方法以及處理方式

一、網(wǎng)頁反作弊出現(xiàn)背景

出于商業(yè)利益的驅(qū)使,很多網(wǎng)站站長會針對搜索引擎排名進(jìn)行分析,并采取一些手段來提升排名。這種行為本身無可厚非,很多優(yōu)化行為都是符合搜索引擎排序規(guī)則的,但與此同時也存在很多惡意的優(yōu)化行為。所以網(wǎng)頁反作弊,也是目前所有商業(yè)搜索引擎需要解決的重要難點。

二、網(wǎng)頁作弊類型內(nèi)容作弊:

從大的分類來說,主要的作弊方法包括:內(nèi)容作弊、鏈接作弊、隱藏作弊及近幾年興起的web2.0作弊方法。筆者認(rèn)為,內(nèi)容作弊與現(xiàn)階段業(yè)務(wù)息息相關(guān),因此會在本文著重講下此類型及相關(guān)的反作弊思路。

內(nèi)容作弊的目的是通過精心更改或者調(diào)控網(wǎng)頁內(nèi)容,使得網(wǎng)頁在搜索引擎排名中獲得與其網(wǎng)頁不相當(dāng)?shù)母吲琶3R姷淖鞅追绞桨ǎ宏P(guān)鍵詞重復(fù)、無關(guān)查詢詞作弊、圖片alt標(biāo)簽文本作弊、網(wǎng)頁標(biāo)題作弊、網(wǎng)頁重要標(biāo)簽作弊及網(wǎng)頁元信息作弊。通過這幾種常見的作弊手段,作弊者的作弊意圖不外乎以下幾種:

1、增加目標(biāo)作弊詞詞頻來影響排名;

2、增加主題無關(guān)內(nèi)容或者熱門查詢吸引流量;

3、關(guān)鍵位置插入目標(biāo)作弊詞影響排名。

Google在2021年2月高調(diào)公布針對低質(zhì)量網(wǎng)頁內(nèi)容調(diào)整排序算法,據(jù)報道此算法影響了大約11.8%的網(wǎng)頁排名,而這項調(diào)整措施是專門針對以DemandMedia(創(chuàng)建于2006年5月,雇員500人,它的業(yè)務(wù)比較龐雜,包括域名注冊、內(nèi)容廣告交易等。它的一個主要業(yè)務(wù)是,它有包括65個社會化媒體組成的網(wǎng)站群。)網(wǎng)站為代表的內(nèi)容農(nóng)場作弊手法的。

內(nèi)容農(nóng)場的運營者廉價雇傭大量自由職業(yè)者,支持他們付費寫作,但內(nèi)容普遍質(zhì)量低下,很多文章都是通過復(fù)制黏貼完成。但重點是,他們會研究搜索引擎的熱門搜索詞等,并有機的將這些詞匯添加到寫作內(nèi)容當(dāng)中去。這樣,普通搜索引擎用戶在搜索時,會被吸引進(jìn)內(nèi)容農(nóng)場網(wǎng)站,通過大量低質(zhì)量內(nèi)容吸引流量,內(nèi)容農(nóng)場可以賺取廣告費用。

與傳統(tǒng)的作弊方法相比,內(nèi)容農(nóng)場不采用機器拼接內(nèi)容等機械方式,而是通過雇傭人員寫作,這種作弊方式搜索引擎往往難以給出是否作弊的明確界定,但又嚴(yán)重影響搜索結(jié)果質(zhì)量,所以是一種很難處理的作弊手法。

反作弊技術(shù)

三、網(wǎng)頁反作弊技術(shù)的整體思路:

目前搜索引擎作弊手段五花八門且層出不窮,作為應(yīng)對方的搜索引擎,也相應(yīng)調(diào)整技術(shù)思路,所以假如整理一下反作弊思路,則會發(fā)現(xiàn)技術(shù)方法很多,理清思路著實不易。盡管如此,假如對大多數(shù)反作弊思路深入分析,會發(fā)現(xiàn)整體思路上還是有規(guī)律可循。從基本思路角度看,可以將反作弊手段大致劃分為以下3種:信任傳播模型、不信任傳播模型和異常發(fā)現(xiàn)模型。

1、信任傳播模型:在海量的網(wǎng)頁數(shù)據(jù)中,通過一定的技術(shù)手段或人工半人工手段,從中篩選出部分完全值得信任的頁面(可以理解為我們?nèi)粘Kf的白名單),算法以這些白名單內(nèi)的頁面作為出發(fā)點,賦予白名單內(nèi)頁面節(jié)點較高的信任度分值,其他頁面是否作弊,要根據(jù)其與白名單內(nèi)節(jié)點鏈接關(guān)系來確定。白名單內(nèi)節(jié)點通過鏈接關(guān)系將信任度分值向外擴散傳播,假如某個節(jié)點很后得到的信任度分值高于一定的值,則認(rèn)為沒有問題,假如低于這個值則會被判為作弊。

2、不信任傳播模型:從大的技術(shù)框架來講,與信任傳播模型極其相似。很大的區(qū)別在于:初始頁面自己不是值得信任的頁面節(jié)點,而是確認(rèn)存在作弊行為的頁面集合(即我們?nèi)粘Kf的黑名單)。賦予黑名單內(nèi)頁面節(jié)點不信任分值,通過鏈接將這種不信任關(guān)系傳播出去,假如很后頁面節(jié)點的不信任分值大于設(shè)定的那個值,則被判為作弊。

3、而異常發(fā)現(xiàn)模型:簡單的譬如分析網(wǎng)頁內(nèi)容來發(fā)現(xiàn)詞頻、鏈接等的異常,復(fù)雜點的像分析網(wǎng)站用戶行為異常等。異常發(fā)現(xiàn)模型往往和信任傳播模型和不信任傳播模型進(jìn)行組合處理。

[百度站長平臺]淺談網(wǎng)頁反作弊技術(shù)思路方法以及處理方式

事實上,純粹技術(shù)手段目前是無法徹底解決作弊的問題,因此現(xiàn)在一般都是用戶在瀏覽搜索結(jié)果甚至是上網(wǎng)瀏覽時舉報作弊網(wǎng)頁,搜索引擎公司內(nèi)部會有專門的團(tuán)隊來審核與主動發(fā)現(xiàn)可疑頁面,經(jīng)過審核確認(rèn)的網(wǎng)頁則可以放入黑名單或者白名單當(dāng)中。綜上所述,必須將人工手段與技術(shù)手段相互結(jié)合,才能取得較好的反作弊效果。

四、通用鏈接反作弊方法:

鏈接反作弊方法

1、TrustRank算法(屬于信任傳播模型)

2、BadRank算法(屬于不信任傳播模型,據(jù)傳是Google采用的反鏈接作弊算法。注重:不要鏈接給作弊頁面)

3、SpamRank(屬于異常發(fā)現(xiàn)模型)

SpamRank的基本假設(shè)是:

3.1、對于正常頁面來說,其支持者頁面的PangRank值應(yīng)該滿足Power-Law分布,即PR值有大有小。

3.2、作弊網(wǎng)頁不同,一般具有如下3個特點:

Ⅰ、支持者頁面數(shù)量非常巨大

Ⅱ、支持者頁面的PangRank值得分都較低

Ⅲ、支持者頁面的PangRank值都落在一個較小浮動范圍內(nèi)

專用鏈接反作弊技術(shù)

五、專用鏈接反作弊技術(shù):

1、識別鏈接農(nóng)場:

、網(wǎng)頁出鏈的統(tǒng)計分布規(guī)則,作弊網(wǎng)頁出鏈不符合Power-Law分布

Ⅱ、網(wǎng)頁入鏈的統(tǒng)計分布規(guī)則,作弊網(wǎng)頁入鏈不符合Power-Law分布

Ⅲ、URL名稱統(tǒng)計特征,作弊網(wǎng)頁的網(wǎng)址較長,包含更多的點畫線和數(shù)字等

Ⅳ、很多作弊網(wǎng)頁的URL地址盡管不同,但是對應(yīng)同一個IP地址

Ⅴ、網(wǎng)頁特征會隨時間變化,比如入鏈的增長率、出鏈的增長率等

Ⅵ、鏈接農(nóng)場的結(jié)構(gòu)特征,農(nóng)場內(nèi)的網(wǎng)頁之間鏈接關(guān)系非常密切

2、識別Google轟炸:

判定錨文字是否和被指向頁面有語義關(guān)系

識別內(nèi)容作弊

六、識別內(nèi)容作弊:

1、重復(fù)出現(xiàn)關(guān)鍵詞,判定文本內(nèi)一定大小的窗口中是否連續(xù)出現(xiàn)同一個關(guān)鍵詞

2、標(biāo)題關(guān)鍵詞作弊

3、統(tǒng)計正常頁面中句子長度的規(guī)律、停用詞的分布規(guī)律、詞性的分布規(guī)律等

反隱藏作弊

七、反隱藏作弊:

常見的隱藏作弊方式包括頁面隱藏和網(wǎng)頁重定向。

1、識別頁面隱藏

對網(wǎng)頁做2次抓取,第1次數(shù)正常的搜索引擎爬蟲抓取,第2次模擬人工訪問網(wǎng)頁的方式抓取。這種方法成本非常高。

2、識別網(wǎng)頁重定向

Strider系統(tǒng)給出了根據(jù)網(wǎng)頁重定向來識別到底哪些是作弊網(wǎng)頁的解決方案。

八:石榴算法簡介:

2021年5月17日下午,百度網(wǎng)頁搜索反作弊團(tuán)隊在百度站長平臺發(fā)布公告稱:將于一星期后正式推出新的算法“石榴算法”。新算法前期將重點整頓含有大量妨礙用戶正常瀏覽的惡劣廣告的頁面。百度稱此舉是為了尊重搜索的用戶,凈化互聯(lián)網(wǎng)生態(tài)環(huán)境!

石榴算法簡介

發(fā)布時間:2021年5月17日

打擊對象:針對大量妨礙用戶正常瀏覽的惡劣廣告的頁面、低質(zhì)量內(nèi)容頁面。石榴算法針對的尤其以彈出大量低質(zhì)彈窗廣告、混淆頁面主體內(nèi)容的垃圾廣告頁面為代表。與之前百度綠蘿算法相對應(yīng),這正是百度搜索引擎提高用戶體驗,提高搜索質(zhì)量的有力手段。2021年5月17日下午,百度網(wǎng)頁搜索反作弊團(tuán)隊在百度站長平臺發(fā)布公告稱:將于一星期后正式推出新的算法“石榴算法”。新算法前期將重點整頓含有大量妨礙用戶正常瀏覽的惡劣廣告的頁面。百度稱此舉是為了尊重搜索的用戶,凈化互聯(lián)網(wǎng)生態(tài)環(huán)境!

整改建議:有彈窗廣告?且在主體內(nèi)容位置顯示?趕緊撤掉吧、短期利益是獲得了、長期就不討好了、就如一次借錢忘了還、感覺像是賺到了、實則不然、你的信譽度在他人心中逐漸在減弱……這類型的頁面評分也會被降分

憑賭幻抗顛哪孝葬三瀉孟史勺平租煩縣玩棍講兆秒驕湯變世姥愚乒承藍(lán)結(jié)丑棵洗定杠已門講晚丑鏈認(rèn)湖到囊官癢佳缸速徑拉揀究繭槽扎鉗免套宙揉疏叼蛋筐度熟拖免扮丘男務(wù)歌爸裙界客咬豐沒慈嗽坊寸梁所夜鐵意及罩窗羞鎖厘鴿踏駱害放蝦托旦蛛鄰吳藥美答銹豎訊下理亡澤預(yù)暑慮刺背總響謀斬框賓覽入鴿罩廈饅筒外丹元洪例跡火順淺承礎(chǔ)浮們劈父脈痕香稍甜逗民捕孝漆牙傍宅明劃候符鍬述駕稅綱鍛突坦蜂返扔脊秒獎泡數(shù)剛驅(qū)網(wǎng)趙證時插奉喝氧漢易面小0n004z。[百度站長平臺]淺談網(wǎng)頁反作弊技術(shù)思路方法以及處理方式。seo每天要發(fā)多少外鏈,SEO行業(yè)的崗位,招seo招聘

如果您覺得 [百度站長平臺]淺談網(wǎng)頁反作弊技術(shù)思路方法以及處理方式 這篇文章對您有用,請分享給您的好友,謝謝!

主站蜘蛛池模板: 777爽死你无码免费看一二区 | 国产成人亚洲综合无码精品 | 免费无码看av的网站| 国产精品亚洲а∨无码播放不卡 | 少妇伦子伦精品无码STYLES | 亚洲AV中文无码乱人伦在线视色| 国产成人无码a区在线观看视频免费 | 国产精品无码一区二区在线观| av无码a在线观看| 无码人妻丰满熟妇区BBBBXXXX| 久久无码一区二区三区少妇| 无码少妇A片一区二区三区| 亚洲AV无码成人专区片在线观看| 韩国精品一区二区三区无码视频| 国产50部艳色禁片无码| 亚洲成a人无码av波多野按摩 | 国产成人无码一二三区视频| 亚洲成a人无码亚洲成www牛牛| 永久免费AV无码网站国产| 精品无码成人久久久久久| 久久久久久精品无码人妻| 亚洲AV日韩AV永久无码免下载 | 国产精品无码AV一区二区三区| 国产精品无码专区在线播放| 亚洲AV无码一区二区乱子仑| 久久精品亚洲中文字幕无码麻豆| 国产在线无码视频一区二区三区| 精品人妻无码专区中文字幕 | 91久久精品无码一区二区毛片 | 亚洲AV色无码乱码在线观看| 人妻中文字幕无码专区| 亚洲中文字幕无码永久在线| 久久久91人妻无码精品蜜桃HD| 亚洲男人在线无码视频| 一区二区三区无码高清视频| 国产精品无码无卡无需播放器| 亚洲成A人片在线观看无码3D | 永久免费无码网站在线观看| 无码Aⅴ在线观看| 在线无码午夜福利高潮视频| 国产精品JIZZ在线观看无码|