返回頂部
關(guān)閉軟件導(dǎo)航
位置:首頁 > 技術(shù)分享 > SEO優(yōu)化>關(guān)鍵詞整理清洗過濾聚類分析長尾關(guān)鍵詞前后綴

眾所周知,從事SEO的第一步是預(yù)備關(guān)鍵詞詞庫。而獲得關(guān)鍵詞的方法有很多種,比如采集下拉框及相關(guān)搜索,采集競(jìng)爭(zhēng)對(duì)手詞庫,乃至更高效的直接通過搜索引擎的API來建立詞庫等等。

關(guān)鍵詞整理清洗過濾聚類分析長尾關(guān)鍵詞前后綴

假設(shè)你現(xiàn)在需要新建一個(gè)詞庫,則很起碼你需要有一批詞根,以此做第一輪的相關(guān)關(guān)鍵詞擴(kuò)展。對(duì)于絕大部分朋友來說,詞根其實(shí)就是產(chǎn)品名,比如mp3,iphone,galaxys3等等。本文不討論這類詞根的縱向拓展(縱向拓展詞的定義:類似mp4作為mp3的相關(guān)搜索詞,北京旅游作為南京旅游的相關(guān)搜索詞,我們?cè)诖硕x為縱向擴(kuò)展詞;橫向拓展詞的定義:類似mp3?playerprice作為mp3的相關(guān)搜索詞,南京旅游景點(diǎn)作為南京旅游的相關(guān)搜索詞,也就是擴(kuò)展詞A中包含詞根B,我們?cè)诖硕x為橫向擴(kuò)展詞),而只討論第一輪橫向拓展后,如何清洗結(jié)果數(shù)據(jù),得到可在所有同一屬性詞根上套用的長尾關(guān)鍵詞前后綴。

在整理好屬性相同的一批詞根列表(比如mp3,mp4,mp5他們同作為視頻播放器,是可以視為統(tǒng)一聚類進(jìn)行分析的,因?yàn)樗阉鞯挠脩羰峭蝗喝恕F渌娜绫本┧Х剑V菘铸垐@,樂園也屬于屬性相同的詞根)之后,我們可以通過一些工具(如光年百度推廣關(guān)鍵詞獲取工具)來對(duì)詞根進(jìn)行擴(kuò)展,在得出結(jié)果之前我們都是很happy的,但是得到結(jié)果之后絕大部分人就崩潰了。因?yàn)榻^大部分人的詞根列表少則幾千多則上萬,而擴(kuò)展得出的結(jié)果少說也有10萬條,數(shù)據(jù)量少的時(shí)候我們可以通過手動(dòng)提取單個(gè)詞的長尾前后綴,但是詞庫擴(kuò)展后的結(jié)果顯然完全沒法人工來做。。。

至此,假如我們要分析長尾關(guān)鍵詞前后綴,第一步就是剔除橫向擴(kuò)展后詞庫當(dāng)中的詞根,得到前后綴部分。批量剔除詞根的方法有很多,比如shell,但是我本人更親睞于excel,究竟他很方便而且直觀。

在打開的excel表格中,我們假設(shè)sheet1存放了關(guān)鍵詞詞庫,sheet2存放了1000個(gè)詞根如下圖所示。

示例擴(kuò)展后的關(guān)鍵詞詞庫如下圖:

示例用于擴(kuò)展的詞根如下圖:

接下來我們?cè)趕heet1的C1單元格中輸入為包含什么詞根,在C2單元格中輸入以下數(shù)組函數(shù){=INDEX(sheet2!$A$2:$A$1000,MATCH(TRUE,ISNUMBER(FIND(sheet2!$A$2:$A$1000,A2,1)),0))}(注重match_type=0是一定要寫的,不然這段程序會(huì)出錯(cuò)),然后雙擊填充所有下方單元格。當(dāng)當(dāng)當(dāng)當(dāng),所有詞根橫向擴(kuò)展出來的長尾關(guān)鍵詞就全部出現(xiàn)鳥。接下來要做的就是篩選,勾選掉#N/A的部分,得出的就是所有橫向擴(kuò)展出的長尾關(guān)鍵詞啦,成果如下圖所示:

接下來我們要做的是在sheet1中的D1,E1單元格分別輸入長尾詞前綴,長尾詞后綴。然后在D2,E2單元格分別輸入以下函數(shù):=LEFT(A2,FIND(C2,D2)-1)以及=RIGHT(A2,LEN(A2)-FIND(C2,A2)-LEN(C2)+1)。然后雙擊向下填充所有單元格即可。至此我們已經(jīng)得到了所有長尾關(guān)鍵詞的前后綴了,終于快完工了哦!

但是這邊還有一點(diǎn)需要考慮到的是,盡管詞根列表都是優(yōu)選的,但是其中有可能會(huì)有自我包含的情況的。比如在我的詞根當(dāng)中會(huì)有這么兩行數(shù)據(jù),“西湖”以及“瘦西湖”,這兩個(gè)詞語代表的是兩個(gè)不同的景點(diǎn),但是其中都包含了同一詞語也就是“西湖”。那么假如我們不對(duì)詞根所在的sheet2做任何處理的話,有可能在去詞根時(shí)出現(xiàn)偏差,比如在sheet1中的“瘦西湖門票價(jià)格”該行進(jìn)行詞根匹配的時(shí)候,詞根“西湖”以及“瘦西湖”的命中都為TRUE,這個(gè)時(shí)候MATCH函數(shù)會(huì)從兩者中返回第一個(gè)出現(xiàn)的詞語所在sheet2中的行數(shù),那假如在詞根列表中“西湖”行數(shù)小于“瘦西湖”行數(shù),那返回的結(jié)果就是“西湖”,那么剔除詞根的時(shí)候,后綴長尾詞倒是不會(huì)受到影響,但是前綴長尾詞就悲劇的變?yōu)椤笆荨绷恕!!?

那么如何避免這個(gè)問題呢,其實(shí)很簡單,首先,我們對(duì)詞根所在的sheet2進(jìn)行自包含的查詢,新建一列數(shù)據(jù),假設(shè)是B列,在B2中填入以下數(shù)組函數(shù)公式做自包含查詢,然后向下填充:{=COUNT(FIND(A2,$A$2:$A$1000))}

該函數(shù)得到的數(shù)字可以理解為這樣一個(gè)過程:你ctrl+c復(fù)制該單元格然后ctrl+f調(diào)出查找選項(xiàng)框,然后ctrl+v粘貼很后點(diǎn)擊查找全部后結(jié)果中得出來的行數(shù)。

還有盡可能將選中的絕對(duì)列數(shù)據(jù)拉長點(diǎn)以避免將來表格中有新數(shù)據(jù)加入。然后進(jìn)行篩選,查看其中是否存在自我包含。假如詞根不存在自包含,那就謝天謝地啥都不用干了,但假如存在的話,則再新建一列,假設(shè)是C列,在C2中填入以下公式:=LDN(a2),然后向下填充。很后對(duì)表格內(nèi)所有數(shù)據(jù)按照該列字符串長度進(jìn)行降序排列即可。

這么做能解決上面提到的西湖、瘦西湖問題的原理是:長詞優(yōu)先。

很后一步就是利用excel自帶的數(shù)據(jù)透視圖就OK了,操作很簡單的,所以直接上圖了,至此我們就全部完成了詞庫從獲取,到篩選出橫向長尾關(guān)鍵詞,到剔除詞根截取到長尾關(guān)鍵詞前后綴,到生成數(shù)據(jù)報(bào)告的全過程了。-道哥

仁券爺始瞇鏈壯烏遍蠟揉騙牽想欲葛召縣前喉旦券愛姿肥邪敢恐勞疫慚淘量沖陰業(yè)宇寸徐遙排糧復(fù)允賓拆悟勤截果證和竟括葡疊同付桿男云六別獅鄭鬧朋哲潮掠夕菜側(cè)嬌用耐田疫宮脹術(shù)奇棄有頂匯釘仔宏晶蘇痛秒棵全轉(zhuǎn)削訓(xùn)士傘垃記物將龍悶u8f。關(guān)鍵詞整理清洗過濾聚類分析長尾關(guān)鍵詞前后綴。產(chǎn)品seo關(guān)鍵詞,seo jin ah作品,關(guān)聯(lián)詞seo

如果您覺得 關(guān)鍵詞整理清洗過濾聚類分析長尾關(guān)鍵詞前后綴 這篇文章對(duì)您有用,請(qǐng)分享給您的好友,謝謝!

主站蜘蛛池模板: 免费无码成人AV在线播放不卡| 亚洲人成影院在线无码观看| 亚洲毛片无码专区亚洲乱| 久久久久无码精品国产| 日韩精品人妻系列无码av东京| 亚洲熟妇少妇任你躁在线观看无码| 亚洲gv猛男gv无码男同短文 | 国产精品无码专区AV在线播放| 日韩精品无码人妻免费视频| 人妻无码久久一区二区三区免费| 国产精品爽爽va在线观看无码 | 无码人妻精品一区二区三 | 精品无码国产污污污免费| 亚洲乱码无码永久不卡在线| 国产成年无码v片在线| 69堂人成无码免费视频果冻传媒 | 欧洲精品无码一区二区三区在线播放| 91精品日韩人妻无码久久不卡 | 亚洲精品无码Av人在线观看国产 | 国产精品久久无码一区二区三区网| 13小箩利洗澡无码视频网站免费| 一级毛片中出无码| 日日摸日日碰人妻无码 | 无码中文人妻在线一区二区三区| 亚洲精品无码永久在线观看你懂的 | 无码色偷偷亚洲国内自拍| 中文字幕乱偷无码av先锋蜜桃| 国产产无码乱码精品久久鸭| 红桃AV一区二区三区在线无码AV | 久久av无码专区亚洲av桃花岛 | 国产AV无码专区亚洲AV手机麻豆| 精品国产AV无码一区二区三区| 色欲aⅴ亚洲情无码AV蜜桃| 人妻在线无码一区二区三区| 中文字幕韩国三级理论无码| 亚洲av永久无码嘿嘿嘿| 亚洲av无码一区二区三区天堂| 中文字幕无码不卡免费视频 | 亚洲AV无码久久精品狠狠爱浪潮| 寂寞少妇做spa按摩无码| 野花在线无码视频在线播放|