發(fā)布時(shí)間:2020-08-06
欄目:電商資訊
大數(shù)據(jù)這個(gè)詞已經(jīng)火了好幾年,我們所聽(tīng)聞的“超市中啤酒和紙尿褲擺放在一起”這樣的例子其實(shí)就是大數(shù)據(jù)的基礎(chǔ)性應(yīng)用。這些一般是根據(jù)簡(jiǎn)單的數(shù)據(jù)采集和經(jīng)驗(yàn)判斷得出的結(jié)果,但真正的大數(shù)據(jù)挖掘靠的是復(fù)雜的數(shù)據(jù)建模,以及模型的疊加和階段性更新才能獲得用戶期待的效果。
京東商品信息采集 京東(JD.com)一直是大數(shù)據(jù)應(yīng)用的踐行者。2014年的京東技術(shù)嘉年華上,京東就曾經(jīng)分享過(guò)如何應(yīng)用大數(shù)據(jù)做到“智慧零售”,而最近,京東對(duì)其PC頁(yè)面和手機(jī)APP等進(jìn)行了改版,“今日推薦”和“猜你喜歡”這兩個(gè)板塊不再千篇一律,而是實(shí)現(xiàn)了“千人千面”。
“千人千面”意味著每個(gè)人在PC或移動(dòng)端打開(kāi)京東網(wǎng)頁(yè)時(shí),看到的是完全不同的一組推薦產(chǎn)品,推薦給你的可能是洗發(fā)水和按摩椅,推薦給我的可能是手機(jī)殼和一本兒童剪紙書。而且,京東表示,這種推薦的結(jié)果是,用戶購(gòu)物決策的質(zhì)量和效率提升了,忠誠(chéng)度提高了,移動(dòng)端個(gè)性化推薦訂單貢獻(xiàn)已經(jīng)達(dá)到10%,可謂是雙方都滿意,皆大歡喜。
那么這樣的“大數(shù)據(jù)服務(wù)”是如何實(shí)現(xiàn)的呢?京東推薦搜索部總監(jiān)劉尚堃近日與記者分享了“千人千面”背后的大數(shù)據(jù)故事。
京東(JD.com)把這種以推薦方式吸引用戶再次回到京東采購(gòu)商品叫“召回”。召回是基于之前的數(shù)據(jù)采集進(jìn)行分析的。那么也就是需要多種不同的“召回模型”。
根據(jù)劉尚堃的介紹,目前京東正在采用的召回模型有三種。第一種是基于行為的召回模型,這個(gè)理解起來(lái)比較簡(jiǎn)單。如,我剛剛在京東上購(gòu)買了一部Kindle,那么京東會(huì)推薦我kindle周邊產(chǎn)品,比如一個(gè)kindle的保護(hù)套京東商城信息采集,這種是與用戶的購(gòu)買行為相關(guān)。又如我再京東上瀏覽了一本金融書籍,京東會(huì)根據(jù)我的瀏覽記錄給我推薦相近的股票書籍京東商品采集器??傊@種推薦是比較直接的,而且劉尚堃也提到,他們最近還嘗試將用戶剛剛瀏覽過(guò)的商品直接推薦給用戶,這種“直白”的推薦是他們之前不屑于做的,但居然也起到了意想不到的好效果。
第二種召回模型是基于用戶的偏好進(jìn)行推薦,也就是基于數(shù)據(jù),對(duì)用戶、商品及店鋪進(jìn)行畫像。下圖中,我們可以清楚的看到畫像的元素。京東后臺(tái)會(huì)對(duì)這些畫像進(jìn)行配對(duì),推薦合適的商品。比如一位男士,在京東上多次采購(gòu)和瀏覽高檔品牌白色T恤,那么他的畫像就被定位為“男、高收入、T恤、白色、……”,當(dāng)有相應(yīng)高檔品牌上新白色T恤時(shí),京東會(huì)自動(dòng)推薦給這位男士。
京東用戶可以通過(guò)京東的PC端、移動(dòng)App以及微信和手Q進(jìn)行采購(gòu)。一般而言京東商城信息采集,辦公環(huán)境下用戶更喜歡在PC上購(gòu)物;移動(dòng)、家居環(huán)境下用戶越來(lái)越喜歡蜷在沙發(fā)里在京東主APP和微信手Q上購(gòu)物。當(dāng)然,也可以在PC端看仔細(xì),加入購(gòu)物車,之后有空在移動(dòng)端確認(rèn)付款。根據(jù)不同屏幕展示限制,京東也會(huì)推薦相應(yīng)地產(chǎn)品。
第三種召回模型是基于地域。不同城市的消費(fèi)水平當(dāng)然不同,同一個(gè)城市的不同區(qū)域也有著不同的消費(fèi)習(xí)慣。北京酒吧街三里屯附近的采購(gòu)集中在了撲克、飲料、礦泉水等娛樂(lè)類商品,而東北五環(huán)的龐各莊小區(qū)的采購(gòu)則集中在了晾衣架、棉襪、鼠標(biāo)、充電寶等生活類商品,對(duì)于來(lái)自這兩類不同局域的用戶,京東推薦的品類也會(huì)有所側(cè)重。
當(dāng)然,這三種模型屬于宏觀模型,以下還有很多子模型,如在線相關(guān)、在線相似、離線相關(guān)、離線相似,以及近期比較熱銷的品牌和品類等。這些子模型都會(huì)進(jìn)入到模型庫(kù)當(dāng)中,基于一些算法進(jìn)行模型效率分析,也就是看單位展示量中哪種模型效率最高。同時(shí),京東會(huì)根據(jù)測(cè)試結(jié)果進(jìn)行模型權(quán)重的調(diào)整,并不斷進(jìn)行新的嘗試——比如把用戶直接放在購(gòu)物車中的商品再次推薦給用戶,結(jié)果在原有算法基礎(chǔ)上又有了5%到10%的提升京東商品信息采集。后來(lái)劉尚堃的團(tuán)隊(duì)又將這些召回模型借助新的算法進(jìn)行排序,模型效率再度提升了20%。
劉尚堃也表示京東也在探尋如何向用戶展示一些可能會(huì)感興趣但不會(huì)馬上購(gòu)買的品類,如手機(jī)、情侶睡衣、冰箱、筆記本、手表、平板電視等等,因?yàn)檫@些商品使用時(shí)間長(zhǎng),采購(gòu)前的思考周期也比較長(zhǎng)。他們正在嘗試定制某種展示機(jī)制,希望得到相應(yīng)的效率提升。
目前,京東建構(gòu)模型所采用的數(shù)據(jù)多數(shù)來(lái)源于京東采購(gòu)記錄,未來(lái)也會(huì)考慮采用社交媒體的數(shù)據(jù),進(jìn)行輔助。劉尚堃說(shuō),他們也在積極嘗試新的算法和排序模型,并且就架構(gòu)本身來(lái)說(shuō),能夠支持算法的高速迭代,京東平均每周會(huì)有7個(gè)新的算法實(shí)驗(yàn)上線。在未來(lái),搜索團(tuán)隊(duì)基于大數(shù)據(jù)召回率預(yù)計(jì)還有50%的提升。
通過(guò)“千人千面”的商品推薦,大數(shù)據(jù)為京東帶來(lái)了實(shí)實(shí)在在的利潤(rùn)。相信也會(huì)有更多的大數(shù)據(jù)故事,醞釀在各個(gè)行業(yè)和企業(yè),為企業(yè)帶來(lái)生機(jī)。
文章地址:http://www.meyanliao.com/article/online/dsjrjdsptjsxqr.html

- 1互聯(lián)網(wǎng)對(duì)傳統(tǒng)企業(yè)的沖擊有多大
- 2美團(tuán)再因不正當(dāng)競(jìng)爭(zhēng)敗訴新反法互聯(lián)網(wǎng)專條首次適用外賣領(lǐng)域!
- 32021互聯(lián)網(wǎng)十件大事對(duì)不起賈躍亭你只能排第四
- 4互聯(lián)網(wǎng)宣傳做的就是用戶體驗(yàn)
- 5互聯(lián)網(wǎng)創(chuàng)業(yè)到底需要怎樣的能力
- 6適合上班族的25個(gè)副業(yè)(適合上班族的互聯(lián)網(wǎng)副業(yè))
- 7互聯(lián)網(wǎng)的世界沒(méi)有永遠(yuǎn)的敵人只有永遠(yuǎn)的利益
- 8押?jiǎn)h進(jìn)駐天線貓助力互聯(lián)網(wǎng)數(shù)碼產(chǎn)品寄存行業(yè)經(jīng)濟(jì)持續(xù)發(fā)展
- 9互聯(lián)網(wǎng)公司如何做好品牌定位
- 102021年互聯(lián)網(wǎng)金融發(fā)展回顧冬去春欲來(lái)改弦當(dāng)更張