揭秘阿里巴巴的客群畫像
阿里巴巴一直在面向未來探索B類新電商模式,並從2019年開始重點構建「新供給、新鏈接、新營銷」三新體系。買家是三新體系的核心,缺少買家維度的數字化經營體系是不完整的。平台場景目標群體及場景間買家差異性尚不明確,客群矩陣就是為場景中控解決這一業務痛點、提高場貨分發效能而專門設置的演算法研究主題。同時,客群矩陣也是用戶增長和演算法特徵的核心數據。鑒於客群矩陣如此重要且擁有諸多應用,其構建迫在眉睫。
阿里巴巴意在將客群矩陣打造成平台的一個風向標,以便業務有目標、有層次、有差異、高效地選品和進行場景運營及商家運營,為用戶增長和演算法模型優化提供動力,為數字化運營提供依據。我們主要圍繞人、貨、場、商4個維度構建,客群矩陣概況如圖1所示。
客群矩陣同場景矩陣疊加,在構建場景目標用戶、衡量場景差異性的同時,也能提高場景效能,有效引導目標流量,進而為各類業務場景的演算法建模提供底層數據基礎。
1 採購力
B類買家不像C類買家有明確的年齡、性別等基礎坐標維度,B類用戶多是企業或者批發商,如何刻畫B類特色的客群矩陣,這對於B類電商非常重要,也是B類電商「小二」一直在思考的問題。
既然B類用戶群體主要是企業和批發商,那麼如何準確地描述客群矩陣呢?採購力就是突出的表徵,採購力包含採購金額和採購頻率,從採購力可以看出用戶的經營規模和消耗能力。因此,我們將採購力作為基礎坐標維度,分層提供精準差異化服務。
採購金額主要是一定周期內用戶採購的金額。為了規避不同品類價格差異較大帶來的分層干擾,首先分類目對採購金額劃檔,然後再按照金額檔不分類目看,佔比最多的金額檔就是此用戶的採購金額檔層。
採購頻率是一定周期內用戶的採購頻次。將用戶按照採購時間排序,然後計算用戶在一定時間周期內採購的頻次。將所有用戶按照高斯分布比例劃分出高、中、低檔,作為採購頻率的分層檔次。
2 生命周期
包括新裝機、新用戶、低活、中活、中高活、高活、沉睡、流失等階段,該生命周期主要是按照用戶在電商平台的活躍度來劃分的,其中也融入了部分業務知識。例如,新裝機用戶是指剛裝機的用戶,新用戶是指成交在2單以內的用戶,低活是指一個月訪問天數在2天以內的用戶等。
從交易周期分析用戶生命周期,如圖2所示,包括新裝機激活用戶、登錄用戶、首單用戶、活躍買家(高採購力買家、潛力買家)、潛睡買家、深睡買家等階段,各個生命周期階段之間的轉換關係在圖中也有直觀呈現。精準化用戶運營根據買家生命周期階段不同而調整目標,所採取的策略也會相應調整。
了解了用戶生命周期,就可以有針對性地做用戶拉新、促活、留存,以提高用戶黏性:對於新裝機和新用戶,主要是提高他們的用戶體驗,培養用戶的消費習慣,做留存轉化;對於中低活用戶,主要是促活、留存;對於中高活用戶,主要是維持用戶的習慣,加強黏性;對於沉睡和流失用戶,主要是通過紅包權益等方式促活。用戶生命周期的維護對於電商持續用戶增長發揮著至關重要的作用。
3 核心主營
CBU作為B2B電商平台的典型代表,一直致力於服務全球億萬B類買家用戶。用戶核實身份與主營類目(如進口母嬰店店主、精品女裝店店主、微商兼職、小超市店主等)作為B類用戶畫像最為核心的屬性之一,不僅代表著用戶的線下實體身份,還直接影響著用戶在電商平台上的行為偏好、採購周期及對商家服務能力的訴求等,因此一直是B類電商平台致力於深耕與運營的核心用戶畫像屬性之一。
大多數C類用戶畫像屬性可以直接基於用戶在網站上的歷史行為進行建模,但B類用戶畫像則不同。因為要核實用戶核身身份以及對主營類目有精準性的要求,一般B類電商平台主要以用戶自填表單的形式進行用戶核實身份的確定。這種用戶自填方式結果準確度較高,但位置隱蔽、鏈路冗長、沒有利益點的引導,不僅用戶填寫率低,而且與場景結合力不足。
為解決原表單式核身用戶操作成本高的問題,阿里巴巴CBU電商平台通過用戶核身組件借力演算法模型對用戶核身進行預測,依據置信度排序,為用戶推出Top K個選項供用戶點選。整體演算法解決方案如下。
01 數據源
1)用戶站內行為
用戶站內行為是用戶需求與偏好的第一回饋基地,是演算法需要著重去挖掘的數據源。相對其他偏好類畫像屬性來說,用戶核身是一個相對穩定和長期的用戶屬性,因此在演算法應用中,我們選取了用戶最近半年的站內全域行為作為底層數據。定義半年的長時間窗口選取主要有兩方面考慮:一是目前網站商品豐富、優質,搜索與推薦演算法日漸精進,用戶瀏覽各類商品的成本較低,所以B類用戶在網站上的注意力難以保持專註,用戶B類/C類的需求與行為混雜,數據較臟,較長的時間窗口有利於濾除干擾,捕獲用戶更為長期和穩定的需求;二是用戶行為數據,特別是採購行為,相對稀疏,然而B類用戶的採購行為是反映用戶核身身份最為核心的特徵之一,且用戶採購行為又具有一定的周期性,因此長期的時間窗口能夠幫助演算法更加全面地認識用戶。
2)用戶站外上下游身份
不同於很多偏好類用戶畫像屬性,用戶核身身份能夠與用戶在現實中的身份產生真實的映射關係,如奶茶店店主—喜茶店主、烘焙店店主—寶島金典店主、精品女裝店店主—淘寶女裝店店主等。因此,用戶站外上下游的身份映射關係,能夠輔助我們進一步完善用戶核身身份的預測,提高覆蓋率和準確率。
3)行業知識
鑒於用戶在網站上B類/C類行為混雜,雜訊較多,B類用戶核身偏好易受網站熱門類目與商品的干擾,因此我們也引入了大量行業知識作為指導來協助完成B類用戶核身身份的預測,並基於此沉澱下來一份核身偏好類目數據。
02 演算法方案
利用以上用戶站內行為、站外上下游身份和行業知識的數據,演算法端可以通過以下幾個步驟實現用戶核身身份的預測工作,預測流程如圖3所示。
圖3 用戶核身預測流程圖
1)種子用戶圈選
種子用戶主要定義為站內已核身用戶及站外上下游有映射關係的核身資訊的用戶。
2)行業知識指導
我們基於種子用戶最近一段時間的站內行為數據,挖掘識別顯著性特徵,提供給運營同事,對種子用戶再進行一輪劃撥,把日常核心行為與行業偏好明顯不符合的用戶排除,優化種子用戶的圈選。
3)種子商品圈選
以行業偏好類目作為門檻,篩選出種子用戶在門檻下最近半年內採購過的商品作為種子商品。
4)種子商品擴展
基於團隊沉澱現有商品的I2I表,利用種子商品作為trigger觸發Key,對種子商品進行擴展,擴展種子商品的偏好分等於商品I2I相似分與trigger種子商品偏好分的乘積。
5)用戶核身預測
對於一個用戶的核身預測,我們選取其最近半年的行為數據進行建模打分。然後基於打好分的用戶行為商品計算用戶對每一個可能的核身身份的偏好置信度,並用以區分用戶的個人採購行為和B類採購行為,降低用戶的個人採購行為對預測結果的影響,加大用戶的B類採購行為的權重。
本文摘編於《阿里巴巴B2B電商演算法實戰》經出版商授權發布。
本書是阿里巴巴CBU技術部(1688.com)深耕B2B電商15年的經驗總結。阿里巴巴B2B在戰略形態上經歷了資訊平台、交易平台和營銷平台的升級迭代,本書聚焦營銷平台商業形態背後的演算法和技術能力,試圖從技術和商業互為驅動的視角闡述技術如何賦能業務,並結合阿里巴巴集團在基礎設域和演算法創新上的沉澱,打造出智慧B2B商業作業系統。
阿里巴巴B2B電商演算法實戰
作者:阿里集團,新零售技術事業部,CBU技術部
推薦閱讀
《用戶畫像:方法論與工程化解決方案》
這是一本從技術、產品和運營3個角度講解如何從0到1構建用戶畫像系統的著作,同時它還為如何利用用戶畫像系統驅動企業的營收增長給出了解決方案。
用戶畫像:方法論與工程化解決方案
作者:趙宏田
關注「實時流式計算」 後台回復 「0814」 參與抽獎
將於8月15號中午12:00開獎 共送出兩本圖書 歡迎大家參與~