乾貨 I 用數據分析進行「無死角」的復盤？

2019 年 10 月 5 日
筆記

最近常常有小夥伴問我，大概是如下幾個問題：我手裡沒有多少數據可以供分析，怎麼辦？我手上有一些數據，但是不知道該如何分析，怎麼辦？我有一些數據，也知道該做哪些分析，但是不會高大上的工具，怎麼辦？

其實很多時候，我們做數據時手裡掌握的數據總比我需要的多，深入了解業務後，方法總比問題多；方法有了，工具的使用總比想像的簡單多~

背景

話說，某年某月，某外地零食O2O品牌，想要開拓上海市場，本著「穩紮穩打，步步為營」的「精益創業」方針，該品牌準備先在上海幾個有代表性的區域進行試運營。

選了3個區域—楊浦區、長寧區和徐匯區，在這3個區人流較大、辦公樓密集的區域重點設立了三個實體營業網點，分別位於五角場地鐵站、淞虹路地鐵站和漕河涇地鐵站附近，並以這3個地鐵站作為輻射推廣點，上下班高峰期在地鐵口附近進行DM推廣，上班期間則在附近辦公樓進行掃樓推廣。

試運營始於七月下旬，到八月下旬正好運行一個月後，是為第一階段。此時，需要對這段時間的運營數據進行分析，修整並總結經驗，著重在以下幾個方面進行探討和研究：

1. 整體的運營情況，包括總訂單情況，訂單的時段分布情況；

2. 用戶的消費行為分析，主要是下單時間分布和購買力情況分析；

3. 總體和各個區域的用戶價值分析，用以指導和優化接下來的運營工作。

4. 對比一下這3個地方地推的效果及用戶下單情況。

由於前期技術人員太少且負責的項目過多，後台系統過於簡陋，後台收集到的原始數據只有下面這些：

原始數據表格

上表是這段時間內，用戶下單的資訊。注意，同一個User Id可能不止一次下單，可能在不同日期、不同時間段形成多次不同金額的消費，了解這一點對於接下來的用戶價值分析至關重要。

好了，各位看官，上面那張表將是小編接下來炒菜用的「食材」（來源於真實案例，數據會做一定處理，僅作展示數據分析方法之用），沒有其他佐料哦（大部分時間使用excel來處理數據）這些數據看起來平淡無奇，但如果開動腦筋深挖的話，就大有玄機哦。

我們的數據分析之旅即將開始咯！

訂單時間分布情況

在進行深入分析前，先將原始數據進行初步處理—主要是時間維度的處理。分別調用hour和weekday函數將小時「時點」和「周幾」的資訊發掘出來，至於「時段」的得來，之前很多小夥伴有問過這是怎樣「設計」出來，百度上也搜不出來吶，那當然，這可是我自創的哦~現在小編貼出一張詳情圖：

經處理得到若干時間維度數據的表格

「時段」的操作方法

如此這般，即可得到以下關於下單時間分布的資訊：

試運營期間訂單量時段分布情況

那麼，在這張下單時間段分布的圖中，又能看出什麼苗頭呢？其實，很明顯的，下單時間只有一個「波峰「—集中在9時~13時，這段時間的小白領除了吃午飯時間是正當的下單行為，其餘時間是在」開小差「~

再分析一下試運營期間總體的訂單銷售情況，將「日期」資訊和「星期」資訊同時顯示在橫坐標軸上，更容易發現時間上的下單規律，做成折線圖，可以看到如下的結果。

試運營期間整體訂單分布情況

從上表中，總體上可以看出，工作日的訂單多於休息日的訂單，在7-27~7-31和8-3~8-6期間出現訂單銷售高峰，這2段時間的訂單量驟然增長。究其原因，與這3個實體網點做促銷活動有很大關係，刺激了目標客戶的購買行為。

再單獨將「星期」數據「拎」出來，得到下圖：

試運營期間一周訂單分布情況

從上圖可以看出，一周的下單高峰集中在周三、周四這2天，周一和周二的訂單量也和這兩天相差無幾，但是到了周五，特別是周末（周六和周日），訂單量就陡然下降。

總的來說，周中的下單量很大，周末的訂單量很小，這與白領區的人群消費行為是一致的，無異常情況發生。

得知以上幾點資訊後，在開展下一階段的運營工作時，就可以在接下來的運營工作中準備如下事宜：

1. 趕在用戶下單高峰時期前，在營業網點安排好人員，做好部署工作，以便及時、快速的將貨品送交到用戶手中；

2. 在用戶下單高峰期到來前一段時間，做好APP和網站的系統維護，以免因下單量大出現技術問題，影響用戶體驗；

3. 進行下一輪的推廣工作時，可以選在周三和周四開展，這2天的用戶下單意願更強烈。

以上關於客戶（時間上）行為的分析比較淺顯，接下來的客戶價值的分析才是「重頭戲」呢！

客戶價值分析

這裡的客戶價值分析，小編將用到RFM模型，其中涉及到3個重要的維度，即最近一次消費(Recency)、消費頻率(Frequency)和消費金額(Monetary)。

RFM三維度含義

這種客戶價值分析模型雖然很好，但是存在如下幾個問題：

1. 每個維度都可以分為5個級別，那麼最終的結果是5*5*5=125個分類，客戶群分得太細了！每個客戶群組都要有一套針對性的方法，但這得要錢要人來做，這樣的操作太繁瑣、太反人類！

2. 該模型中的F和M兩個維度存在多重共線的問題，某一段時間內的消費頻次和累計消費金額具有很強的相關性；

3. 一般情況下，R值的權重是3個指標中最大的，但這種判定忽略了客戶的消費習慣和消費總量等因素，從而使最終結果的準確性受到某種程度的質疑。

針對以上問題，小編決定對現有的RFM模型進行一些改良，並祭出「大殺器」—聚類分析，用以簡化我們的深度分析工作。

不過，在進行聚類分析之前，需要先預處理下之前的原始數據，除了保留「User ID」、「重點區塊」這兩個基本資訊，還要保留及深度「析出」跟R、F、M這3個維度相關的若干指標：

從「實付金額」這個指標中，通過相關函數進行運算，可以得到「最小消費金額」、「最大消費金額」、「平均消費金額」和「累計消費金額」這4個指標；

而從「下單日期」這個指標，通過相關函數進行運算，可以得到「最初下單日期」、「最後下單日期」、「最初下單日期到今天的間隔天數」、「最近一次下單到今天間隔天數」及「累計購買頻次」這5個指標。

重要的分析指標及相關指標的「從屬關係」

其中，以上衍生指標的計算公式/方法分別為：

1.最大/最小消費金額」通過公式「=MAX/MIN(IF(原始數據!$A$1:$A$7028=Sheet1!A2,原始數據!$H$1:$H$7028))得到；

2.最初/最後下單日期」通過公式「=MAX/MIN(IF(原始數據!$A$1:$A$7028=Sheet1!A2,原始數據!$N$1:$N$7028))得到；

3.累計購買頻次」則由透視表得出，同一個User Id下，將任意指標進行「計數」顯示，即可得出頻次。

4.最後下單到今天間隔天數」由公式「DATEDIF(E2,TODAY(),」d」)」得到；最初下單到今天間隔天數由公式「=DATEDIF(D2,TODAY(),」d」)」得到，其中E列是最後下單日期所代表的列，D列代表最初（第一次）下單的日期的列。

值得注意的是，上述公式是在新的sheet里構建的，引用的是原始表單里的數據。且後面的間隔天數需要等最初/最後下單日期確定後才能計算出。

最小購買金額計算方法

購買頻次的計算方法

將上述指標進行計算後，得到下面的客戶資訊價值表，可以作為下一步分析的原始數據。

經處理後的客戶價值資訊表單

然後將該excel表單錄入SPSS系統，經運算後，可以得到如下新表：

聚類分析後得到的SPSS輸出數據

可以看出，上表中多了一列關於「分類」的數據，這就是SPSS軟體根據表中用戶購買資訊（購買金額和購買日期等）在若干維度上的同質性和異質性劃分出的4類（由於小編使用的是K-means聚類法，需要人為設定分為幾類，所以在確定4類之前，需要反覆測試2類、3類、5類的數據，直到能在各個分類間體現出明顯的差異性，且具有良好的集中度為止）

再用透視表處理一下，將每類數據的「值欄位」顯示為「平均值項」，得到「用戶價值分類特徵表「。

用戶價值分類特徵表

在對上表進行分析之前，小編需要指出的是：上述指標的重要性不是同一水平的，其中各指標的權重有大有小，重要性不一，而權重係數需要根據以往經驗和業務情況進行分配，這裡僅給出小編的判斷：

累計購買頻次的權重最大，因為多次購買行為即使平均/累計消費金額不多，但反覆多次的購買行為代表用戶對品牌/產品的認可，能反映出用戶的忠誠度；

其次最近一次下單日期，隔得不太久的話，使用客戶召回策略的成功率會很高；

然後是平均消費金額，單次高消費或單次低消費都不能準確地反映出客戶在本產品上的購買力水平，取歷史平均水平才能看出他在本產品上的消費能力，但要結合最低和最高消費金額來看，看是否二者間的差距過大，穩定性如何；

最次是累計消費金額，反映客戶在某段時間內累計的消費情況，也能體現客戶對產品/品牌的持續價值。

根據上述判斷，第2類和第3類屬於較為優質的顧客，他們在購買頻次、最近一次購買時間、累計消費金額和平均消費金額上的數值水平均衡且較好，是重點需要維護的對象，以後可以對這2類用戶推送價值較高的優惠活動/資訊，促進其後續的購買行為。

第1類客戶屬於「土豪級」，雖購買頻次較低，但購買金額很大，跟其他幾類客戶比起來，購買力相當彪悍，有錢可任性，但留住很困難。

此外，第4類的用戶數較多，是有潛力待挖掘的客戶群。這類群體的特徵是平均消費金額和累計消費金額低，購買次數較少，且很久未再買產品了，召喚回的概率很小，可以對這部分客戶進行回訪，找出產品和服務方面存在的問題，做好優化，苦練內功，以便下次進行推廣的時候一次就「摁住」客戶。

綜上，第2類、第3類客戶是我們接下來重點抱大腿的目標，這是「節流」；根據第4類客戶的回訪得到改進產品和服務的建議，在接下來的運營工作中招攬新客戶，這是「開源」。

看到這裡，你以為結束了？

NO，you too naive~小編要把數據榨乾，儘可能得到對運營工作有用的資訊！

以下是經透視表處理後的各區3類用戶的佔比情況：

各區塊3種類型客戶的分布情況

上表是各區3類客戶分布的情況，從中可以看出淞虹路的總體下單客戶量最大，其次是漕河涇，再次是五角場。

此外，由上述數據還可以得出下列概況：

使用excel中的多重判斷函數公式，將客戶的單次平均消費金額劃分為7個檔次，函數公式太反人類，小編就不列了，大家知道原理就好。建議檔次別分太多，excel中的if嵌套貌似最多7層。

消費金額區間客戶數量佔比表

由此得到各個消費金額區間的客戶佔比情況，可以了解到試運營期間客戶的整體消費結構怎樣。表格看起來不直觀，直接轉化成下面的2個圖，上圖定量比較，下圖定性分析佔比情況。

平均消費金額區間客戶數量分布

各消費金額區間客戶數量佔比情況

在分析上面兩個圖前，需要指出的是，該O2O零食品牌絕大部分的單件產品的價格在3~15元之間。

那麼由上述圖表可以得知，絕大部分客戶下單時，購買不止一件商品，說明連帶率（連帶率是服裝行業銷售的一個指標，描述的是顧客在一次購買過程中，同時一次性買走幾件商品，它反映了商品的搭配有效性。）比如客戶買香腸的時候同時買了雞翅、可樂和薯條，說明這樣的產品的組合搭配尚可。當然，這還有很大幅度的提升空間呢~

購買頻次客戶數量分布圖

最後是購買頻次的客戶數量分布圖，能反映出用戶的忠誠度情況。其中，僅購買過一次的用戶佔了大頭，看到這樣的數據，運營人員要思考，為啥這麼多的客戶只買了一次呢，難道自家的東西不好吃么？所以，以後要好好研究市場，研究客戶，研究競爭對手，練好自己的內功。

總結

好了，小編這次的分享結束了，當然上面還可以使用數據地圖，將客戶的地點分布做成熱力地圖，體（geng）現（hao）專（de）業（zhuang）性（bi），以便了解整個客戶的區域分布情況，進行有效的二次重點推廣。

從這個例子中，小編想說的是：

當我們擁有一份原始數據時，在結合當前業務的情況下，運用自己的數據分析經驗和儲備的理論知識，盡量把這些數據「榨乾」，汲取有價值、有營養的資訊。如此這般，最終的數據/分析報告不僅可以作為我們彙報給領導或相關部門的資料，供他們參考，更重要的是，它能指導和優化我們後續的運營工作，為我們積累寶貴的運營經驗。

作者：蘇格蘭折耳喵

來源：人人都是產品經理

乾貨 I 用數據分析進行「無死角」的復盤？

VirMach 便宜 VPS

QNews

乾貨 I 用數據分析進行「無死角」的復盤？

分享此文：

Related Posts

小型化核心網，究竟會帶給我們什麼？

分散式全局唯一ID生成策略​

php批量修改圖片名稱

Centos 7 如何臨時和永久修改電腦名

VirMach 便宜 VPS

QNews

熱門搜尋

分散式全局唯一ID生成策略