預測下英語流利說之後,下一個到紐交所敲鐘的教育科技獨角獸?
- 2019 年 10 月 8 日
- 筆記
閱讀難度:★☆☆☆☆
技能要求:爬蟲、數據可視化、前端基礎
字數:850字
閱讀時長:3分鐘
英語流利說上市了,據統計數據顯示,2017年我國K12在校人數統計為1.32億人,大學本科生有2753.6萬人,而英語流利說註冊用戶為7000萬人次,佔比接近50%。
用戶量是可觀的,大家是不是有興趣想知道接下來在教育領域還會有哪些創業企業會走上上市的道路?
沒準就在大家的身邊。
那麼,我們可以通過什麼技術手段進行預測呢?
給大家案例一種數據思維,利用數據的優勢,配合可視化圖譜進行觀察,輔助我們預測接下來的上市企業。
STEP1
爬取教育領域的創業企業投融資數據

收集了2000年以來在教育領域的創業項目,共計1094個,投資機構共計984個,是一些在教育領域布局的投資機構。
STEP2
了解數據的分佈特徵
先按照融資次數統計下:
1次747
2次212
3次72
4次32
5次21
6次5
7次1
8次3
9次1
大致可以推斷在4次以上的企業,最近上市的可能最大。有哪些企業處於4次以上呢?接着看下文。
STEP3
分別觀察各個次數的圖譜
我們分別按照融資次數觀察下圖譜:
圖譜說明:
節點大小表示融資次數的多少,越大表示融資次數越多;
連線表示背後有同一機構參投,由此可推斷出2個項目之間是否存在潛在的合作關係(反正都是同一投資機構布的局)
次數=1

我們發現了9個小群體:

繼續放大其中一個小群體來看看:

點擊下智慧流這個節點,可看到它扮演了中心樞紐的角色:

查一下智慧流是個什麼項目,原來智慧流的使命是「用科技成就中小企業」,服務教育企業的,所以位於中心樞紐的地位很正確。從用戶數據的角度來說,這個群體的數據是互通的,通過智慧流的平台。(我好像發現了什麼秘密-_-!!)
繼續看另一個群體,如下所示:

這個群體比較複雜,暫時沒有一個中心樞紐,不知背後的資本接下來怎麼布局?
接下來看看其他次數的情況:
次數=2
看到我比較熟悉的西瓜創客,也形成了中心樞紐的布局,不過它是做編程教育的,如果是家2B的企業在這個布局下應該不錯。

STEP4
群體+次數的觀察
通過以上幾步的觀察,我們可以發現找尋融資次數比較多,並且已經形成群體的,位於群體中心的項目,會比較穩定。依次判斷其近期有可能會上市。
次數>=3

數量太多,看不過來,我們把範圍縮小
次數>=5

從這裡找尋比較穩健的項目,說不準就是下一個敲鐘的企業。