预测下英语流利说之后,下一个到纽交所敲钟的教育科技独角兽?
- 2019 年 10 月 8 日
- 筆記
阅读难度:★☆☆☆☆
技能要求:爬虫、数据可视化、前端基础
字数:850字
阅读时长:3分钟
英语流利说上市了,据统计数据显示,2017年我国K12在校人数统计为1.32亿人,大学本科生有2753.6万人,而英语流利说注册用户为7000万人次,占比接近50%。
用户量是可观的,大家是不是有兴趣想知道接下来在教育领域还会有哪些创业企业会走上上市的道路?
没准就在大家的身边。
那么,我们可以通过什么技术手段进行预测呢?
给大家案例一种数据思维,利用数据的优势,配合可视化图谱进行观察,辅助我们预测接下来的上市企业。
STEP1
爬取教育领域的创业企业投融资数据

收集了2000年以来在教育领域的创业项目,共计1094个,投资机构共计984个,是一些在教育领域布局的投资机构。
STEP2
了解数据的分布特征
先按照融资次数统计下:
1次747
2次212
3次72
4次32
5次21
6次5
7次1
8次3
9次1
大致可以推断在4次以上的企业,最近上市的可能最大。有哪些企业处于4次以上呢?接着看下文。
STEP3
分别观察各个次数的图谱
我们分别按照融资次数观察下图谱:
图谱说明:
节点大小表示融资次数的多少,越大表示融资次数越多;
连线表示背后有同一机构参投,由此可推断出2个项目之间是否存在潜在的合作关系(反正都是同一投资机构布的局)
次数=1

我们发现了9个小群体:

继续放大其中一个小群体来看看:

点击下智慧流这个节点,可看到它扮演了中心枢纽的角色:

查一下智慧流是个什么项目,原来智慧流的使命是“用科技成就中小企业”,服务教育企业的,所以位于中心枢纽的地位很正确。从用户数据的角度来说,这个群体的数据是互通的,通过智慧流的平台。(我好像发现了什么秘密-_-!!)
继续看另一个群体,如下所示:

这个群体比较复杂,暂时没有一个中心枢纽,不知背后的资本接下来怎么布局?
接下来看看其他次数的情况:
次数=2
看到我比较熟悉的西瓜创客,也形成了中心枢纽的布局,不过它是做编程教育的,如果是家2B的企业在这个布局下应该不错。

STEP4
群体+次数的观察
通过以上几步的观察,我们可以发现找寻融资次数比较多,并且已经形成群体的,位于群体中心的项目,会比较稳定。依次判断其近期有可能会上市。
次数>=3

数量太多,看不过来,我们把范围缩小
次数>=5

从这里找寻比较稳健的项目,说不准就是下一个敲钟的企业。