【业界】在 NLP 领域创业,真的很难
- 2020 年 2 月 21 日
- 笔记
来源公众号:公子龙
2015 年开始,在 AI 领域创业的公司如雨后春笋一般林立而起。如果细分的话,可以分为机器学习ML,图像视觉CV,和自然语言处理NLP。当然,理论上来说,CV 和 NLP 也是属于 ML 范围的。
市面上,这几个领域的创业公司都有不少,相对而言,CV 领域的公司数目和规模是较大的。我从事 NLP 行业,在相关的创业公司待过一段时间,所以对该领域的公司较为关注。今天,可以来简单聊聊 CV 和 NLP 领域创业公司的情况,重点是要回答一个问题:同样是 AI 创业,为什么 NLP 领域明显弱于 CV 领域。
我们先来看看 CV 领域的创业公司们。在该领域,头部的创业公司有个响亮的名号,叫做 CV 四小龙,分别为:商汤、旷视、依图、云从,他们的融资金额都非常高。以商汤为例,成立了近六年,融资总额达到 30 亿美元,它的估值超过了 75 亿美元。
日期 |
交易金额 |
融资轮次 |
---|---|---|
2018-09-10 |
10亿美元 |
D轮 |
2018-05-31 |
6.2亿美元 |
C+轮 |
2018-04-09 |
6亿美元 |
C轮 |
2017-12-26 |
未披露 |
战略融资 |
2017-11-28 |
15亿人民币 |
战略融资 |
2017-11-15 |
未披露 |
战略融资 |
2017-07-11 |
2.9亿美元 |
B+轮 |
2016-12-14 |
1.2亿美元 |
B轮 |
2016-04-26 |
千万美元 |
A轮 |
2014-11-07 |
数千万美元 |
天使轮 |
这几家公司的特点是,在后面几轮融资,动辄数亿甚至十亿美元的巨额融资,在资金逐渐紧缩的投资市场,的确让很多创业公司眼红。
相比之下,NLP 领域的创业公司的发展速度和融资规模,略显逊色。目前,与 NLP 有关的创业公司,发展势头不错的有:出门问问,追一科技,竹间智能等。列出这些公司的名字,很多读者可能感觉较为生疏,没有听过或者不怎么了解。的确,就名气上而言,也比 CV 四小龙弱了不少。其中,出门问问在2017 年的 D 轮融资中表现优异,获得了 1.8 亿美元融资,但之后再也没有新的融资消息传出。其他的公司数千万美元融资的情况较多,从融资规模上来看,和 CV 界相差甚多。
对了,这里多说一句,科大讯飞是一家很成熟的 NLP 公司,已经不算这几年新兴的 AI 创业公司了。
透过现象看本质,同样是机器学习领域,同样是顶着人工智能的创业光环,为什么现状差了这么多,难道是优秀人才都跑到 CV 领域去了吗?当然不是,接下来,我想从技术方面和市场方面,来分析一下背后的原因。
首先,从技术角度出发,自然语言处理的技术难度很大,尽管应用场景很多,但做好任何一项都不容易。自然语言处理的任务,基本都离开不了语义理解,任何事情,涉及到“理解”二字,就变得艰难很多。
图像处理的任务通常属于感知智能,所看即所得。例如识别出物体是一只猫,还是一辆车。但对语言来说,大部分问题是认知智能,需要考虑更多理解认知的因素。
因为视觉是人一出生就能够获取的,但语言是需要通过不断学习才能得到的,它是成千上万年以来,经过不断总结提炼后的高度抽象化的符号集合,组合起来可以千变万化。一段简单的文字,其含义很容易能超过数张图片所能承载的信息。举些简单的例子,我们现在还很难通过影片展示出《三体》中宏大的宇宙场景;寥寥几句唐诗,所涵盖的意境,可以宏伟至极。
现在很多论文中的研究成果,从实验室走向实际应用,最大的阻碍是鲁棒性。在宽松的实验条件下,得到的亮眼分数,往往在实际应用场景中一触即溃。其中,目前较为成熟的是文本翻译,但想必我们还不敢信任模型直接翻译的结果。
分析完了技术角度,既然是创业,我们再来看看商业中最终要的市场因素,在日常生活中,CV 最直接的应用是人脸识别,它已经融入了很多场景,小到手机的刷脸解锁,大到火车站的视频监控,罪犯查找。这里面是有着很多较为成熟的商机的。CV 四小龙就和很多手机厂商合作,让刷脸解锁、支付更为便捷,同时也可以和很多官方部门进行安防方面的合作。简而言之,有了较为成熟的市场需求。
如果提到 NLP 呢,生活中的应用我们比较容易联想到手机或者音箱上各式各样的智能语音助手。但我相信,大家一定很少去打开它们,因为无一例外,它们都太不智能了,与之对话会非常无聊。
这就引出了一个简单的结论,相对于 CV ,NLP 可单独拎出来的应用场景太窄了。虽说文本理解技术广泛应用于搜索、推荐、翻译等任务中,但这些方面的需求,通常是被大厂紧紧抓在手里,创业公司很难获取这些资源。为什么这么多 NLP 企业选择去做智能客服,还不是因为这个任务可以更好的 toB ( to Business),服务于各种企业,可以快速赚取现金流。
所以,技术上的巨大应用难度,鸡肋的市场需求,让 NLP 创业者很容易陷入窘境。这也就解释了,为什么市面上,鲜有比肩 CV 四小龙的 NLP 创业公司。当然,目前来看,四小龙的日子过得也并不舒适。毕竟,创业是一种九败一胜的搏命尝试。