日前,蓦然认知科技宣布已完成新一轮融资,金额为 1000 万美元,天使投资方经纬继续跟进。从目前公开的数据来看,这是目前 NLP 创业领域最高的一笔投资。
蓦然认知是由在百度研究 9 年自然语言处理的戴帅湘于 2016 年创办的一家公司,主要做自然语言处理与认知计算相关的技术及解决方案,已经推出了人机对话引擎 Mor,协助用户语音办理任务性的业务。
从去年开始兴起的新一波 AI 创业热潮中,NLP 是一个热门领域。当语音识别的准确度不断提升,作为智能语音领域的短板,自然语言处理的重要性也日益凸显,NLP 领域的公司也受到了资本的青睐。
经纬合伙人王华东表示,蓦然认知科技在自然语言处理领域的见地令经纬印象深刻。这种深刻不止体现在技术上,也体现在创始人对应用场景的理解上。很多技术型公司在产品化的过程中会发挥“想象力”,主观罗列他们的技术可以解决的问题——通常情况下会是一个长列表,还会强调每个场景的商业潜力都很大。蓦然认知科技在这方面非常务实,技术强大但没有炫技的成分,对合作伙伴的选择也有主次之分。我们热切期待他们成为自然语言处理领域的领导者。
蓦然认知的人机对话 Mor 引擎想要对标 Alexa 这类语音助手,主要以语音交互的方式帮用户便捷地完成日常生活中常用的任务,如打车、订票、订外卖等。事实上这些任务通常都不是用固定的语言话术提出的,也很难用一句话完成。因此,对自然语言的处理、场景下的上下文理解和多轮对话等都有较高的要求。
从蓦然认知提供的测试 Demo 及现场的测试来看,目前可以做到多轮上下文对话,且关联性较高、反应速度也较快。蓦然认知表示,目前一般可以做到 5 轮以上的连续对话,对话关联的准确率可以做到 90% 以上。
之所以能做到这一点,CEO 戴帅湘表示,主要是因为蓦然认知在自然语言交互、知识表示及推理等方面掌握核心技术,积累了一定的技术壁垒。具体来说,在自然语言交互方面, 从语言处理的底层开始逐级往上,搭建了语义理解、多轮对话、增强学习三位一体的自然语言交互模型。同时,他们还创造了一套完整的常识知识表示机制,并在此基础上构建了机器的推理模型,可以针对服务及其相关背景知识做复杂的语义分析,比如“播放一首窦唯前妻的粤语歌曲”,“我是湖南人,帮我推荐一个附近好吃的餐馆”。
Mor 不直接面向 C 端,而是作为语音交互和决策引擎,将前端 SDK 提供给 B 端客户,由他们定制用户界面并集成到各种智能产品中。为了方便企业对接,团队设计了一种自动服务对接程序,可以扫描服务商提供的接口,让其尽可能自动化地接入到对话模型中,以“可拔插”的方式来满足对话过程中特定的意图需求,减少了工程师针接入服务接入的开发成本。
此前接受 36 氪采访时,蓦然认知就表示会重点拓展车载、家居这两个语言交互更频繁的场景,这也是目前智能语音服务商都很看重的新兴市场。
在智能家居方向,蓦然认知与多家智能家居厂商达成合作,后者会在一系列家居设备中植入 Mor, 第一批产品预计今年上半年可以上线。蓦然认知表示,Mor 在智能家居上的优势主要体现在两个方面:
一,是针对复杂内容的多轮对话查询——用户可以问“第八届奥斯卡终身成就奖的获得者是谁?他主演的 90 年代的动作片,有没有张曼玉主演的?”,或者“听一下张柏芝前夫 90 年代的摇滚歌曲”,这些相对复杂的对话时,引擎也可以理解并给到用户指定的内容;
二,是家居场景中常常会同时使用多种设备——Mor 允许用户在对话时在多个设备中自由切换,且不会影响对话的上下文连续性。
在智能车载方向,蓦然认知与地图服务提供商四维图新达成了合作,后者在国内数字地图领域的市场占有率在 50% 左右。团队表示,Mor 在车载领域除了关注行车途中的导航、音乐需求外,还会针对开车的停留点、目的地,甚至车辆使用问题提供决策支持,比如识别“给我找一个目的地附近 200 米以内价格最便宜的停车场”等指令。作为车载领域的后来者,蓦然认知的这套系统会免费提供给后装设备厂商免费使用,对于思必驰、云之声、科大讯飞等已经占有一定份额的厂商来说,很可能会产生一定的冲击。
与此前报道时,一个比较明显的变化是蓦然认知也要切入智能客服市场了。客服作为已经被验证的有需求的大市场,也是目前 NLP 创业公司都看重的市场之一。根据艾媒咨询的数据,中国客服市场整体规模超过千亿人民币。
当前蓦然认知的客服系统主要针对运营商的业务。运营商的客服任务繁重,疲于应付,基本都只能选择外包。2016 年底联通也选择了与百度进行客服方面的合作。不过技术研发团队为主,蓦然认知并没有选择直接与运营商合作做定制外包项目,而是与第三方合作,按照效果进行收费。团队表示,因为涉及到商业机密,具体合作伙伴及合作案例暂不方便透露;未来公司也会拓展金融等领域的业务。
目前,蓦然认知的团队规模在 20 人左右。CEO 戴帅湘是前百度主任架构师,曾长期担任百度 Query 理解方向负责人,曾荣获百度语义技术的最高奖,2010 年提出 “Query 改写模型” 给百度搜索引擎技术带来了搜索相关性和广告收入均大幅提升,在自然语言处理、语义搜索、自动问题求解等领域内有 20 多项专利技术 。首席技术顾问洪涛是百度首位高级科学家,有 20 多年高新技术的行业经验。技术总监张伟萌是前百度自然语言处理资深工程师,有 9 年自然语言处理的工作经验,有近 10 项专利技术发明。市场总监龚思颖是前大疆创新北美地区人力资源及客户关系负责人 。团队中的其他成员多为 BAT 前 NLP 方向的专业技术人员。
智能语音基本已经成为公认的新一代交互方式。从行业来看,语音识别的准确度已经达到比较高的水平,但自然语言处理方面仍处于攻坚期,不管是原有的语音识别技术提供商,还是新入局的创业公司都在想办法提升准确度与可用性。不同于科大讯飞做语音识别时,仅有 Nuance 等为数不多的竞争对手,现阶段创业公司要面对的竞争还要激烈很多。不过,现阶段,中国人力成本开始逐步提升,仅客服领域的需求就在不断提升,对这个重技术的行业来说,则是一个利好消息。
press@mpc.vc