您现在的位置:首页 > 资讯 > 业内资讯

傅盛:机器人不是噱头 也不是"黑科技"

文章来源: 2018-08-18 点击次数:

 

 

  所以,这就使得我们有机会用一个通用型的技术模型去解决在各个领域的感知问题。我们也是看到了这样的机会,就定义了机器人的“眼耳口鼻手脑”,然后在每一个环节打磨技术。在打磨的过程中,我们又想避免自己成为研发型公司,所以我们在每个领域都去推出了相应的产品,让用户去检验我们的技术是不是真的好用。

  比如我们的人脸识别算法拿过好几个冠军,但这只能表明你模型的能力,这是不够的。我们在很多地方都场景落地,这正是互联网公司的优势,我们在全球有几亿的月度活跃用户,我们在美国有最大的第三方直播平台LiveMe,我们每天有几十万的用户在线直播,这直播里面其实都是人脸的数据,这使得我们的人脸识别效果能够很快的提升。

  今天在猎豹自己的办公区,几千名员工,每天上下班、购物、会议室预定、公司会议都是刷脸识别。

  然后我们还做了语音合成技术,就是TTS,昨天小米的小爱同学宣布月活超过3000万,小爱同学所有的声音都是我们猎户星空提供的,我们在这款声音上也是花了很大的力气。

  其实语音合成不是一个特别高技术难度的产品,语音合成更需要你去尊重用户体验,但由于大多数公司很难去发表这方面的论文,所以他们基本上只是在用一个算法去实现。而我们用了大量的拼接技术、去一句一句的听,然后反复的调试,最后我们用语音合成了TTS—小雅的声音,非常温暖、会跟大家打招呼。我们由此相当于开发了一整套以语音为基础的OS。

  大家可能不知道,今天美的音箱、喜马拉雅的小雅音箱以及我们自己的小豹AI音箱,包括小米音箱的大部分语音识别,都是用了我们猎户星空的语音识别能力,已经有超过千万的用户每天都在使用,而且我们接入了很多内容。

  所谓的语音识别,它核心并不是一个所谓多么了不起的黑科技,它的核心是一个新的交互界面。乔布斯说过,每一次交互界面的变革,都是一次产业革命的机会。

  所以,从键盘到鼠标到触摸屏、再到语音交互,其实它是一代又一代的交互革命。所以我极度看好类似于像智能音箱、包括咨询服务机器人(这些产品),因为它再也不需要用户在一个没有见过的屏幕上去触摸,用户只要用最自然的方式去表达,核心不是为了跟这个机器聊天,而是通过语音去获取想要的内容和服务。

  然后我们还做了室内导航的技术,如果一个机器人不能够主动的移动就很难真正谈的上是一个机器人,它和一个Pad就没有什么本质区别,所以我们在这方面也下了很大的工夫。最重要的核心,不是它能移动,而是用很低廉的成本去移动,所以我们用了激光加视觉进行导航,我们的激光传感器成本大概只有几百元人民币,用了大量的算法优化使得激光和视觉能够配合,在室内的空间里能够自主的移动和避障。

  所以,这是一个多模态的导航技术,仅有一个点是很难的,就包括今天视觉,解决不了所谓的大逆光问题,玻璃的问题,我们其实就是用多个和多种类传感器进行相互的融合。

  我们还专门加强了机器人的麦克风阵列,因为我们认为一定要在嘈杂的环境中还能精准的听到用户的反馈。我们在这方面已经完全做到了高噪音下能够基本可用。虽然还不能说100%保证每句话都能听得懂,但对用户来说已经基本可用了,还有语义定义这些就不一一赘述了。