神刀安全网

微软小娜负责人 闫勃:AI发展一靠产品二靠生态

网易科技讯 5月29日消息,网易科技开物沙龙第四季“智能语音与聊天机器人专场”今日下午在北京举行,微软 资深产品总监、小娜项目负责人 闫勃在现场分享了微软在智能语音方面发展新动态以及对智能语音方面的观点。他认为关于人工智能发展有几个绝对因素,一是核心产品,二是生态性,只有产品落地,才能反哺整个技术在产品层面的再发展。

以下为闫勃现场分享观点整理:

有些东西是大公司做的,有些东西是小公司做的,这两者之间的关系是什么?其实很简单,大公司有大公司的优势,拿微软为例,谈的更多是平台,谈的更多是支持技术,其实在各个产品领域、垂直领域的应用,我们还是希望能够支撑大家。

其实人工智能的发展有几个绝对性因素,一个是核心产品,另外一个是生态性,技术说得再牛,最终没有产品落地还是不行,而且经过产品的落地,回头会带动整个产品的发展。

我这个观点提出来跟大家讨论一下:智能语音交互是不是未来人机交互界面?我从三个角度来考虑,跟大家分享一下我的想法。

现在我们可以看到智能语音交互的东西非常流行,大家觉得那就是未来,那就是最最自然的人机交互的方式,实际上要从几个观点来看:

一、什么叫做自然?大家知道,人机交互模式是自然而然衍生的过程,最早我们是读卡片,后来又有键盘,后来又有鼠标,后来又有触摸,大概在三年前,微软推出手势,大家觉得他很了不起,那就是未来,但我们发现再往下走就是语音的自然交互。

某种意义上来讲,我个人认为Chat是一种新型的交互,文本式的Chat或者语音式的Chat,已经变成了一种人们可以接受的自然交互。但你可以想像未来是什么样,未来应该是让在座各位自己选择的你认为最自然的,因为需要根据实时情况决定。

举个例子,比如你要写一篇文章,最自然的应用界面是什么?肯定是键盘,因为要一边写一边想;在厨房做饭做事情,或者医生做手术,双手被占,它的交互方式可能就是听说。

人到了后期会越来越觉得根据自己的需要、特定场景去选择自己认为最自然的方式。有人认为触摸很自然,手指很灵活,反而语音特别啰嗦。而且你可以想像,语音在一些特殊环境下,比如地铁、嘈杂环境中,是不可能用的。所以我们在设计上,未来的自然交互,谈未来的情况,大家在设计产品时,想问题的时候,肯定会想到多种多样的交互方式。

二、自然交互不是最终的目的,它是手段。如果仅仅停留在提供一些信息,可是你要想到人工智能里通过自然交互从里面能够了解到用户的一些行为、一些想法,这些信息对人工智能后端的智能发展起到了很大的作用。

我们看到目前来讲所谓的语音智能产品特别多,一会儿就攒一个,比如微软的牛津计划、讯飞技术包,都能拿得到,你能很快搭一个,剩下的东西在哪里,怎样不断学习,能够从这些信号、这些数据里不断地学习,这更重要。我第一次和人工智能交互和我第三次、第五次和它交互感觉是不一样的,这不仅对微软,对人工智能这个行业也是很大的挑战。

语音交互是自然交互一种很重要的形式,但不是原因,而且交互并不是只为了交互,而是有更深的目的在。

大家知道微软做了两个尝试,有两个产品,小冰和小娜。刚才说通过语音的自然交互,还有一个最重要的目的,随着微软小冰产品的推出和应用,我们第一次提出了“情感交流”的概念,如果机器的声音永远是机器的,很难产生出情感交流。人工智能下一阶段的发展,在电影作品、文学作品里,第一部最突出意义上的感情交流就是《HER》这部电影,主人公和人工智能(虚拟人)之间产生了情感交流。

这种情感交流有两个目的,第一个目的是你相信你的机器人,你只有相信这个机器人才能和它Share这些东西,未来是不是每个人都有自己的个人助理,这是大家的愿景,我们可以跟个人助理分享很多东西,它像闺蜜和朋友一样趴在我们肩上一直注视着我们在做什么,这个交流过程中你要产生兴奋的感觉,这样才能极大的发挥作用,要不然你总觉得和机器说话它总是一成不变的声音,人工智能在未来做到真正意义上的秘书,还有很大差距。所以刚才我们说语音交流不仅仅是达到交流目的,还是产生感情的纽带。

我是小娜的产品总监,大概两年多前我们把小娜带到了中国,在中国我们做了很多本地化的东西,重新定义了这个产品,我们实际上是想把它做成一个真人模型,真人模型到中国来了以后它是什么样的,它的个性是什么,我们把它定义成“知心大姐姐”,你能相信它,这是我们产品定义的核心。

小娜是现在唯一一款跨三个平台的人工智能产品。其实我可以简单介绍一下我们当初设计这个是什么意思,第一个就是“小娜是我的个人助理”,随着时间的增多,她了解我越来越多,就像秘书一样,当然可能很多人都没有秘书,可以想像一下,秘书前几天跟我不太熟悉,不能跟他分享很多东西,但随着时间,聪明的秘书不断学习,我定什么餐、坐什么车、住什么旅馆、行程怎样……秘书都知道,它不是直接跳出来找我,而是通过信任的关系在一个合适的时间、合适的地点能够Be  proactive。

下一步,秘书长得再好看(男女都是),他最主要的功能还是要帮我完成任务,或者在一件事情上,比如五步完成,他用两步就能帮你完成,这是秘书要做的,也是我们设置秘书的原则。第三就是我们通过语音交互的方法和秘书进行交互和聊天。

Be  proactive和语音助手最大的区别,语音助手是被动交流方式,而它是主动交流,包括我的行程安排,今天晚上八点钟飞机回苏州,它会在六点左右提醒我出发,这些东西都是好的秘书应该做的。

Personality,它的个性是什么,其实我们可以看到Personality由三步体现,第一是它的声音、它说什么话、它长什么样。未来我们可以想像满世界都是机器人,不管是具体形式的存在还是虚拟形式的存在,你怎样想像这个虚拟机器人是什么样,是通过这三个方面表达出来的。很多时候,一个人的声音会给你带来无限遐想,很多时候这个人在微信上说一句话,往往会把真人掩盖过去,只是通过他的聊天风格来确定这个人是什么样。这些是我们微软小娜设计的理念。

小冰和小娜,我们把它定位为“微软姐妹花”,因为秘书不能胡说,不能跨界,知道就知道,不知道就不知道,不能忽悠我。小冰作为聊天机器人,就是跟你聊,通过聊天,很多理念慢慢灌输过去,因为它的产品定位、个性定位就是这样一个产品,小冰也是通过文字、声音、图像这三种形式体现出这个人工智能助理是什么样的。我们可以看到从它上市到现在已经达到了4000万用户、150亿次对话、23cps(跟它聊一次天,会有23次来回的频率),可能大家特别喜欢小冰,或者特别无聊吧,人是有聊天需求的。

我想做语音识别的都清楚,自然度评测,1到5分,小冰的评测是4.32,非常自然,如果大家感兴趣以后我们再聊,怎样把口语化的东西体现出来,怎样把小冰的古灵精怪体现出来,小娜是阿朱,比较可信,我可以把信用卡交给她帮我订餐,小冰就像阿紫,古灵精怪,我个人来讲不会把信用卡交给它。(笑)

第二个我们谈更多的就是Robot,它未来的App形式、应用程序的形式是怎样出现,微软提出了很多概念,如果大家感兴趣可以观察一下。

最后谈我自己的感想,我做人工智能很多年,最近这些年真是大发展的阶段,有几点决定了发展,一是计算的突破,计算能力以及数据量上,从深度学习能力的提高,搜集大数据提高机器智能,以及包括语音识别、语音合成,这些技术达到了很高的高度,另外是Sensor,今年我去西班牙参加移动大会,展出了很多IOP的Sensor,不是特别热,而是都在那里,比如衣服里的监控数据,你可能都不知道,但它会马上反馈,还有教育、培训上的一些硬件,我觉得这真是一个大发展的机会。

本文来源:网易科技报道 责任编辑:齐亚伦_NT4779

转载本站任何文章请注明:转载至神刀安全网,谢谢神刀安全网 » 微软小娜负责人 闫勃:AI发展一靠产品二靠生态

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址