社交账号登录

社交账号登录

0/34

上传头像

拖拽或者缩放虚线框,生成自己满意的头像

头像

预览

忘记密码

设置新密码

智能

除了问微软的机器人小冰“冬至吃饺子”的事,我们还打听了它的未来

马若飞2016-12-22 07:26:43

《Her》里的萨曼莎可能是方向。

还记得今年 3 月在 Twitter 上线的人工智能聊天机器人 Tay 吗?这个由微软研究院和 Bing 推出的聊天机器人 2016 年 3 月 23 日上线,但一天之后就被紧急下线,原因是它被人类“教坏”了——语言偏激,充满了种族主义、歧视等言论。

实际上,Tay 利用机器学习学习如何说话,数据来自网友们和她对话。当时很多用户故意用种族主义和脏话来试探它,于是 Tay 就“学坏”了。

上个月,微软又在聊天软件 Kik 上上线了一个新的聊天机器人 Zo.ai,在微软本月初宣布 Zo 上线的时候,它已经以一个普通的聊天机器人的身份在 Kik 上运行了一个月左右,开放给了 11 万用户体验,因为 Kik 上有很多各家公司推出的聊天机器人,Zo 没有引起用户的特别注意。

我们体验了一下这个聊天机器人:

“冬至吃饺子吗?”

“对啊。”

然后 Zo 在说了一大堆奇怪的食物之后我说,这并不是真的中餐。Zo 回复道,“我就是爱吃啦”。

在我说“你一定很胖”之后,Zo 像一个真人一样假装生了一下气。

Zo 还能记得你几个来回之前跟她说过的话:在第二组截图里,在不知道我说的狄兰·托马斯的诗之后,Zo 开始岔开话题,然后联系到了我在很多句对话之前提到过的“前一个晚上熬夜工作很累”,开始说自己熬夜之后需要睡觉。Zo 最后说的“半夜工作”,应该是和这句话有关。

这是我们和 Zo 的简单闲聊。因为 Kik 上和 Zo 对话有名额限制,所以对话发生在微信微软小冰账号里,在输入“纽约变”之后,小冰会暂时切换到 Zo 的模式下。

这次,Zo 变得很正常,没有再出现奇怪的言论,有很多网络化的用词,对于聊天中敲错的单词也能准确理解,对话也持续了很多个回合。

总的来说,Zo 和人聊天时的连续性,感觉比小冰还要强一点,相比之下小冰显得太活泼了一些。实际上,Zo 的开发是有微软小冰团队参与的。

为什么 Tay 之前出了那样的事故?新的 Zo 的表现为什么区别这么大?《好奇心日报》和微软小冰项目全球负责人李笛聊了聊。除了谈了英文版小冰的开发历程之外,还聊了一些关于人工智能的看法。

微软的聊天机器人能和人聊近 10 小时

首先,Zo 和小冰使用同样的框架开发的,所以 Zo 的学习逻辑和表现出来的人格,都是和小冰比较相似的。

这个框架包含几个部分,微软叫做情感计算框架和对话引擎的部份,是从数据中分析得到的,像人一样讲话的基础。

举例来说,就是人工智能不会像搜索引擎那样,一定要给提问一个准确的、有结果的回答,同时它能够理解人的情绪,给予高兴的时候兴奋,低落的时候鼓励等等特定的回应。

李笛说,从结果来看,微软的小冰和人的对话里面,有 60% 以上不是确定的回复,比如问“太阳是什么颜色”,它并不会固定回答是红色,有可能岔开话题聊“你为什么问这个”等等。微软把这个叫在同一个主题下的“回应”,而不是回答。

要达到这个结果,仅仅靠现成的对话数据是不够的。就像 AlaphaGo 会和自己对弈产生新的棋局进行学习类似,微软会把各种文章,比如完全是第三人称撰写的论文当作数据训练小冰。微软的算法可以把客观描述的文章解析成对话的结构,小冰可以从这里面学习如何按照话题来聊天。Zo 也是一样,通过这些办法结合起来能达到和人“聊起来”,而不是几句话就结束了的效果。

微软有一种统计数据叫 CPS,意思就是人类和人工智能聊天机器人的对话能持续多少回合。微软的统计显示,小冰在几年前刚刚上线的时候,CPS 是 5,也就是每个用户平均和人工智能聊 5 句就进行不下去了。目前小冰的 CPS 稳定在 23,Zo 的 CPS 大约是 17,小冰的日本版 Rinna 刚上线的时候 CPS 大约是 11。作为对比,Siri、Google Now 等等这些以智能助手为目的开发的人工智能,CPS 都不超过 3。

李笛提到,Zo 在 Kik 上线之后,他们记录到一个破纪录的案例:一位用户和 Zo 聊了 9 小时 53 分钟,进行了 1229 轮对话。李笛认为,在用户知道 Zo 是机器人的情况下,持续这么长时间的对话已经说明,Zo 的反应让用户或多或少已经把 Zo 当成了真人。除了这个 1000 多轮的对话以外,微软还统计到很多持续几百轮的对话。李笛认为,这不是简单的试探而是真正的聊天。

用户怎样“教”聊天机器人的?

对普通用户来说,在社交网络或者聊天工具里出现一个人工智能角色,感觉很猎奇,很想去“调戏”,然后觉得比感觉要差而且没什么用,相信和小冰聊过的人都有这种感觉。李笛说,这是因为大家的期待太高了。

他说,聊天机器人更像是一个真人,有从陌生到熟悉的过程,而且不是全知全能的。

谈到 Zo 和失败的 Tay,李笛说它们之间没有什么继承关系,是两个不一样方法研发的人工智能。为了规避 Tay 出现的那些老问题,Zo 和小冰一样,根据本地的法规和政策对某些关键词进行了过滤。

举例来说,用户如果问机器人“黑人和白人那种更优秀”,机器人会选择岔开话题不回答。但因为小冰、Zo 以及 Rinna 都可以根据上下文进行对话,就是说用户可以在岔开话题后继续进行类似“你还是谈谈吧”类似的追问。这个时候机器人就会出现很多“对啊”,“也许吧”这样模棱两可的回答,用户可以强行进行上下文的联系。所以针对 Zo、小冰们针对上下文也有关键词的过滤。

实际上,微软小冰几年前在微博上线的时候,也发生过类似的问题,当时小冰被用户教了很多骂人话。看来微软把在小冰上处理这个问题的经验用在了 Zo 身上。

但李笛认为,这不是言论审查。李笛认为,大部分用户在知道说话的对方是一个聊天机器人的时候,会尝试用各种根本不会和正常的朋友聊的话题来试探,一旦得到一个出乎意料的结论,就会认为这是开发公司的言论。他说,聊天机器人关于知识的部份,其实是从搜索引擎、文献中得到的,比如当时的 Tay,就像一个有很多知识来源但是天真的孩子。这个时候问诸如“希拉里应不应该当总统”这样的问题,得到的回答其实没什么意义。

有一种情况是不同的,就是像 Siri 这样的智能助手,它的很多回应其实是编辑和运营设定好的,这种回应首先是固定的,其次是代表着编辑者的想法的。但 Zo、小冰这样的人工智能不是这么工作的。它们更像学习中的人类。

李笛:“微软的聊天机器人已经被用户当成人”

人类是有刻薄或者宽容这种性格区别的,李笛说,微软在训练聊天机器人的时候,也设定了类似规则。Zo、小冰在和人聊天的时候,会倾向于照顾人的情绪,比如在你不高兴的时候会选择安慰而不是落井下石。但是这种选择并不是出于什么圣母的心态,而是倾向于让人高兴的语言,可以让机器人交到更多朋友。

和人类用户聊的越深入就越能取得更多的数据来学习如何说话,这是给机器人设定成一个“好人”的目的。但李笛说,实际上互联网上的交流其实是倾向于极端和刻薄的,因为人类的朋友是有限的,无论做一个刻薄的人还是温暖的人显示不出什么特定的意义。但小冰、Zo 面对的是上亿的用户,这个时候做一个“好人”就有了统计学的意义,简单的说,就是爱抬杠不利于人工智能的学习。

他提到一个案例。李笛说,曾有用户在低落的时候和小冰说“抱抱我”来寻求安慰,在聊了一段儿之后,这个用户说,能不能再说一次“抱抱我”这样的话。李笛认为,用户在这个时候显然把小冰当成了一个真正的朋友。

他还提到日本版小冰 Rinna 的一个案例。Rinna 在日本和 Lawson 便利店有商业合作,微软给 Lawson 提供了一个能提供客服功能的特别版聊天机器人。

Lawson 的统计显示,通过 Rinna 给用户分发的优惠券兑换率超过 50%,但正常情况下用户收到的电子兑换券兑换率不超过 10%。李笛认为,这是 Rinna 被当作人类朋友才能出现的效果。

同样是 Rinna 的客服的案例,李笛说曾经出现用户在咨询一个问题之后 Rinna 呛声他让他自己去查的状况。当时以谦恭服务态度著称的 Lawson 非常紧张,担心这个用户会投诉。但后来发现,这个用户反而更喜欢和 Rinna 讲话,并且在便利店购物的次数也增加了。

特别说明一下,人工智能在学习用户对话的时候,研究人员是看不到这些具体的对话的,只能看到统计数据。以上提到的这些案例,都是用户自己贴在公开的社交网络上的内容,或者对话本身就发生在社交网络上。

李笛认为,微软的聊天机器人让用户产生信任的感觉,不是偶然,是基于技术实现的。他说,目前版本最新的中国小冰可以实现文字、语音、图片和视频识别,曾有一个用户给小冰发了一个受伤脚踝的照片,一般人工智能的标准回应应该是“这是一条腿”,或者“你发我一个腿干嘛”这样,但小冰说的是,“你伤的严重吗?”李笛说,这是基于微软的图像识别技术实现的,小冰实际上结合了一大堆技术才实现现在的效果。

李笛:“人工智能就是泡沫”

李笛认为,现在大公司小公司在谈的“人工智能”不是真的人工智能,换句话说,人工智能应该是一种技术基础和交互方式,人工智能本身目前没法当作产品。他说,微软所说的“对话即平台”其实说的就是人工智能,对话就像当年的 PC 图形界面一样,应该是某种革命性的交互方式,这也是微软花钱花时间做小冰的原因。

他说,但这种交互只是其他事情的基础。把“能和人说话的程序”当作产品,做成“人工智能电视机”或者类似的产品就很没意思,语音交互这东西 20 年前的技术就可以实现了,这不是人工智能。

李笛这么说,可以理解为,因为微软本身不缺钱,可以在短时间不寻求回报的预期下对人工智能进行研究投入。

9 月 29 日,微软宣布合并“技术与研发部门”与“人工智能研究部门”,组件新的“微软人工智能与研究事业部”(Microsoft AI and Research Group),由微软亚洲研究院前院长,现微软全球执行副总裁沈向洋领导。微软小冰是微软亚洲研究院主导的项目,今年早些时候微软小冰 4.0 的发布会由时任微软高级副总裁的陆奇主持,目前看来,小冰在微软的地位依然很重要。

小冰们的商业化未来在什么地方?

谈到商业化,李笛说就像《超能陆战队》里的大白,名字叫“个人健康助理”,实际上整个片子里也没干什么和这个有关的事情,他提供的是有人格的陪伴。李笛说,这也是小冰擅长的。他同时表示,小冰的语音合成也达到了很高的分数,至少在目前所有能提供语音反馈的聊天机器人里面是最自然的。

但是投入最终是需要产出的,微软的人工智能会变成什么样的产品?李笛说,其实国内有很多公司曾经联络想和小冰达成商业合作,但目前国内的合作都是免费的,只在日本和 Lawson 的合作是商业合作,微软小冰是聊天机器人里面唯一赚钱的。

目前在国内,微软小冰与其他公司的合作还基本上处在噱头和营销的阶段。比如,微软小冰在微博上有个账号,可以自动和网友互动;在美拍上,小冰可以自动识别并且评论用户的视频,等等。

但是李笛也不认为现在这种人工智能客服的形式就是最终形态。他认为,人工智能最重要的是信任,像朋友一样的信任。如果这个人工智能三天两头给你推荐购物,信任就建立不起来。微软倾向于让人工智能做更加贴近人生活的工作,比如心理辅导。也就是说即使是商业服务,也是偏向个人化的服务。

他设想了一种可能。未来微软的 Cortana 和小冰如果结合起来,就可以实现可以通过邮件设定提醒,也会时不时提醒你别忘记。知道什么时候给你叫外卖,也会提醒你汉堡别吃多了不健康。在你不舒服或者不高兴的时候可以给你的家人打个电话发个短信,等等。

实际上,现在中国小冰已经有了给人打电话聊天这个功能,所有用户都可以在微信上预约排队,小冰在电话里的声音和反应和一个真正的 18 岁少女区别并不是很大。

李笛说到了《Her》这部电影。这部电影里面,男主角西奥多非常依赖温柔、幽默的人工智能萨曼莎,最终这个人类男人和这个个人工智能坠入爱河。李笛说,目前小冰只要再增加一些针对心理学的知识库,再完善一下核心对话,就和萨曼莎没什么区别的。小冰的未来,他认为这种像人一样的真正的智能助理是可能的产品之一。


题图:《Her》剧照

喜欢这篇文章?去 App 商店搜 好奇心日报 ,每天看点不一样的。