社交账号登录

社交账号登录

0/34

上传头像

拖拽或者缩放虚线框,生成自己满意的头像

头像

预览

忘记密码

设置新密码

小米、阿里智能音箱体验,它们到底是下一个“入口”,还是 Siri 一样的玩具?

智能

小米、阿里智能音箱体验,它们到底是下一个“入口”,还是 Siri 一样的玩具?

张智伟 罗骢2017-08-31 15:32:18

我们和阿里巴巴的天猫精灵、小米的小爱同学一起生活了几天。

“小爱同学,放一首雷军的歌。”

“好的,为你播放雷军精选歌曲。”

几秒的停顿之后,一个异常响亮的声音响起,“33333Q! Are You OK?!”

桌面上迷你版空气净化器一般长相的小米 AI 音箱放起以雷军印度演讲素材剪辑而成的鬼畜音乐《Are you Ok》。

第一次接触智能音箱,你很难忍住不去问它一些奇奇怪怪的问题,看看它有多聪明或者多愚蠢。

它居然有一个雷军的歌单,下一步你就会问它:“小爱同学,你的老板是谁?”

这时候它又听不懂了。

就好像 2011 年,Siri 刚出现在 iPhone 上时一样,尽管它常常回答你“我好像不明白”,那些预设好的、你意想不到的抖机灵也会让人感到惊喜:原来它还懂这个。

今天没有多少人养成用 Siri 的习惯。新鲜感过去,“不明白”带来的挫败感就会打消你的热情,它终究是个没什么用的东西。

早几年绑着手机的语音助手都失败了,技术公司们转向了可以独立运作的智能音箱。这个由亚马逊 Echo 两年前启动的趋势最近蔓延到了中国。8 月,小米 AI 音箱开始公测。更早一个月,阿里巴巴的智能音箱,天猫精灵 X1 也开始公测。若琪、出门问问等多家创业公司的产品也已推出。

关于音箱的故事也都差不多。从直接播放互联网服务的音乐,到一句话操控小米米家的智能家电,或者去淘宝下单购物。它是一个入口。

但故事归故事,没用的话还是会被人忘掉,就像 iPhone 内置的 Siri。

所以这些音箱有用么?过去几周,我们和小米和阿里的音箱进行了上百小时的对话。


“小爱同学,你觉得你长得漂亮吗?”

“额,还好吧,我觉得我长得不丑啊。”

考虑到收音和播放效果,音箱是一个你会放在客厅中心区域的东西,所以,一个音箱长得好不好看,外观设计如何,还是挺重要的。

正在公测期间的小米 AI 音箱一看就是小米的产品:白色、造型简单、塑料材质外壳。作为音箱,它拿在手里并不重,机身底部四周打上了很多不规则设计的出音孔,四方形的造型除了顶部转角的弧度略有不同,整体就像是一个迷你小米空气净化器。

首次接上电源之后,音箱顶部边缘的一圈 LED 灯带会开始闪烁柔和的蓝光。在接下来的使用中,这一圈灯带的颜色也是互动反馈之一。几秒钟后灯带会变成橙色,进入配对模式。

这款音箱还未正式上市,小米在音箱上贴了一张二维码,扫了就能下载还在测试中的小米 AI 应用,将手机和音箱配对。

下载完成后的配对很自然,手机会自动通过蓝牙找到音箱,然后提示你输入家里的 Wi-Fi 密码,输完音箱就会自动连上 Wi-Fi。这比亚马逊 Echo 需要先用手机连接音箱生成的 Wi-Fi 热点方便许多。

不过方便也是因为它目前仅支持 Android 手机,应用可以直接控制蓝牙。如果放在对应用限制较多的 iPhone 上,流程会有变化。

音箱的顶部控制区过于像 iPod 的控制盘。上面放置了控制音量、快进歌曲、静音麦克风还有进入配对模式的四个触摸按键,但按下后并没有任何震动或者声音上的反馈,很容易让你怀疑自己有没有正确操作。

按键周围还有一圈触摸条,可以滑动调节音量。由于 LED 灯带里的灯泡太少,你的手指要划出一段才能看到音量变化。

总之需要触碰的操作,在小米 AI 音箱上都体验不佳。但习惯了用声音和它对话之后,你基本上不太会用到这些按键。

“小爱同学”既是小米 AI 智能音箱的昵称,也是它的唤醒词。唤醒后它的灯带会亮起来,并指向你发声的方向。如果网络有一定延后,至少灯带的亮起可以给你已经获得反馈的感觉。

每一次你需要和它对话,你都要用唤醒词“小爱同学”开始,而它每一次都会回应:“欸,我在!”

你也要等它说完这一句之后,才能发出下一步的指令。

“小爱同学,播放一首不同的歌。”
“好的,正在为你播放《不同》。”

音箱最重要的当然是放音乐。

以往蓝牙音箱也可以放 QQ 音乐或者虾米、网易云音乐等服务里的歌曲。但你得在手机上选歌。

目前的智能音箱,如果你下班回到家,瘫在沙发上,想要给家里来点声音,或是在聚会上需要来点背景音乐调节气氛,对着家里的智能音箱说几句话,就能满足这些需求。

面对智能音箱,就简单许多。

“给我放首歌”,它会懂。虽然随机出来的歌,不一定对你的胃口。

如果想精确一点,需要一点技巧。

最直接的方式是明确地说出你喜欢的歌手名字或者歌名,只要曲库里有,它都可以正常播放出来。试试让小爱同学播放雷军的另外一首《 MI,MI,MI 》。

小爱同学也可以识别爵士、摇滚、流行、乡村,也可以点一个特定的风格,比如“放些欢快的歌”,几秒钟之后你会听到“跟着我左手右手一个慢动作,右手左手慢动作重播。”

一旦你的指令描述模糊点,小爱同学大部分推荐的歌曲完全取决于接入曲库的热门榜单。

小爱同学接入了虾米音乐、小米音乐等多家音乐应用的曲库。但是你并不能把你在应用里收藏的歌单导入到小米 AI 应用里。如果你是这些音乐应用长期的用户,习惯在应用里收藏歌曲,暂时还不能指望小爱同学因此学会你的喜好。

小米 AI app 的音乐播放和技能中心界面

音乐控制方面,小爱同学能很好地识别音量加减、暂停、播放等指令,但和放歌一样,你需要明确地说出“小爱同学,暂停播放”这种指令。

智能音箱能识别一些日常的口语,如果播放的歌曲实在难听,你可以大吼一声“闭嘴”试试。我们也曾告诉它“小爱同学,好难听啊”,它懂了。

但是许多从人的角度理解并不复杂的指令,智能音箱因为语义理解的关系,常常会闹笑话。

比如我们对小爱同学说“换一首不同的歌”,你会听到它开始播放《不同》。如果你接下来说“小爱同学,换一首歌”,它的反应则是换了一首也叫《不同》的歌。

想要换歌,最方便地是和它说,“小爱同学,我不喜欢这首歌”。

音质上,小米 AI 音箱自称有大腔体的低音以及底部反射锥的设计,但实际上,差不多也就是你花 299 元可以期待的效果。

总的来说,如果只是回到家里想随便听一些音乐来放松,或者在聚会、游戏的时候来一点音乐助兴,智能音箱的音乐播放能力看上去可以满足要求了。

而且,你也不用担心突然从音箱里传来新消息的提示声或者急促的电话铃声打断音乐。

“小爱同学,除了唱歌,你还会做什么?”
“暂时没有找到《还会做什么?》这首歌。”

智能音箱内置的语音助手很容易让人想起《钢铁侠》里的虚拟助手贾维斯,你只需要和它说说话,天上地下的事它都帮你处理好了。

但是现在,你还不能对智能音箱要求那么高。

目前每一款智能音箱都在不断增加对于查询路况、了解天气、收听电台等生活服务来提高自己的智能感,但瓶颈还是在语义识别上,功能细节也都或多或少不够完美。

  • 闹钟提醒

这是比较实用的功能,你可以设定明天早上 8 点叫你起床,或是 20 分钟后提醒你取下面膜。

但它只能按照基本语义设定提醒。如果你需要它来提醒你明天早上 8 点的飞机,它只会到了第二天早上 8 点提醒你乘坐飞机,而不会像 Google 的音箱一样自动拿到你的航班号,根据路况提醒你几点出发。

另外,你无法用语音删除设置好的闹钟,如果你想取消错误设置的闹铃,你只会听到它又一次告诉你,已经为你设置好该闹钟了。

正确识别的问法:“小爱同学,提醒我 20 分钟后拿掉面膜。”

无法识别的问法:“小爱同学,不用提醒我晚上 10 点吃药。”

  • 单位换算

单位换算或许并不常用,但是随口问一下小爱同学,起码也省了打开手机或者电脑搜索的时间。汇率换算也是一样,网购时了解下当地的汇率还挺方便。

但是它还识别不了比特币。

  • 查询信息

你可以问它,这是什么,但是它不是每次都能解答你。小爱同学播放的答案来自百度百科中对应词条的标题和正文第一段话。考虑到百度百科的质量,这不是什么好体验。

  • 看天气

小爱同学可以很快捷地查询到天气信息。不只是阴晴雨雪,还可以查询值得关注的空气质量,PM2.5 指数信息。

只是 PM 2.5 指数 70 左右的话,它都会告诉你:“北京今天没有雾霾。”并不会说具体数值。

天气功能也比较智能,能听懂“今天下午会下雨么?”

天气可能也会是你最常听到的回复之一。当你开始问它像“北京最近有什么热门电影正在上映”这类它暂时还无法回答的问题时,它的反应就是重复播报一遍天气信息。

  • 查询路况

小爱同学是唯一提供路况查询的智能音箱。但这个功能的限制也很多。

在我们的测试中,你需要先在手机上设置家和公司的地址,然后以这两处为起点获取公交或者驾车的出行时间,以及大致的到达时间。如果想知道其他两地之间的交通情况,只能听小爱同学为你播放从家到这些地方的出行时间了。

而且小爱同学还不能每天定时为你播报路况信息,你能做的只能是每次出门前问它一遍。

正确识别的问法:“小爱同学,从家到望京需要多长时间?”

无法识别的问法:“小爱同学,从三里屯到 798 要多长时间?”

  • 股票信息,还是自己查吧

股票信息查询功能更不完善,小爱同学只能播放股票价格和股价变化情况。

如果你问它贵州茅台的股价,它只会回答说,”贵州茅台的股价收盘价格是 492 元,涨跌幅度为 0.94%。 ”你无从知道,这个股价到底是涨了还是跌了。

我们也尝试查询已经连续停牌许久的乐视,小爱同学可以正确找到乐视网,在交易时段它会告诉你乐视当前已停牌,但如果你在非交易时段,它只会播出很久以前乐视还没停牌时的股价,并不会说已经停牌。

至于投资常会考虑的标普 500 之类的指数涨跌,它也是听不懂的。

正确识别的问法:“小爱同学,今天乐视的股价是多少?”

其它功能:

  • 笑话,既不好笑,也不冷。“小爱同学,说个不太冷的笑话吧?”

  • 播放新闻,直接播放喜马拉雅的新闻音频。“小爱同学,最新有什么新闻?”

  • 哄孩子,会学大象、猪等动物的叫声。但不全。“小爱同学,大象是怎么叫的?”

我们尝试下来,最常用的是闹钟、提醒和换算,只要指令清晰,都可以实现。

至于了解天气、查询词条、收听新闻、电台,听一听笑话,虽然基本可以完成,但是内容都受限于接入的平台或者信息抓取的网站。

无论是好用还是没有意义的功能,在发出语音指令时,你需要完全按照小爱同学能够理解的方式发出明确的指令,才能获得清晰的反馈。

错了几次,多少都会有一种挫败感。

这些音箱需要学习来掌握技能。而你作为用户,也得学习才知道怎么让它听懂。所以,它依然是极客的玩具。

“小爱同学,2 小时后关闭空调。”
“好的,空调已关闭。”

今天中国最完善的智能家具系统来自小米米家。小米自己投资的公司做了从插座、空调、净化器、电饭煲在内的数十款智能家居产品,加上接入的合作厂商,米家系统可以选择的智能家居产品有数百款。

考虑到目前的智能家居用处不大,大部分定价在几十块、一百多的小米产品更适合体验。支持亚马逊 Echo 的一个 Nest 智能摄像头差不多够买 20 件小米智能家居产品。

Nest 前不久推出的 Cam IQ 摄像头,支持 Alexa 语音助手

我们测试的智能家居设备包括可以调亮度的飞利浦台灯、小米空气净化器、米家电饭煲、可以控制任何空调的米家空调伴侣、智能插座。

这些设备都需要先接入米家自己的应用,然后授权给小米 AI 的应用才能通过音箱控制。

米家 app 中部分小米的智能家居设备,及语音控制授权界面

对于大部分产品,音箱能控制的是开关和简单的模式切换。

比如空调,你不用掏手机或者遥控器就能一句话让它开关,或者切换制冷、制热。但目前手机应用里可以控制的定时开关等功能,音箱还听不懂。

灯也是,可以一句话让它关闭,但不能启动护眼模式等具体功能。

空气净化器可以一句话进入睡眠模式,降低转速。但净化器本来就可以根据 PM2.5 情况自动开关,这比用音箱控制方便得多。

同样多此一举的还有用语音控制电饭煲。

在真实生活中,要用电饭煲煮饭,怎么都得自己去放好水米,顺手就可以打开开关、开始煮饭,基本不存在语音来控制它的场景。跟语音切换电饭煲的精煮/快煮等模式相比,远程启动和预约煮饭更实用。加上电饭煲没法感知电饭煲里有没有东西,你告诉它开始煮饭,电饭煲里什么也没有也会直接开始烧。

简单说,你用音箱控制,能做到的都是智能家居的手机应用功能的子集,唯一的区别就是你无须打开手机。

按照小米官方宣传片里的设想,早晨醒来,对音箱说一句“早上好”,小爱同学会自动播报天气、拉开电动窗帘、电热水器开始烧水、提醒路况和限行信息,甚至还可以接通煮蛋器电源帮忙做早餐。

在过去,这些操作全部都要手动完成。有了零零散散的智能家居产品之后,你需要更频繁地拿起手机,在对应的 app 里按一堆按钮,也不算方便。

而小爱同学则作为特定场景下的指挥中心,可以将这些设备的开关和工作状态自动化,免去了不少自己动手的麻烦。但这个功能还没开放。

此外如果同时连接的米家设备很多,小爱同学的自动化场景会在一定几率下出现某些设备控制失败的情况。

一句话就能关灯、关空调是挺方便的,但这也不能让目前并不很实用的智能家居变得特别实用。

“我要包邮的。”
“您没有回答我的问题,我先退出了。”

天猫精灵,是阿里云人工智能实验室研发出的一款智能音箱。用“你好天猫”或“天猫精灵”两组词都可以唤醒它,还能通过语音在淘宝上买东西。

大声说出这两个词都比较奇怪,家里不只一个人的话,你可能会觉得不便。

外观上看,这款纯黑色的柱状音箱除了小巧轻便以外没什么特别。作为放在家里不用随身带走的音箱,过于轻便往往只意味着音质差。

跟小米 AI 音箱不同,天猫精灵的 LED 灯带藏在了音箱的下方,被唤醒的时候会闪烁白光,但没有声音反馈。

499 元的天猫精灵
天猫精灵的 LED 呼吸灯位于底部

在我们测试的这段时间里,由于毫无听觉反馈,常常需要专门望一眼才知道是否成功唤醒。这应该算是产品设计上考虑欠妥的一点。

天猫精灵的机身主体同样是普通的塑料,顶部采用 6 麦克风唤醒阵列设计,中心是麦克风静音按键,腔体内部仅有一枚 5W 的扬声器,音质并不理想。

在只部署了 5G Wi-Fi 的好奇心日报北京办公室,天猫精灵要开手机热点才能联网。

如果你习惯使用 5GHz 的 Wi-Fi 网络,那么给天猫精灵配网很可能会遇到麻烦。这款音箱只支持 2.4GHz 频段的无线网络。工程师的回应是,考虑到室内 2.4GHz 比 5GHz 拥有更强的穿墙能力,因此采用了一枚单频段 Wi-Fi 芯片。不是很有道理。

在没有 2.4GHz 无线网的情况下, 你必须拿手机开热点才能用上天猫精灵。

它的重点功能是购物。为了解决支付难题,阿里云人工智能实验室专门为天猫精灵开发了声纹支付技术,你可以直接用语音下单付款。

但是,能买到什么,才是难题。

在我们的实际体验中,单单是挑选商品就能有非常强的挫败感。比如说,天猫精灵,我要买零食。这位人工智能助手会回答:“为您推荐天猫超市的乐事薯片三连罐装,售价 19.9 元,暂不包邮。”

但天猫精灵没有告诉我这三连罐分别是什么味道的薯片。用其它类别的商品做测试差不多也是这样的结果。

天猫精灵给我推荐的乐事薯片

比如买洗衣粉。第一次,天猫精灵为我挑选了奥妙的一款洗衣粉,但不包邮。我接着下口令说,换成包邮的,天猫精灵却随即表示“您没有回答我问题,我先退出了”。

天猫精灵虽然可以根据语音信息推荐商品,但它既不会详细介绍商品信息(比如外观颜色、款式等),也不支持语音挑选。

以山地车为例,我对天猫精灵说想要买一辆山地车,它先给推荐了一款 27 变速的永久,红黑配色。你说“换一种颜色”,它索性连车都换掉,推荐了另一辆新的捷安特。

也就是说,天猫精灵的语音购物,既不支持选择包邮商品,也不能更改商品规格,云端推荐什么就是什么。在不清楚商品规格的情况下,基本不会有人贸然下单。

以目前天猫精灵的智力水平,对于绝大部分商品,它最多也只是添加到购物车,完成购买还是得打开手机。

标准化的商品,比如优衣库的袜子,可能就比较适合直接购买。但当一位男性记者说要买一双优衣库的袜子的时候,它推荐了一套女士袜。

天猫精灵的技能中心,以及它为好奇心日报男记者推荐女装袜子的截图。

天猫精灵在用户数据层面已经跟淘宝的账号体系打通。一旦用淘宝账号登录了天猫精灵 app,所有的历史购买记录、搜索和收藏记录等数据理论上都可以为天猫精灵所用,而实际并非如此。

为确保不会被人随便下单。天猫精灵在购物支付时会需要录入本人的声纹,即“天猫精灵+随机的四个阿拉伯数字”。

当你发出指令说天猫精灵帮我充 100 元话费的时候,音箱会向你确认是否为 1xx 的手机号充值 100 元?确认号码无误之后,就会进入声纹验证环节。

你必须处在一个安静的环境中,再按照音箱的提示说出“天猫精灵+四个阿拉伯数字”。验证成功后,它会自动从你的支付宝自动扣除 100 元,扣款顺序以默认设置为准。

在我用音箱充话费的几次尝试中,声纹验证环节最容易出差错。这个过程对背景噪音非常敏感,室内环境中的猫叫、扫地机器人工作等声音都会影响验证。

除了充话费,天猫精灵还能帮忙叫外卖。不过大概只有当你味蕾失效的时候,才会习惯这样的外卖。

比如天猫精灵在《好奇心日报》北京办公室会推荐国贸附近的庭尚客牛肉汤,优惠后价格 31 元,号称是附近好评率最高的外卖。如果你不想吃牛肉汤,天猫精灵不会让你更换这家餐馆提供的其它菜品。

唯一方便的是再点一次昨天点过的菜。如果你每天只吃相同的外卖,是挺方便的。

除了放音乐以外,它们更多还是极客的玩具

智能音箱的火热主要来自亚马逊 Echo 令人意外的成功。

按照摩根士丹利分析师的预测,从 2015 年年中截止到 2016 年 12 月 1 日,亚马逊共卖出了 1100 万台 Echo 音箱,超过 1000 万台来自美国市场。

这意味着,平均每 7 - 8 个美国家庭中就有 1 个购买了 Echo。

iPad 之后,还没有任何一个新类型的智能产品获得过如此的成功。

Echo 成功之后,被亚马逊当成了关于人工智能的未来故事,将它描绘为一个不依赖智能手机的入口。它的广告开始谈购物、谈智能家居。甚至因为 Echo,亚马逊也成功推进了它做了十几年却没有起色的音乐服务。

智能手机已经基本停止增长,一个新的入口意味着新的增长。从 Google、苹果,到国内的大公司京东、阿里、小米再到各路创业公司,都做起了智能音箱生意。

从基本造型,搭配的手机应用,再到灯带乃至灯光颜色的设计,你都能在国内这几款音箱上看到亚马逊的影子。

Amazon Echo | 图片来自 BI

做一个智能音箱并不是很难,中国拥有智能音箱需要的全部生产要素。从麦克风阵列、全频发声单元、到远场识别算法、自然语言处理,所有的方案和供应商都是现成的。

这些音箱放音乐也都比蓝牙音箱方便。你可以一句话放歌,而且不会被微信通知打断。现在的体验不足也会随着软件升级而解决。

但做一个不只让人听音乐的智能音箱就是另一回事了。

智能家居里,音箱能做的还是一些非常简单的事。而且真正有意义的智能家居本该不需要你操心,比如霾重了就自动开净化器。你起床了就自动拉窗帘。

今天几家公司的智能家居平台还需要你自己花时间像搭积木一样设置一个一个产品,折腾上几小时让以后每天省一分钟。没有多少人会这么干。

音箱只是省去了点屏幕的那一步,关个灯还算方便。但整个智能家居的问题并没有被音箱解决,它也不会被音箱解决。

至于购物,刷淘宝是很多人的习惯,而追求效率的话直接在淘宝、京东的应用里才最快。

只有当你想逗音箱玩,或者想被音箱耍着玩的时候,才会用它“购物”。但就像 Siri 那样,和音箱玩耍的兴奋会很快过去。

事实上,根据早先对于亚马逊 Echo 用户的调查,它的上千种功能里,超过 1/4 用户会用的功能只有三个:放音乐、开关灯、设闹钟。

其它功能,还只是极客的玩具。像 Siri,这些功能会让人兴奋一会儿,但也只是一会儿。


题图:作者拍摄

喜欢这篇文章?去 App 商店搜 好奇心日报 ,每天看点不一样的。