社交账号登录

社交账号登录

0/34

上传头像

拖拽或者缩放虚线框,生成自己满意的头像

头像

预览

忘记密码

设置新密码

智能

机器人已经在看体育比赛,不过不是为了消遣

王民超2015-04-13 16:13:09

从三年前识别视频中的静物,到如今能看懂视频中人们在干吗,Google 的人工智能进步明显。

人工智能识别图片早不是什么新闻,Google 想加大难度,让它能识别长段的动态视频,目前它们在体育视频的识别方面似乎干得不错。

人工智能识别视频的基本方法还是一样:深度学习,利用已有的数据库建立一套算法,再用新的数据来测试、修正,不断“学习”、提高识别正确率。目前在不同数据库的测试中,Google 的识别模式的正确率都超过了现有的公开研究成果,正确率增幅最大的,将识别率从 60.9% 一举提高到了 73%

相较图片,动态视频提供了更多可供识别的信息,但大大增加了计算的复杂性,一些细微的差别也能迷惑高精度的识别系统。Google 称一名运动员跑步时两张极其相似的截图,仅仅因为摆臂的不同,计算机识别系统就给出了截然不同的给分。


两张极其相似的跑步截图的识别结果并不相同

为了解决这一难题,Google 开发了两种算法,第一种叫做“特征整合”(Feature Pooling),逐帧提取画面上的信息,然后加以整合;另一种则是从“长时段短期记忆装置”(Long Short Term Memory units)发展而成的 RNN 系统,允许系统从整体上自主判别视频各部分的重要程度,以用于识别。

不过这两种算法都只能识别出视频中明显的运动信息,但对隐含的信号则无能为力。为此,Google 将明显的运动信息用光流模型的形式输入,就像下面右边这张图,这种形式的图像和清晰图像一起给两种算法识别,以便其更全面地识别图中的运动。


左图为基于像素的视频,右图则是“光流模型”格式的视频

就像在 Google 发布的演示视频中,有一个片段是两个人交谈后打架的画面,Google 的系统很快便识别出了“形意拳”(Xing Yi Quan)。在该段视频中,Google 的识别系统还能准确识别出:摩托车比赛、遛狗、山地越野独轮车骑行等复杂运动。

事实上,这并不是 Google 第一次训练人工智能系统识别视频,早在三年前,Engadget 就报道了 Google 新专利能让系统识别出动态视频中的静物,不管是人还是电线杆,Google 的系统都能一眼看穿。如今,Google 又实现了动态运动的识别,也许哪天 Google 还能研发个解说机器人,陪你看比赛、帮你解说。

喜欢这篇文章?去 App 商店搜 好奇心日报 ,每天看点不一样的。