社交账号登录

社交账号登录

0/34

上传头像

拖拽或者缩放虚线框,生成自己满意的头像

头像

预览

忘记密码

设置新密码

智能

街景动了起来,只需要几(千)行代码

钟舒婷 2015-07-10 16:12:23

Google 在人工智能上投入的研究,对产品的影响越来越大

在世界各地跑来跑去的 Google 街景车,已经收集了 50 多个国家和地区的景色,其中不乏热闹的景区和荒凉的不毛之地。

然而,除了几张单调角度的静止图片,Google 认为街景的呈现方式应该更动态。因此,他们用了一个算法,让街景的体验从静止到动态,从二维转到三维。

Google 街景通常只展示了一个景点不同角度的数十张图片,而一个流畅的视频,至少要达到每秒 24 帧,如果只是单纯地将街景图片合在一起,看起来就像在快进。

而这组名为 DeepStereo 的算法,结合了图片识别和深度学习的技术,在综合分析 Google 街景中的二维图片后,能将其中缺失的图片帧数创造出来。

据小组负责人 John Flynn 介绍,DeepStero 的工作原理是这样的:数据库中收集了街景车拍摄的 10 万套图片,然后小组会从系列图片抽走一张,然后要求计算机分析前后图片,从而将缺失的图片创造出来。最后,小组成员会对新旧图片进行对比等级评分。

在处理图片时,计算机会将每张图片分解为一个个单独的像素,通过对比前后图片的像素,决定新图片中每个像素的深度和颜色。平均创造一张图片就需要 12 分钟。

从视频效果来看,整体来说较为流畅,但是部分物体,例如树木和玻璃的效果很差,大量细节丢失,虽然小组解释说这是为了体现运动模糊的效果,依然可以看出这个技术仍然处于初级阶段。

但是,通过给计算机“出题目”,是检验深度学习成果最好的方法之一。

事实上,这个算法属于 Google 图片生成技术 Inceptionism 的一部分,在上周开源部分代码后,人们利用 Deep Dream 代码创造了不少非常现代化的图片。

题图来自 marekfiser

喜欢这篇文章?去 App 商店搜 好奇心日报 ,每天看点不一样的。