机器视觉可以超越人

2016-07-07新闻资讯

0I1304049-0.jpg

科技讯6月28日消息 由科技和媒体新闻联合主办的“第三届媒体未来科技峰会”今天在北京国贸大酒店召开。在下午的人工智能分论坛上,商汤科技CEO徐立表示,机器视觉从流程上来说分三大部分:第一部分,成像;第二部分,感知;第三部分,识别。机器视觉能解决什么问题?除了复现人对图像的识别,还可以超越人。“互联网上超过70%的内容是视觉内容,我们希望帮助上下游企业打通人工智能的视觉。”徐立说。

现场实录:

徐立:谢谢主持人,多谢美女主持人,也多谢刚才的美女机器人。我在想未来会不会主持人的活被机器人干了。我们在讲人工智能课题的时候,或者是这个话题现在变得比较热,很多讲机器人都是一种表现形态,但是最后的技术大家通常会觉得离我们比较远,离现实的过程,距离人还是比较远的,相对来说很有未来感、科技感。但是我想讲的是关于人工智能的视觉的部分。我们做的是计算机视觉,也就是说让机器代替人来完成眼睛、大脑的合作,通过视觉信息的输入,来给大家一个更好的理解。

这是主题的内容,叫看得见的人工智能。为什么说看得见这件事情非常重要?首先我们感知这个世界的最大的源头,或者说互联网上操作70%的内容都是来自于视觉的内容。所以用视觉的内容其实是有更多的表现形式。商汤做的事情是人工智能视觉的,我们希望通过万物互联到万物智联的过程中,帮助上下游企业打通视觉这一关,面向改变更多的视觉内容。

讲到计算机视觉、机器视觉还是很陌生的,虽然我们知道我们想用电脑或者计算机来改变现有的状态,机器人有眼睛,机器人可以理解,这部分的视觉到底包含什么内容?从现在行业的内容,以及学术上的理解给大家作一个简单的介绍。机器视觉从整个的流程可以分为三大块,第一块就是可以模拟人的眼睛的部分,机器也是像人一样,需要捕获更高质量的图像,机器可以超越人,它得到的影像和内容可能比人得到的更加清晰和完美。第二部分就是所谓的感知,感知这一层比较有意思,我们在看这个世界,世界不是2D的,这也是我们现在讲的AR、VR的技术,因为视觉是3D的,因为世界不是静态的,所以世界有运动,这一类内容被称为感知层。最后是常规介绍的,对这个视频输入的一个真正的识别,这一层就对应到人的感知系统。