金沙网上娱乐平台 > 国内彩讯 > 澳门赌博官方网站大全,的卢深视科技户磊高交会演讲:从深度感知到三维识别

澳门赌博官方网站大全,的卢深视科技户磊高交会演讲:从深度感知到三维识别

2020-01-11 14:54:10来源:金沙网上娱乐平台

澳门赌博官方网站大全,的卢深视科技户磊高交会演讲:从深度感知到三维识别

澳门赌博官方网站大全,“第二十届高交会-中国高新技术论坛”于2018年11月14日-16日在深圳举行,本次论坛的主题为“坚持新发展理念、推动高质量发展”,北京的卢深视科技有限公司创始人兼CEO户磊出席配套会议“未来科技峰会”并演讲。

日常生活中,我们比较熟悉的是图象的感知,不管是一般图象的拍摄还是视频的拍摄,而户磊提到了三维视觉产业跟图象有层次的类比,分为三个层次,第一个层次是三维感知,第二个层次是三维重建,第三个层次是三维世界形成完整的还原。

以下为演讲实录:

户磊:三维视觉是蛮学术的概念,简单讲就是人的感知能力,感知是一个非常重要的,我们构成一套完整系统的重要的方面,感知、决策、显示、展示,三维视觉是非常直接的感知方式。相比较而言,大家比较熟悉的是图象的感知,不管是一般图象的拍摄还是视频的拍摄,我们认为三维视觉产业跟图象有层次的类比,让大家更容易了解,图象的话,可以分三个层次,第一个层次叫成像,物理世界到图象的识别。其实还有一个层次叫SP(图象处理)原始的图象有很多噪声,信息也很丰富很冗余的图象,许多经过图象处理的层次,把它定成人眼看起来真实的世界,其实这几十年的图象产业的发展使得我们的价格越来低,能力越来强,越来越小型化,手机拍照的能力已经取代了单反的能力了。再加上互联网等等一系列的应用走入千家万户,使得互联网出现了大量的图象,现在的图象各个方面都是非常重要的基础,整个产业发展经历了很长的变化。

三维视觉也可以分为三个层次,首先是深度感知,一般来讲,我们的二维成像是XY成像的捕捉。三维的信息感知才构成了完整的三维信息感知,这个层次我们称之为三维感知,通过结构光或者是类似雷达的方式,我都是获取产品当中的深度信息形成深度图象,在深度感知之上,我们还有第二个层次,我们认为是三维重建的层次。这是在单一视角固定的点上获取的具体信息,它不是完整的物体三维形状或者一个三维世界完整的还原,我需要多信息融合,形成不管是人、人体、场景、物体完整的重建,对于三维世界形成完整的还原,这是三维重建层要做的事情,在此之上我们催生出三维的各种各样的应用,不管催生、测量、识别、交互都是三维正套可以支撑的应用。

有这么一个维度给大家一个概念,还是从感知能力上面讲的,感知能力可以分为几个等级,分米级、厘米级、毫米级、亚毫米级,分泌级的包括室外场景重建,低精度SLAM无人驾驶,低精度物体分割。厘米级是活体检测、物体分割、体感动作识别、基本手势跟踪、SLAM、室内场景重建。毫米级感知能力是能支撑更精细或更好的应用,包括人脸表情识别、人体重建与精准测量,包括中小物体精准重建测量,利用到AR和VR的当中,如果我的感知能力是亚毫米的话,我可以把人脸的皱纹和衣服的褶皱都能精准的还原出来,还可以利用到精度制造、缺陷检测等领域。如果能做到每一个不同的感知能力,可以支撑的应用。在非常基础的应用之上,他们交织在一起,再与其他的感知传感器结合在一起,就能支撑产业的变革。

三维视觉技术栈,比较经典的包括像苹果上的结构光,ToF也是这样,这个表格其实内容比较多,我就不一一细讲了,简单来说,近距离的高精度,结构光是一个选择或者是必然的选择,苹果10是具有非常里程碑性质的深入的设备或者应用。远距离的稳定的精度ToF是更好的路线

在当前的感知路线当中没有哪个更好或者哪个能100%覆盖其他技术的方向,在如何选择深度感知传感器或者是构造一个深度感知传感器,就是要谈应用的,脱离应用就很难谈覆盖的传感器。我们当前落地的是三维是绝对人的积累和技术应用,包括人脸、人体,对整个精度要求会更高,对产品距离本身要求没有那么高,现在我们首选的深度感知方面,我们现在也在结构光感知这块。

我们自己本身可以达到很高的一个精度,同时具备了非常长的产品化的能力,包括实时动态深度纠正和自动标点,在FPGA、ARM等技术的实现。这是重建,为什么要做重建呢?本质上我们需要融合多视角的深度。这也是关于三维重建维度的看法,可以分为场景、刚性物体重建、人体重建、人脸重建,柔性物体等,衣服的这种可以无穷变化的,这个呈现的难度,目前在结构方面也很难解决这个问题。

这是一个大概的精度的比较,这边是我们的三维人脸的精度,现在是世界领先的水准,我们积累的三维人脸的数据在二维重建三维的领域上面,我们本身也得到了很多的益处,也能得到很高的精度。这块是给大家带来的一些演示,一些视频,这是一个脸谱换脸的模型,中间最重要的东西是会做一个人脸的重建,不是通过简单的拟合做脸谱的贴合,因此可以贴合的非常的精细。

这是人体的重建动作捕捉,主要强调的是动作捕捉,右边其实是做的比较丑,因为我们不是做动画出身的,就是粗糙随意的一个化身模型,左边就是人的动作如何迁移到右边的模型上去,这些都是基础的能力,基于这些可以服务于不同的行业。

我们自己当前主要的应用还是应用在三维人脸识别上面,也也是我们当前落地的主要应用,在人脸识别或者人的身份管控领域,当前基于人脸识别还是面临三个问题,准确率不足,安全性无法全面保障,对于照片视频3D面具攻击难以保障。