Hi,欢迎来到物公基!
X
X
首页> 新品速递>3D机器视觉,你所不知道的改变

物公基资讯

展会推荐 行业峰会 新品速递 企业新闻 行业动态 资本资讯 前沿科技 产品知识 资料库

3D机器视觉,你所不知道的改变

在科幻小说中,机器人要么是与人类敌对,要么是变异成坏人。但现在现实生活中机器人的运用大为不同。机器正代替人眼来看国际并加以举动,它们所到之处让生活变得才智化。
通过摄取图像模拟人眼的视觉功用,提取信息然后加以分析处理,机器视觉已成为才智城市过程中不可或缺的“第三只眼睛”,其运用领域也从食物生产流程办理、农业栽培操控、医学检测等方面的个别需求到交通及安防等公共项目。其间我司深圳朗锐智科实业有限公司研发的鸡蛋收集线计数器,就被投进到家禽养殖场运用,在运用过程中可以进步功率和降低成本。
跟着机器视觉的发展与进步,3D机器视觉迎来了自动化行业的巨大机会,主要用于质量保证和检测。据数据预测,2017年到2022年期间的复合年增长率将到达11.07%,2022年全球3D机器视觉市场规模有望到达21.3亿美元。

在机器视觉顶会中,差不多会有半壁河山那么多的论文都是跟3D有关。前沿探索可谓张狂进行,那么有哪些三维图像+机器视觉的新技术趋势,今日正隐藏在不知道迷雾中眺望这个国际?今日咱们来说几种很有科幻感的技术突破点。说不定这些能力下一年就会呈现在你的手机、VR设备和无人机中,又或许即将成为某个被本钱张狂亲吻的创业热潮。

超大场景的3D数据感知

3D机器视觉包括许多方面,既有让智能体去理解3D数据,也包括怎么经过机器视觉的解决方案,去获取3D模型数据。
传统意义上的3D数据获取,或许称其为3D感知技术,一般来说可以运用多角度摄影或许深度传感器的方式完成3D数据收集。这种技术的限制在于,收集的3D数据不能太大。
然而在3D材料要求不断升级的今日,关于超大场景的3D数据感知,正在成为一个抢手议题。比如无人驾驶中运用的城市高精地图,就可以看做一个个超大3D场景的拼接。智能城市领域运用到的许多城市数据推演,也要根植于对城市3D场景的收集。

机器视觉正在为超大场景的3D数据感知供给很多新的办法。比如自动化的成像办法,像视觉SLAM在线处理接连帧的图像,完成实时重建巨大3D场景。再比如说对航拍数据进行点云切割和点云数据的语义理解,协助快速低成本获取城市3D数据。
整体来看,今天超大场景的3D数据感知,有三个首要使用方向,很可能分别成为各自技能范畴中新的投资和创业热点:
1、建筑物的3D高精度模型,运用在工程监理、智能设计、物流和智能城市范畴。
2、高精地图与3D数据感知的结合,这是无人驾驶的重要一环。
3、室内外一体的3D建模,这对于智能家居设计、环境监控、VR/AR体验来说都有重要协助。
手机与3D视觉进入蜜月期

 现在,智能手机已经成为AR/AR以及核算视觉等先进技能发展的最大载体,人脸辨认、AR功能成为当前智能手机发展的热点,其实无论是在AR/VR范畴仍是辨认技能,都离不开核算视觉。核算视觉范畴其实就是运用核算机技能对生物视觉的一种模仿,其间深度辨认和多维成像使其核心技能。
深度辨认是核算视觉的要害前提,能够对生物视觉进行辨认,其间包含当前流行的苹果人脸辨认技能,多维成像将包含现在的3D显现结局即对图片以及视频等进行3D画面的再现。利用深度辨认和多维成像技能,除了还原咱们肉眼所能看到的画面,未来跟着技能的不断交融,深度辨认技能还能是立体的展现咱们肉眼所看不到的东西。例如,未来的智能手机能够在阳光下利用深度辨认技能和人工智能技能的分析,辨认紫外线的强度,提醒咱们的防晒护肤。

AR/VR中的眼球追寻技能

跟着技能的前进,我们现在现已能够利用人类眼睛进行虹膜辨认,虹膜辨认相较面部辨认、指纹辨认都愈加有效和安全,很多手机厂商开端开发运用虹膜辨认功用。
除了虹膜辨认之外,还有眼球追寻技能。所谓眼球追寻,是指一项技能能够追寻眼球的运动,并利用这种眼球运动来增强某个产品或服务的体验。
眼球追寻技能曾经在智能手机范畴火了一阵,这可能要追溯到2013年Galaxy S4手机率先搭载了眼球追寻功用,这项功用首要应用在视频播放上面。举个例子,如果你正在观看一个视频,然后你死后的同学拍了一下你肩膀,在你转过头的时候,由于你的眼睛现已不再看着屏幕,视频会自动暂停,而当你回过头来,视频会自动持续播放。不需要你用手去点击暂停和播放;或许你在手机上看网页,当你眼睛看到屏幕底部的时候,网页会自动翻页。同年,LG也推出了一款拥有眼球追寻功用的LG Optimus G Pro手机。
可惜,眼球追寻未能在手机范畴掀起大风大浪,原因大概有两点。首先用户没有需求,一款智能手机的均匀尺度大约只要5英寸,在这么一丁点儿大的当地,人们更喜爱直接用手指进行交互,况且手机绝大部分功用都是运用手指进行交互,所以也不多播放/暂停这个环节;第二个原因就是,当时技能不太成熟,分辨率低,辨认不够精准,导致有用户觉得眼睛累。


3D视觉助力机器人产业智能化转型

3D视觉作为一项激动人心的新技能,早已经出现在微软Kinect、英特尔RealSense等消费级产品中。近几年,跟着硬件端技能的不断进步,算法与软件层面的不断优化,3D深度视觉的精度和实用性得到大幅提高,使得“3D深度相机+手势/人脸辨认”具备了大规模进入移动智能终端的根底。作为全球手机名副其实的龙头,苹果首先大规模选用3D视觉技能,将完全激活3D视觉商场,敞开全新时代。
 3D视觉技能不只仅在辨认精度方面大幅提高,更重要的是打开了愈加宽广的人工智能使用空间。跟着机器视觉、人工智能、人机交互等科学技能的开展,各种高智能机器人开始走进实际,3D视觉技能成为助力制造业完成“智能化”转型的好帮手。
大家耳熟能详的深度摄像头技能和使用有英特尔的RealSense、微软的 Kinect、苹果的 PrimeSense、以及谷歌的Project Tango等。不过可以看到这一技能的研讨和开发多为国外公司,国内核算视觉方面的公司或创业团队屈指可数,技能上的壁垒依旧较大。
关于现在商场上的深度相机的技能方案主要有以下三种: 双目被迫视觉、结构光、TOF。双目被迫视觉主要是利用两个光学摄像头,经过左右立体像对匹配后,再经过三角测量法来得到深度信息。此算法复杂度高,难度很大,处理芯片需求很高的核算功能,同时它也承继了一般RGB摄像头的缺点:在昏暗环境下以及特征不明显的情况下并不适用。
结构光的原理是经过红外激光发射相对随机但又固定的斑驳图案,这些光斑打在物体上后,由于与摄像头间隔不同,被摄像头捕捉到的方位也不尽相同。然后先核算拍到的图的斑驳与标定的标准图案在不同方位的位移,引入摄像头方位、传感器巨细等参数核算出物体与摄像头的间隔。
微软在Kinect二代选用的是ToF的技能。ToF是Time of flight的简写,直译为飞翔时刻的意思。所谓飞翔时刻法3D成像,是经过给方针连续发送光脉冲,然后用传感器接收从物体回来的光,经过探测光脉冲的飞翔(往返)时刻来得到方针物间隔。相比之下,结构光技能的优势是比ToF愈加成熟,成本更低,愈加适合用在手机等移动设备上。
深度摄像头是所有需求三维视觉设备的必需模块,有了它,设备就可以实时获取周围环境物体三维尺度和深度信息,更全面的读懂世界。深度摄像头给室内导航与定位、避障、动作捕捉、三维扫描建模等使用提供了根底的技能支持,成为现今行业研讨热点。现在iPhone X搭载3D深度摄像头势必会大力推进机器视觉领域的开展,助力机器人产业完成完美“智能化转型”。


更好的深度传感器解决方案

还有一个机器视觉技能和3D的交汇,首要发生在无人机领域。
无人机今日进行测绘和航拍时,有必要顺便对空间的理解才能,不然拍照不准事小,撞了南墙事大。而这个才能首要来自于摄像头和传感器进行空间阅览。
跟着消费级无人机的不断升级,人们对无人机拍照效果要求也不断升高。无人机有必要不断在更远的距离、更极端的气候、更杂乱的运动中拍照画面。但是传统的传感系统解决计划已经快要跟不上用户的期许。
今日的消费级无人机,一般采取两种感知解决计划,一种是双目视觉技能,比方大疆的某些产品;一种是结构光传感器,比方微软的。而这两种干流计划都是有必定限制的,比方感知规模都有限,难以完成远距离作业。再比方双目视觉技能在黑夜中会失灵,所以无人机夜拍一直是个大坑,但是结构光技能应对不来强光,一到中午无人机就石乐志也是很心塞的。
更好的解决计划,在于将传感器与智能摄像头结合起来,达成可以适应不同天候与气候,并且可以长距离感知的新式传感系统解决计划。
今日,用机器视觉技能中的很多算法,协调不同的传感设备作业,让无人机变成“多眼无人机”,正在成为盛行的解决计划。机器视觉算法很多加入无人机传感器,还可能带来轨迹拍照才能提升,让无人机取得拍照全体环境,或者精准捕捉动态物体,比方说运动中的动物和车辆的才能。
以上几个技能趋势,都可能成为机器视觉和图形学使用的下一步热门。这个领域看似偏门,事实上却能影响今日科技市场中的风吹草动。
让机器看到立体世界的游戏才刚刚开始,机器与人类在某一天可以用相同的视角彼此注视,或许才是这个故事的终点。

来源:脑极体、新机器视觉、机器人网,转载请注


 

更多文章