这是做成一件大事,你可以感谢《阿凡达》。一次愚蠢的电影手法,要求眼镜你不会被穿在其他地方,3 d突然变得很酷。一段时间,最好的方法把任何普通变成很酷很清楚:3 d。
我们已经有点老,辣(老,无论如何),我们有时间赶上我们的呼吸和内化的结果无尽的3 d电影,3 d电视,3 d打印机。(好吧,那是一个多办法…),但现在更容易好好长,微妙的看3 d及其潜在的东西除了票房了。
尤其是嵌入式视觉运动进一步进入3 d世界:它甚至4 d。但是我为自己获得成功。让我们先从2 d理解它是如何向前推进,设计师们正试图利用简单的设备创建复杂的视觉模型。
视觉最直接的方法之一是使用手势识别。我们人类过程动作主要是视觉线索,这些手势发生在三维空间。当我们召唤别人的方法,例如,我们(在美国-这不是普遍的)我们的双手,手指向天空,与后面的手面对人与我们沟通,我们将所有的手指快速重复地向我们。2 d投影会看到以来很少运动姿态主要经营你和对方之间的界线。在相机上,这是第三维度。
所以捕获特定姿态很难与常规2 d相机:你会做得更好如果你能捕获所有三个维度。我们看了视力公司的进步手势识别安装到笔记本电脑摄像头使用标准的2 d;PointGrab是另一个公司有相似的目标。但实际上,电脑使用手势往往夸大了版本的我们要做的与另一个人。(我们更响亮的方式我们的电脑和手机,对待他们,仿佛他们是外国人。)第三个维度提供了额外的信息来补充2 d(当然,代价),允许更多微妙的运动。
有其他应用程序的第三个维度可以是有用的。把相机,进入汽车防撞之类的东西。即使没有特定的雷达测距技术,应用程序使用视觉线索来估计距离其他车辆在碰撞预警和规避上。再一次,这可以尝试在两个维度,被iOnRoad完成,使用手机相机。但系统计划完全集成到汽车的安全系统可能会受益于一个实际的第三维度。
除了应用程序,如果你想要真正的信息丢失的相机维度,深度,有不同的方法。结果通常是一个叫做“深度地图,”分配一个深度图像中每个点的价值(或主要工件或点)的某个子集。你可以把这个作为添加另一个值的元组定义一个像素(说,x和y的位置和颜色值)。
明显的方式我们用来思考3 d是使用双目系统-两个摄像头。这有缺点,当然,需要两个摄像头。还有“通信问题”:将两个图像,这样你可以满足一个深度。
过程通常包括移除图像的扭曲,因为镜头将曲线直线向边缘或介绍其他的畸变。这些需要纠正,让两个图片看起来“平。”相比,图像可以自定义创建一个所谓的“地图”差距,可以用来计算深度地图。
挑战时试图决定哪个点对应于哪个。对小型工件或边缘,尤其是角落,它并不困难。但对于像素的颜色,例如,很难建立,信件。
使用“结构光”可以帮助。这可以包括红外特性,例如,投射在各种表面(无形,就我们和图片相机(s)而言)。他们可以促进对齐,也可以推断出距离直接从精心设计和预测功能。例如,它是可能的项目一个形状,近距离的撞击,看起来像一个横向椭圆形,远创建一个圆,并进一步仍然看起来像一个垂直的椭圆形。通过测量方向和椭圆形的长宽比,可以推断出一个距离。这个不需要第二个图像相机,但是,当然,需要红外成像。
其他单摄像方法包括干涉法和“编码孔径”面具的使用,模糊的由多个图像可以产生深度信息。
方法似乎越来越关注这些天是所谓的“飞行时间”解决方案。我们的想法是,通过测量需要多长时间从表面反射的光线,你可以告诉有多远;这听起来几乎微不足道。但这是如何做不到微不足道。
与光束的一种方法是用一个射频载波调制,然后反射信号的相移用于测量距离。当然,这只能模波长:所有对象对应的距离在同一阶段的波会出现相同的距离。另一种方法是使用一个快门阻挡反射的光脉冲。根据当光返回在当快门打开的窗口,或多或少会让它通过,然后亮度是用来推断的距离光旅行回来。
噪音是,当然,在所有这一切敌人,背景光可以沼泽位你感兴趣。如果你想要隔离一个移动的物体,例如,在一个不变的背景,然后可以捕获并减去背景图像的图像分离要跟踪的项目工作(或任何物品不是背景)的一部分。
其它并发症包括多路径反射,从而夸大距离,和inter-camera干扰:多个摄像头可能相互混淆。
但是飞行时间是感兴趣的,因为它可以使小;没有移动部件,处理是适度的。你也得到完整的图像的深度信息领域,这意味着你可以实时追踪对象及其深度。
在解决三维空间中,为什么不呢?四维空间怎么样?如果你抓你的头,没关系;我们将朝有些超现实。我们通常认为时间是第四维的(建议3 d视频)。但这并不是这是什么:第四维是或多或少的焦距。和“plenoptic”相机可以捕捉所有焦距,这意味着可以后处理图像改变焦点。是的,很奇怪。你可以看到web演示的几乎是可怕的:你开始一个图像有很大景深,明确获得焦点和焦点的形象;你点击一个失焦的元素,突然成为关注焦点。
这是通过构建人造飞的眼睛。微镜头在数组排列成像硅,和每一个镜头捕捉到整个图像使用光来自四面八方。然后最终与多个再现的图像可以与任何焦距重建一幅画。就像双目视觉在类固醇,深度地图可以轻松买到。
其他比它的令人难以置信的冷静后能够重新调整图像,这种方法的好处是允许快速捕捉形象——你没有关注一步,所以你可以把这张照片更迅速——并允许更大的光圈——因为焦点不再是一个问题——使它更好的光线暗的情况下。
面临的挑战是,图像分辨率并不是由图像传感器的像素密度;最后给出生成微透镜列阵设定的。微镜头很小,像眼镜一样,但是他们比像素更大,所以这样的照片的分辨率是粗比原本是可能的。两家公司正在接受这种技术商业化。先出Raytrix, 1-Mpixel和3-Mpixel为商业和相机工业使用。Lytro的面向消费者的相机在1.2 Mpixels,因为他们的消费取向,他们一直更为明显。
对于所有这些选择,我仍然感觉像3 d相机技术转移,寻找可靠的牵引和前进的方向。希望看到它作为一个持续的主题感兴趣的嵌入式视觉联盟。是一回事通过古怪的眼镜让电影看起来非常酷;这是完全不同的东西,以一种低调的方式添加深度信息。当3 d停止这么自觉,那么我们就知道我们已经掌握了它,就没什么大不了的。
更多信息:
你是想把三个(或更多)维视觉?你怎么去呢?