EEJournal

专题文章
现在就订阅

机器视觉又向前迈出了一大步

船长日志,星历22276.3:我既高兴又悲伤,困惑又困惑,茫然又困惑。这一天还早,所以一切都是意料之中的。我很高兴的一个原因是SyFy频道最近开始了一个名为吸血鬼雷金纳德.虽然这可能不是有史以来最好的吸血鬼剧,但它对事情的看法很有趣,我很期待它的结局。

我伤心的一个原因是我刚刚发现2022年萨勒姆的电影这部电影原定于2022年9月9日上映,但后来被推迟到2023年4月21日,现在没有确定的上映日期。史蒂芬·金1975年写的那本书非常棒。的1979年电视短剧(这部电影现在已经拍成电影了)非常糟糕,大卫·索尔(David Soul)演绎了之前从未有过的糟糕演技。的2004年电视短剧罗伯·劳主演的这部电影(现在也可以拍成电影了)也好不到哪里去。话虽如此,尽管两部电影都很糟糕,但总比没有好。今年早些时候,我和妻子(美丽的吉娜)一口气看了这两部电影,只是为了为2022年的上映热身,这部电影在我们眼皮底下被残忍地夺走之前承诺了很多。

我也很难过Apple TV+把艾萨克·阿西莫夫的电视剧制作成这样的“猪耳朵”基金会.我是如此的期待(看Apple TV+ Foundation:第一印象),这让我在编剧完全失去情节时感到困惑和困惑。他们真的读过原著吗?他们为什么不让我做他们的技术顾问?在快乐的一面,沙丘2021(覆盖了书的前半部分)是对弗兰克·赫伯特的杰作的致敬(见沙丘2021:第一印象),我迫不及待地想看续集,这部续集将涵盖该书的后半部分,目前计划于2023年11月上映。

我的茫然和困惑的状态很大程度上归因于我最近被介绍给一些了不起的孩子,他们让我的脑袋像陀螺一样旋转。你已经知道11岁的齐克正在制作一个带有10英尺螺旋天线的收音机,这样他就可以与国际空间站(ISS)上的宇航员交谈了天啊,我被扎了!第1部分而且第2部分).在我发表了这些专栏文章后,一位悲痛欲焚的母亲联系了我,她6岁的儿子阿尔菲(Alfie)想要一个纳米机器人工具包作为圣诞节礼物这到底是怎么回事,阿尔菲?).阿尔菲告诉他的妈妈,他所要做的就是把纳米机器人加入到一个桶里的化学混合物中,用木勺搅拌它们,然后把它们放在一起,就可以建造一台超级计算机了。当她提出抗议时,他给她看了我书中相关的段落比博普到布尔布吉:电子学的非常规指南.公平地说,阿尔菲错过了我说的这部分,我们可能会在2050年版的书中看到描述。问题是,尽管我一直想比波普爵士乐我从没想过这本书会出现在一年级学生的“必读”清单上。

另一个让我头晕目眩的原因是我刚刚在和谁聊天戴夫Tokic他是公司的营销和业务发展副总裁Algolux.每次戴夫和我谈话时,我那可怜的老脑袋里都塞满了大量的知识和琐事,我都不知道该怎么处理。

从前面的专栏文章中,您可能还记得,机器视觉系统包括镜头组件、传感器和图像信号处理(ISP)——其中ISP是使用硬件和/或软件实现的——所有这些都为人工神经网络(ANN)提供信息,该网络执行人工智能(AI)和机器学习(ML)任务,以了解场景并检测和识别场景中的物体。管道的ISP部分执行诸如减色、颜色校正、去噪、锐化等任务(减色,也称为去色,是一种数字过程,用于从覆盖有彩色滤波器阵列的图像传感器输出的不完整颜色样本中重建全彩图像)。问题是,这些管道传统上是由人类创建和调整的,以供人类观看,实际上,当涉及到机器视觉应用程序时,这可能不是最佳的。

正如我在专栏中所讨论的,当遗传算法遇到人工智能Atlas是一种进化算法驱动的工具,可用于优化ISP,以获得更好的图像,用于客户自己的感知堆栈。当时,Algolux的人将Atlas描述为“业界第一套机器学习工具和工作流程,可以自动优化用于计算机视觉应用的相机架构。”

简单介绍一下Atlas登录页面总结如下:“Atlas自动手动相机ISP调优。Atlas相机优化套件是业界第一套机器学习工具和工作流程,可自动优化相机架构,以获得最佳图像质量或计算机视觉。通过安全的云接口,Atlas可以在数天内显著改善计算机视觉结果,而传统方法即使经过数月的手动ISP调优也无法获得最佳结果。”

但等等,还有更多,因为正如我在专栏中讨论的,Eos嵌入式感知软件可以看到所有Eos通过将图像处理与场景理解以及物体检测和识别结合起来,将事情提升到了一个新的水平。Eos基本上涵盖了整个机器视觉管道。简单介绍一下Eos登录页面总结如下:“Eos是一个屡获殊荣的嵌入式感知解决方案,在所有条件下极大地提高了视觉系统的鲁棒性。我们高效的端到端深度学习架构可以快速个性化任何相机镜头/传感器配置或多传感器融合。结合立体声或深度感应摄像头,Eos提供了激光雷达的替代方案,成本仅为激光雷达的一小部分。”

我在这里反复讨论这些问题的原因是Algolux的伙计们已经采用了现有的Eos,并通过增强强大的深度感知来使其变得更好。我不知道你怎么想,但我想有个图表可能会让事情更清楚。

ADAS/AV的下一个安全级别之路(来源:Algolux)

在这种情况下,纵轴反映了传感器在不同环境条件下运行的能力的鲁棒性,而横轴反映了作为独立系统的有效性。使用这些标准,雷达的定位是相当稳健的,但你不会想依赖它作为一个独立的传感器。相比之下,激光雷达作为一个独立的系统是相当有效的,但不像你可能希望的那样强大。

当前的Tier 1汽车摄像头机器视觉系统显示在左下角。一方面,它的目标检测和识别能力令人印象深刻;另一方面,它缺乏稳健性和有效性。当使用Atlas来优化ISP时,这两个指标都得到了改善,而当使用Eos来优化ISP和感知堆栈时,情况会进一步改善。

在这一点上,重要的是要注意两件事(当我记得它们时)。首先,Algolux并不打算取代雷达或激光雷达,而是增强这些技术。其次,Algolux并不销售系统;相反,他们销售Atlas和Eos产品和相关服务,以帮助机器视觉系统的设计师创建非常好的系统。

真正让人兴奋的是最近发布的强大深度感知,正如上图中的“NEW”箭头所示,下图也反映了这一点。

Eos鲁棒深度感知软件(来源:Algolux)

这个图表中有更多的东西(没有双关语的意思)。首先,人类和机器可以通过多种方式感知深度。我们通常想到的是使用双目传感器:对于人来说是两只眼睛,对于机器来说是两个摄像头。利用两个传感器检测到的图像之间的差异,我们可以推断出各种信息,比如各种元素的深度(距离),以及在比较多帧时间时,物体是在靠近(变得更大)还是在后退(变得更小)。当然,人类也可以根据他们对场景的理解和对事物(如汽车、卡车、树、人等)的典型大小的了解,从单张图像和/或只用一只眼睛推断深度信息。

最新一代Eos采用了所有这些技术。使用两个传感器来提高深度感知的一种方法是增加它们的基线(它们之间的水平距离)。现有系统的基线通常只有20到30厘米,原因是摄像头在移动的车辆中振动,并且它们各自运动的差异随着距离的增加而增加。就像智能手机中的自动相机稳定一样,Eos采用了复杂的实时自适应自动校准,从而允许更大的基线(他们目前正在研究的一辆卡车的基线为2米)。

从上图中可以理解的另一个非常重要的一点是,Eos没有使用外部ISP。例如,如果相机包含一个执行ISP的SoC,那么Eos就会绕过该ISP,只接受来自相机的原始图像。原因是Eos在其ANN的前端层执行所有的ISP功能,在其ANN的后端层执行所有的场景理解和对象检测和识别功能。与传统的图像处理管道相比,Eos能够将所有这些函数和神经层训练在一起,从而提供如此出色的结果。

下图显示了Eos在日光条件下的鲁棒深度和物体检测的OEM示例(您也可以观看这个视频在YouTube上)。

日光条件下启用eos系统:基于相机图像的检测(右)和结合深度视差图的检测(左)
(来源:Algolux)

类似地,下图显示了Eos在低光条件下的鲁棒深度和物体检测的OEM示例(您也可以观看这个视频在YouTube上)。

在弱光条件下启用eos系统:基于相机图像的检测(右)和结合深度视差图的检测(左)
(来源:Algolux)

令人印象深刻,是吗?好的,让我们以一个简短的总结来结束。雷达和激光雷达系统是伟大的,但每种技术都有局限性,阻碍了在各种情况下的安全运行。由于距离目标越远,点密度越小,激光雷达的有效范围就会受到限制,导致目标检测能力较差,在雾或雨等恶劣天气条件下,由于激光的后向散射,鲁棒性较低。它的成本也很高,目前的系统每个传感器的成本为数百至数千美元。

雷达具有良好的距离和鲁棒性,但分辨率较差,这限制了其探测和分类目标的能力。最后,但并非最不重要的是,目前的立体摄像机方法可以很好地完成目标检测,但很难保持校准,鲁棒性较低。同时,单摄像机系统存在许多问题,导致深度估计差。

Eos强大的深度感知软件通过提供密集的深度检测,结合准确的感知能力来确定距离和高度,甚至可以确定很长的距离(例如1公里),解决了这些限制。Eos还提供了识别物体、行人或骑自行车的人,甚至丢失的货物或其他危险道路碎片的能力,以进一步提高驾驶安全性。这些模块化功能提供了丰富的3D场景重建,为激光雷达、雷达和当今现有的立体相机方法提供了一种功能强大、成本效益高的替代方案。

我不知道你怎么想,但就我个人而言,我是非常热情的。我们今天看到的机器视觉技术(再次强调,不是双关语)在短短几年前是不可想象的。我迫不及待地想看看这些东西在未来几年是如何发展的。你说呢?

留下回复

有特色的博客
2022年12月28日
我不得不说,其中许多机械运动对我来说都是全新的,从第一个开始,我现在知道它是施密特耦合....
2022年12月25日
https://youtu.be/V2368Zo4Tb4直接链接,如果它说视频被屏蔽,在格罗夫兰CA(无人机飞行员凯里)周一:IEDM主题演讲:安凯莱赫对未来技术周二:RISC-V峰会第二天:Krste, Android周三:12月更新:陈明胡,闰秒,对…
2022年12月20日
作者:James Paris和Armen Asatryan在实现过程中自动进行简短检查,让设计团队快速找到并修复这些错误... ...
2022年12月20日
我们在Synopsys上回顾了2022年,包括基于云的芯片设计工具、机器学习和人工智能驱动的EDA解决方案、多模系统和安全接口IP。回顾一年:回顾2022年的关键技术进步和冒险,这篇文章首次出现在来自硅…

有特色的视频

演示:PCIe Gen5 x16运行在VectorPath加速卡上

Achronix

Achronix工程师展示了如何使用Speedster7t FPGA将VectorPath加速卡连接到PCIe Gen5 x16主机,并通过全芯片二维片上网络(NoC)读取/写入GDDR6内存。NoC将数据从任何高速接口以2GHz的速度路由到FPGA内部的核心结构,而不消耗任何FPGA逻辑资源。

点击这里观看更多来自Achronix的视频

特色粉笔谈话亚博里的电子竞技

ActiveCiPS™:可配置的智能电源管理解决方案

逮老鼠的电子产品而且Qorvo

可编程电源管理不仅可以帮助我们管理电源系统,而且还可以具有尺寸、重量和成本效益。在本集Chalk Talk中,Amel亚博里的电子竞技ia Dalton与Qorvo的Yael Coleman讨论了可配置电源管理解决方案的全系统优势。他们研究了ActiveCips可配置智能电源管理解决方案的可编程功能,并回顾了这些解决方案如何帮助您在下一次设计中平衡重量、尺寸、功率和成本。

点击这里了解Qorvo ACT41000低噪声dc - dc Buck变换器的更多信息

Baidu