我的脑子里现在充满了各种各样的想法。NVIDIA最近发布了他们的Jetson Orin Nano模块级系统,其性能是上一代的80倍,用他们自己的话来说,这是“为入门级边缘人工智能和机器人设定了新标准”。
我的一个思考集中在他们在这种情况下使用“入门级”限定符。当我刚上来的时候,这个大胆的美女已经有资格成为这个星球上最大、最坏的超级计算机。
我是认真的。1975年,也就是我上大学的那一年,克雷研究公司宣布了他们的Cray-1超级计算机.由西摩·克雷构想,这是第一台成功实现矢量处理架构的计算机。
西摩在很多方面都走在了时代的前面。与克雷同时代的乔尔·s·伯恩鲍姆(Joel S. Birnbaum)曾是惠普(Hewlett-Packard)的首席技术官,他这样评价克雷:“他对这个行业的影响似乎怎么夸大都不为过;在西摩的设想中,现在高性能计算机经常做的许多事情都是最不靠谱的。”由于最终售出了100多台cray1系统,这使得它可以说是历史上最成功的超级计算机之一。
craw -1的3D渲染与两个数字的比例
(图片来源:FlyAkwa /维基百科)
观察这个标志性的设计,它是一个相对较小的c形柜子,周围环绕着一圈长凳,覆盖着电源和冷却系统。
最初的Cray-1拥有80mhz的时钟,可以支持高达32mb的内存。是的,你没看错。MB(字节)。在我穿着年轻人衣服的那些日子里,这被认为是一个巨大的(有些人可能会说“巨大的”,但我不会说,因为我不会拼写)记忆量。它拥有12个独立的流水线执行单元,每个周期可以执行3个浮点运算。
反过来,这让我想起了家酿Cray-1A大约在2010年,狡猾的设计师克里斯·芬顿(Chris Fenton)在克雷-1号之后35年创造了它。Chris使用Xilinx Spartan-3E 1600 FPGA实现了与Cray-1A几乎相同的功能。而且,当然,这个FPGA的处理能力相当于一滴水与浴缸装满一氧化二氢以Jetson Orin Nano的形式出现(我想成为第一个把NVIDIA的Jetson Orin Nano比作浴缸的人——如果有人问起,记得你是第一个看到它的人)。
说到这,当他们说“性能是上一代的80倍”时,你认为他们是什么意思?上一代是什么?好吧,在我们过去称之为2020年的时间迷雾中,我写了一篇专栏:在NVIDIA的Jetson Nano 2GB开发工具包上享受你的魔法球.正如我在专栏中所写的:“这款大胆的美女拥有128核NVIDIA Maxwell图形处理单元(GPU),四核64位ARM Cortex-A57中央处理器(CPU), 2gb 64位LPDDR4 25.6 GB/s内存。额外的存储空间是通过microSD卡提供的(我有一张64gb的卡,但你可以买更高的;例如,你可以获得高达1tb的microSD卡,想到这一点我就会流泪)。”
那个专栏里有我打开Jetson Nano 2GB Dev Kit的照片。我已经不记得为什么了,但几周后,NVIDIA的好同事给我送了第二套(也许他们认为我会把第一套搞砸)。第二个Jetson Nano坐在我办公室的角落里,让我越来越内疚,直到……
几周前我去了挪威,在FPGA论坛上做主题演讲。作为这次旅行的一部分,我受邀为挪威科技大学(NTNU)研究嵌入式计算的理学硕士学生做客座演讲(你可能会感兴趣,我把我的演讲主题分为两个曲折的专栏:没发生什么,还是真的发生了?而且所有的改变!).
当我在办公室里四处游荡,收集一些我想带走的零碎物品时——比如我的个位数的BLUB数码管时钟(见复古未来主义蒸汽朋克技术(上)从未被打开过的Jetson Nano 2GB Dev Kit引起了我的注意,我决定在我与学生的谈话中,这将是一个很棒的“赠品”。
抵达挪威后,我们与主管讲师Per Gunnar进行了交谈,我们决定邀请感兴趣的学生发布他们将如何使用Jetson Nano的描述,以及为什么他们应该成为“那个人”。为了促进这一过程,Per Gunnar在大学内部网站上建立了一个提交页面。后来,在FPGA论坛上,他和我花了一些时间从疯狂的人群中仔细阅读和思考所有的提交。
结果,我们被大量的提案淹没了。我们创建了一个矩阵,包括项目的有趣程度和成功的可能性。我们放弃了那些提交者忽略了他们的名字(这很遗憾,因为这是一个很好的名字)的提议。我们最终选择了一个学生,他建议创建一个人工智能(AI)引导的乒乓球发射器啤酒乒乓的.Jetson Nano将配备摄像头来观察和学习足球的飞行和反弹特性。它还能控制球的发射角度和速度。除了检查“有趣”和“可能成功”这两个选项外,我担心评委们还被结案陈词所动摇,即如果有这个创意的陪伴,这个学生和他的同伴就可以在城里的任何酒吧喝到免费啤酒。很难用那样的逻辑进行辩论。
但是我们跑题了……如果你想用Jetson Nano 2GB Dev Kit可以做的所有事情,那么想象一下Jetson Orin Nano所提供的可能性。
来看看Jetson Orin Nano(图片来源:NVIDIA)
Jetson Orin采用NVIDIA安培架构的GPU,基于arm的cpu,下一代深度学习和视觉加速器,高速接口,快速内存带宽和多模态传感器支持。这种性能和多功能性将使用户能够开发和商业化曾经看起来不可能的产品,从部署边缘AI应用程序的工程师到构建下一代智能机器的机器人操作系统(ROS)开发人员。
Orin Nano模块有两个版本。Orin Nano 4GB可提供高达20万亿次每秒运算(TOPS),功率选项低至5W至10W,而8GB版本可提供高达40次每秒运算,功率可配置为7W至15W。
这里要记住的重要一点是,尽管Jetson Orin Nano在最小的Jetson外形上提供了高达40 TOPS的AI性能,但这只是Orin家族中的“入门级”产品。顶级的AGX Orin可以为先进的自动机器等应用提供275个TOPS。
275顶。一想到这个我就热泪盈眶。如果我能让我的时间机器工作,把这些大胆的美女中的一个带回到1975年,给西摩·克雷看,我打赌他也会流泪的。你呢?你能忍着眼泪发表一条评论,表达你对NVIDIA Orin模块提供的计算能力的看法吗?