我刚刚收到了一份不同寻常的简报,现在我坐在这篇专栏文章的开头,看着一张白纸,心想:“那么,我该如何解释这篇文章呢?”我们在这里谈论的是基于新的处理架构的下一代处理芯片。这种技术被称为分层学习处理器(HLP),旨在成为人工智能(AI)训练、高性能计算(HPC)和元宇宙处理(不要问,我稍后会告诉你)等任务的游戏规则改变者。
一般来说,当我收到这类简报时,它的创造者会毫不顾后果地向我抛出令人眼花缭乱的复杂架构框图。对我来说,深入了解这头巨兽的内部工作也很常见,只是偶尔会把鼻子抬出幻灯片的表面,喘口气。但这次不是。尽管我已经嗅到了一些由这个设备组成的高级功能单元的气味,但我甚至没有看到一个黑匣子的图像。
这种大胆的美现在有了吗?遗憾的是。硅测试和性能测试计划在今年(2022年)进行,2023年将提供客户样品,2024年全面投产。
在我的职业生涯中,我听到过许多令人愉快的承诺,也听过许多关于即将到来的奇迹的荒诞故事,我也见过你无法相信的硬件和软件的蒸汽软件版本(你无法相信的是蒸汽软件的大胆;硬件和软件在我所熟悉的任何维度上都不存在)。我知道你会觉得这很难相信,但有时,许多承诺的产品并没有像他们的支持者最初提议的那样实现。(这可能是一个让你想象我站在那里的好时机所有单独的在一个寒风凛冽的夜晚,在一个无情的城市中心,背景是风滚草在街道上滚动,我的下唇在颤抖,一滴眼泪从我的脸颊上流下来。)
根据过去的经验,在正常情况下,我通常会在这个时候退出简报,一边嘟囔着陈词滥调,一边悄悄走向最近的出口。然而,这并不是正常的计划,因为我是由行业资深人士Venkat Mattela博士介绍的,他是Ceremorphic.
Venkat有一种有趣的做事方式。首先,他寻找一个需要解决的问题。接下来,他花时间和精力构建解决问题所需的底层技术。直到那时,他才开始基于自己的新技术研发改变游戏规则的产品。这就是Venkat在Redpine Signals所采取的方法,他曾是Redpine Signals的创始人兼首席执行官。在他的领导下,红杉信号公司提供了突破性的创新和行业第一的产品,从而开发了超低功耗无线解决方案,在能源效率方面比无线行业巨头的产品高出26倍。
Silicon Labs于2020年3月以3.08亿美元收购了Redpine Signals的无线资产。如果这真的是你的,我会花些时间跑到山上,在海滩上晒太阳(我从不比喻我不喜欢)。相比之下,仅仅一个月后,也就是2020年4月,Venkat成立了officiic。
我来告诉你做知道。这个领域已经有其他参与者了,所以,正如Venkat所说,如果HLP在现有解决方案的基础上只提供了50%的改进,没有人会感兴趣。相比之下,如果HLP在性能和电源效率方面优于竞争对手50倍,那么这个将让人们坐起来,集中注意力。
事实证明,HLP的底层架构概念已经酝酿了多年。此外,自2018年以来,HLP技术的物理实现一直在开发中。最初的开发采用了TSMC的7nm工艺节点,在2020年推出normorphic时切换到最新的5nm技术节点。
除了gpu和fpga,绝大多数为人工智能开发处理器芯片的公司都瞄准了用于边缘推理的超低功耗设备。这些设备通常不打算扩展到数据中心和云。相比之下,HLP技术主要针对高端部署和应用,如数据中心、人工智能培训、汽车高级驾驶辅助系统(ADAS)和自动驾驶(AD)系统、机器人、生命科学和元宇宙处理。
“再提醒我一下;什么是元宇宙处理?”我听见你在哭。我很高兴看到你在专心听讲。正如normorphic网站告诉我们的那样:“扩展现实(XR)、增强现实(AR)、混合现实(MR)和虚拟现实(VR)的融合是一种令人兴奋的新能力,它可以实现前所未有的虚拟世界的创造。元宇宙处理创造了数字空间和物理空间的更大重叠,使生产力和娱乐应用程序丰富。”很高兴我们把这事说清楚了。
其中一个有趣的方面是,尽管使用最新最好的技术节点来创建仅针对廉价和廉价的物联网设备的处理引擎最初并不具有成本效益,但HLP技术是基于芯片的,这使得它可以开始针对高端应用,并随着时间的推移扩展到中低端应用。
另一个引起我注意的点是知识产权的使用。当涉及到像PCIe 6.0 / CXL 3.0连接接口这样的功能时,大多数公司都会从第三方购买这个IP。相比之下,虽然Venkat购买商品IP块没有问题,但他更喜欢开发自己的低能耗高端IP,如PCIe 6.0 / CXL 3.0,因为这可以让他进一步区分自己的产品。(虽然这不是他们关注的重点,但decretic的人并不反对将这一IP授权给其他在不同市场工作的公司。)
有限的细节是QS 1将成为HLP家族的第一个成员,包括以下主要特性:
- 自定义机器学习处理器(MLP)运行在2GHz。
- 自定义浮点单元(FPU)运行在2GHz。
- 专利多线程处理宏架构,基于threadarch的RISC-V处理器,运行1GHz的代理处理。
- 用于运行1GHz的元宇宙处理的定制视频引擎,以及Arm Cortex-M55核心(M55核心是第一个采用Arm Helium矢量处理技术的核心,用于增强高效节能的数字信号处理(DSP)和机器学习(ML)性能)。
- 抗量子安全微架构。
- 定制X16 PCIe 6.0 / CXL 3.0连接接口。
- 开放的AI框架软件支持,优化的编译器和应用程序库。
- 软误差率:(100,000)^-1
该公司拥有100多项核心技术专利,由管理团队、董事会和技术顾问领导,目前拥有150名全职员工,并计划在今年增加到250名。
所以,在一天结束的时候,我不得不说,我认为这次简报是成功的,因为——如果没有其他的话——它让我渴望更多的实质细节。你呢?你有什么想法想和我们分享吗?
你说得对!
是的,我喜欢!
越来越接近人类大脑……
播放恐怖的音乐……