Flex Logix加入到推理边缘的竞赛- EEJournal - 亚博首页官网手机登录,亚博yabovip2019进入

你有没有注意到，最近超市货架上似乎有越来越多的产品标榜自己是“无麸质”的?这类事情显然会引起估计者的兴趣一百人中只有一个他们患有乳糜泻，因此对麸质不耐受，但这些产品标签传达的是有用的信息还是只是伪装成信息的噪音?

当我第一次看到这些标签时，我以为制造商已经找到了一些方法来去除有关产品中的麸质，但后来我开始看到像罐装杏仁黄油和罐装碎青椒这样的产品吹嘘他们也不含麸质。这引起了我的怀疑，因为“麸质”指的是在谷物中发现的一种蛋白质的集合，而在我的家乡，杏仁黄油或辣椒中没有这种蛋白质(严格地说，“麸质”只涉及小麦蛋白质，但它经常被用来指其他谷物中天然存在的prolamin和谷蛋白的组合)。

问题在于，市场营销中的那些笨蛋已经套上了他们的无麸质马，现在正无情地骑着它们穿过我们的超市货架。一个相关的问题是，那些大胆地进入我味蕾的无麸质产品——比如有无麸质外皮的披萨——并没有给我留下深刻的印象，以至于我现在选择那些自豪地炫耀其麸质含量的产品，或者至少避免宣称不含麸质。

我在这里提到这个的原因(是的，当然有一个原因，如果你不再打断，我们会得到这个原因，打个比方)是我记得第一次听到人工智能(AI)的名字是在20世纪70年代，在“专家系统”的背景下(这个概念是在1965年左右作为斯坦福启发式编程项目的一部分正式引入的)。

这些专家系统分为两个部分:知识库和推理引擎。知识库包含与相关领域相关的事实和规则。推理机的作用是将规则应用于已知事实，以推断出新的事实。

好的一面是，与今天的产品相比，这些早期的专家系统是第一批真正成功的人工智能软件形式之一。不利的一面是，绝望的懒汉们像一群旅鼠一样涌向这个概念(我知道“切片”不是一群旅鼠的官方集体名词，但它应该是;要么是这样，要么就是一个“转折”)。因此，不久之后，“由人工智能驱动”开始与最不可能的软件应用程序联系在一起。这很快变成了一个笑话，然后是一个烦恼，最后是一个分心的事情。没过多久，工程师们就开始进行诽谤(不是我，你懂的，因为我的投掷臂已经大不如前了)。最终，“AI”这个称呼开始在每个人的嘴里留下不好的味道(这巧妙地让我们回到了无麸质披萨皮)，人们不再使用它，因为他们无法面对随之而来的窃笑、窃笑和轻视。

我真的不记得在上世纪90年代末听到过多少关于人工智能的东西。如果你在十年前问我，我会猜在这个舞台上发生的事情很少。当然，正如我们现在所知道的，学术界的男男女女们在幕后继续埋头苦干，炮制出越来越狡猾的算法和复杂的人工神经网络(ANN)框架。与此同时，处理能力、容量和技术突飞猛进，特别是在FPGA和GPU领域。正如我之前提到的，在2014年版本的Gartner炒作周期人工智能和机器学习(ML)甚至都不是地平线上的一个光点。仅仅一年后，在2015年的版本中，ML已经达到了“膨胀预期的峰值”。

当然，如今AI和ML无处不在。在早期(我指的是五年前)，最令人兴奋的AI/ML应用程序主要驻留在云中。当然，不久之后，一些勇敢的应用程序开始涉足互联网边缘的水域，现在有一个真正的踩踏边缘处理，边缘推理，和边缘安全。

一些AI/ML系统的目标是部署在相对低端的微控制器单元(mcu)上。例如，请看我的我刚刚创建了我的第一个AI/ML应用程序!专栏，其特色应用程序由一个简陋的Arm Cortex-M0+处理器提供支持。其他AI/ML应用程序在处理方面需要更多的精力。问题是，当涉及到广泛部署时，价格也有一定的影响。

在上一篇专栏文章中，我曾邀请您在NVIDIA的Jetson Nano 2GB开发工具包上享受你的魔法球．这款大胆的美女拥有128核NVIDIA Maxwell图形处理单元(GPU)，四核64位ARM Cortex-A57中央处理器(CPU)和2gb 64位LPDDR4 25.6 GB/s内存。这款入门级开发工具包针对的是边缘的人工智能(AI)，售价仅为59美元。尽管如此，许多现实应用程序需要更强大的处理能力，在这种情况下，NIVIDIA的人喜欢说他们的杰森·泽维尔NX系统模块是最小、最强大的人工智能超级计算机，用于机器人和嵌入式计算设备。唯一的问题是，Xavier NX 350美元的标价对很多人的钱包来说有点高。

所有这些都让我们想到一个事实，Flex Logix的伙计们刚刚把他们的公司帽子扔进了AI/ML的圈子。到目前为止，大多数行业观察人士都认为是这样Flex Logix与他们的eFPGA(嵌入式FPGA)技术;这是片上系统(SoC)设备的开发人员可以嵌入到他们的设计中的FPGA IP。然而，挥舞着他们的eFPGA技能与热情，放弃，和华丽，男人和女孩在Flex Logix刚刚宣布他们的第一个产品在一个新的产品线的现货推断芯片和电路板．

这些推理引擎旨在加速神经网络模型(包括用于物体检测和识别的模型)的性能，用于机器人、工业自动化、医学成像、基因测序、银行安全、零售分析、自动驾驶汽车、航空航天等领域。

让我们从InferX X1芯片开始，该芯片拥有64个与片上SRAM紧密耦合的可重构张量处理器单元(tpu)。tpu可以串行或并行配置，以实现广泛的张量操作。此外，可编程互连提供了从SRAM通过tpu并返回SRAM的全速、无争用数据路径。同时，在当前层的计算过程中，为下一层带来权重和配置的DRAM流量在后台发生，从而最大限度地减少计算停顿。本地化数据访问和计算与可重构数据路径的组合，所有这些都可以一层一层地重新配置(在百万分之一秒内)，提供了令人难以置信的高利用率和令人惊叹的吞吐量。

介绍InferX X1芯片(图片来源:Flex Logix)

但是等等——还有更多，因为Flex Logix的人也宣布了他们的InferX X1P1的可用性，它具有一个半高半长PCIe板上的一个InferX X1芯片和一个LPDDR4x DRAM(该家族的未来成员将拥有更多的InferX X1芯片和更多的DRAM)。

介绍InferX X1P1板(图片来源:Flex Logix)

Flex Logix还推出了一套与这些电路板配套的软件工具。这包括来自TensorFlowLite/ONNX模型的编译器流以及nnMAX运行时应用程序。软件工具中还包括一个InferX X1驱动程序，该驱动程序具有专为应用程序设计的外部api，用于轻松配置和部署模型，以及用于处理用于控制和监控X1板的低级功能的内部api。

在谈到AI/ML市场时，Flex Logix的人似乎把NVIDIA放在了他们的视线中，因为他们说:“InferX X1运行YOLOv3对象检测和识别的速度比NVIDIA行业领先的Jetson Xavier快30%，运行其他现实世界客户模型的速度高达10倍。”

他们继续声称，“InferX X1的硅面积为54mm^2，是美国硬币大小的1/5，比NVIDIA的Jetson Xavier的350mm^2要小得多。InferX X1的高批量价格比NVIDIA的Xavier NX低10倍，使高质量、高性能的人工智能推理首次应用于数百万台的大众市场产品。”

关于他们的InferX板，Flex Logix的人说，“用于边缘服务器的Nvidia Tesla T4 Inference accelerator非常受欢迎，但客户希望在更低价格点的服务器上部署推理，以用于更高容量的应用”，“新的InferX PCIe板为更低价格点的服务器提供更高的吞吐量/美元。”

就我个人而言，我认为Flex Logix凭借这些基于fpga的芯片和板进入AI/ML领域(没有人能听到你的尖叫)是非常令人兴奋的。竞争越激烈，技术发展就越快，价格就会下降得越低。一如既往，我们确实生活在一个激动人心的时代。