EEJournal

专题文章
现在就订阅

VMAccel提供FPGA即服务(FaaS)

我的思维像小山羊一样敏捷地从一个话题跳到另一个话题,有时会让我停下来思考:“是只有我这么想,还是每个人的大脑都是这样工作的?”

我想起了英国的科幻电视连续剧医生- - - - - -N特定的眨眼第10任博士(大卫·坦南特饰演)说:“人们认为时间是因果关系的严格进程,但实际上,从非线性、非主观的角度来看,它更像是一个大球,由一团一团的、摇摇晃晃的、时间一团一团的东西组成。”可悲的是,“摇摇晃晃,忽闪忽闪”的部分很大程度上描述了我可怜的老脑袋的内部运作。

你看过英国科幻电视剧吗红矮星?一个非常简单的总结是,我们的英雄戴夫·利斯特是一艘巨大的采矿飞船上的低级技术员——同名的红矮星。由于一系列不幸的事件,戴夫在假死300万年后醒来,发现他是最后一个活着的人类。他唯一的同伴是霍莉(船上的电脑),阿诺德·里默(戴夫以前的室友的全息影像),以及一种叫做猫的生命形式(它是在300万年的过程中从戴夫怀孕的猫进化而来的)。

我在这里提到这个的原因是,在第三季第三集中,我们遇到了一种基因突变的非人类生命形式,具有形状变化的特性,称为多形人。虽然我当时并不知道,多态性是一个希腊语单词,意思是“许多形状的”,这个概念出现在很多地方,比如材料科学、生物学和计算。例如,在计算机编程中,术语“操作符重载”有时被称为“临时多态性”,它是一种特定的多态情况,其中不同的操作符根据其参数有不同的实现。

“但这跟特兰托的茶叶价格和科洛桑的咖啡豆价格有什么关系呢?”我听见你在哭。那么,你是否担心,作为一个行业,我们在过多使用缩略语方面落后了?如果是这样的话,你就不用再担心了,因为我在这里要告诉你,缩略词过载仍然存在。取作为服务的功能以FaaS为例。维基百科将FaaS定义为“一类云计算服务,它提供了一个平台,允许客户开发、运行和管理应用程序功能,而无需构建和维护与开发和启动应用程序相关的基础设施的复杂性。”在一个典型的首字母缩略词重载案例中,我刚刚发现FaaS也可以用于指代FPGA即服务在这种情况下,我们谈论的是一种基于fpga的雾或云平台,可用于显著加速您的大数据工作负载。

到目前为止我们讨论的所有事情都被触发了多米诺骨牌连锁反应通过我和那些聪明的小伙子们的聊天VMaccel他们专注于提供具有FaaS首字母缩写的FPGA风格的云平台。

首先,让我们提醒自己,当今超级复杂的中央处理单元(cpu)在许多任务上都非常出色,尤其是那些决策方面的任务,但在许多大数据应用程序所需的处理方面,它们的效率可能非常低。我们可以用来满足处理需求的另一种方法是使用图形处理单元(gpu),它基本上是由一组简单的CPU核心组成的。CPU可能包含1到64个复杂核,而GPU可能包含数百或数千个简单核。

如果我们认为cpu和gpu在核心前端分别是粗粒度和中粒度的,那么我们也可能认为现场可编程门阵列(fpga)是细粒度的,因为它们可以配置(编程)以大规模并行的方式执行适当的处理任务(参见另文)cpu、mpu、mcu、gpu的FAQ是什么?).因此,当涉及到人工智能(AI)、机器学习(ML)和深度学习(DL)等用例时,fpga,尤其是FaaS,是非常有趣的;数据分析和数据库处理;视频分析和转码;生物技术(如基因组学和蛋白质折叠);金融和高频交易(HFT);密码学、研究、电子设计自动化(EDA)等等。

fpga可提供高达100倍的性能(图片来源:VMAccel)

我们在这里谈论的是高达100倍的性能,这对于那些致力于执行这些项目的人来说是一种注意力的吸引。一种看待这个问题的方法是,如果您在基于cpu的平台上有一个需要100个小时(4天以上)的任务,您可以在出去吃午饭之前设置这个任务运行,并在返回时查看结果(如果您切换到基于fpga的环境)。当使用基于cpu的解决方案时,一个耗时1000小时(约6周)的任务又如何呢?在这种情况下,切换到基于fpga的平台意味着你可以在清晨开始任务,并在回家看晚间新闻之前对结果幸灾乐祸。

然而,令人悲伤的是,房间里有一头大象,路上有一个障碍物,汤里有一只苍蝇,可以说(我从来没有比喻过我不喜欢)。尽管许多公司在自己的场所(“on-prem”)上创建自定义实现时享受了FPGA加速的好处,但在尝试将这些解决方案迁移到云中时却很少获得成功。其中一个原因是,尽管所有主要的云供应商都喜欢吹嘘他们提供CPU、GPU和FPGA功能,但残酷的现实是,他们倾向于专注于CPU和GPU方面的事情,而有些不情愿地只支持“一刀切”类型的FPGA环境。

问题是,就像人们在“一码适合所有人”的服装商场里翻找一样,结果是一件不太合适的衣服,在绝大多数情况下,它会让你在人群中脱颖而出(但不是以一种好的方式)。尤其不幸的是,当我们发现,根据一份报告经过验证的市场研究美国数据中心加速市场预计将从2021年的137亿美元增长到2026年的653亿美元。

2021-2026年数据中心加速器市场(图片来源:VMAccel)

我能说什么呢?“我喜欢大图表,我不会撒谎”(套用美国说唱歌手Sir Mix-a-Lot的话)。这就解释了为什么,而不是试图提供一个解决方案的所有季节(cpu + gpu + fpga),在VMAccel的人已经决定专注于提供最好的基于fpga的加速解决方案,目前在猎户座手臂。

为了实现这一点,如中所讨论的这个视频VMAccel已经构建了一个动态云平台,能够充分发挥fpga的潜力,同时仍然能够满足客户和isv的广泛不同需求。

VMAccel的人声称,他们的云平台可以让所有技能水平的用户在工作负载中利用fpga。与将用户压缩到一个通用的解决方案不同,VMAccel提供了一种定制的动态方法,其中实例针对客户机工作负载进行定制。除了在虚拟机(vm)、Kubernetes (K8s)和裸机上运行外,VMAccel还支持简单的一键式加速应用程序,适用于不希望开发自己的FPGA代码的用户,一直到预配置的实例,其中包含完整的开发环境、驱动程序、仿真工具以及在FPGA上开发所需的其他一切。VMAccel还支持广泛的开发人员流程,包括低级的RTL、OpenCL、c++、Python等等。

正如VMAccel首席执行官Darrick Horton所说:“fpga传统上被复杂性所笼罩,受制于陡峭的学习曲线和有限的可访问性。这些因素极大地抑制了该技术的广泛采用。VMAccel旨在通过降低复杂性、允许易用性和开放可访问性来促进FPGA技术的采用,同时保留可以在预置中实现的性能和定制水平。”

好吧,我被说服了。我只需要一个加速程序。你呢?你认为未来会有基于云的FPGA加速吗?如果是这样的话,你应该联系VMAccel的人,让他们告诉你更多关于他们如何能让你的脸上露出笑容,关于他们自豪地提供的性价比组合。

关于“VMAccel提供FPGA即服务(FaaS)”的5个想法

  1. 嗨,麦克斯,和往常一样有趣,有信息量和娱乐性。你知道美国专利10,181,003,并行异步建模和执行的处理电路吗?没有CPU,没有GPU,只有数百万个并行的自传播决策流程图在基板上执行,或作为可配置FPGA硬件或作为无时钟FPFA,现场可编程流程图阵列硬件。

    1. 嗨,Ron -我不知道这个专利-我必须看一看-非常感谢分享-现在我想知道这样的专利对使用fpga执行大规模并行处理的人有什么影响…

  2. 那么设计入口呢?VMAccel无疑会解决这个问题。除了他们从不定义需要什么样的输入/描述。

    然后Ron提出了一个无时钟FPGA专利,显然掩盖了异步设计的复杂性。

    是的,它是基于流程图的-好像显示一个决策块比和/或/反转门更好。

    没有时钟,但是有一个延迟块用于允许电路解析/解决。不同之处在于时钟周期是固定的,而延迟时间可以生成(如果您知道如何生成和生成多少)。

    显然,有人认为流程图神奇地消除了对类似于编译器及其相关语言/语法的需要。

    程序员只是在浪费时间学习不同的语言吗?他们是否应该画个流程图就完事了?

    Ron确实提到了事件和延迟生成,以及异步设计非常困难的事实。到目前为止,流程图并不容易,因为流程图一直都存在。

    布尔代数是正确定义逻辑设计的唯一方法,句号!如果涉及计算,则运算符优先级也必须处理。

    另一对针对未定义问题的模糊解决方案。

  3. 嗨,卡尔,谢谢你的评论,我对你对这项技术的看法并不感到惊讶,因为一开始大多数人都有同样的看法。

    是的,该专利掩盖了“当前和过去”异步设计的复杂性,因为这对Flowpro机器来说不是问题。没有任何握手,用户完全不知道电路的异步性,但完全知道计算机器的异步(并行)性质。这是基于基板的大规模并行系统的一个关键点。我认为快速概述一下传播流程图将消除您的一些顾虑。

    流程图不再是编写代码的计划工具,因为它们不能随着代码的变化而更新,而且它们很快就变成了意大利面条式的代码。Flowpro机器使用决策流程图作为代码,因此它们总是最新的,并使用分层对象来消除意大利面条代码。Flowpro机器被称为单个流程图或流程图的集合。当电压应用到流程图的启用块(顶部的气泡)时,Flowpro机器执行(传播是一个更好的词)。请记住,可以同时启用数千个这样的流程图并开始传播。我将此称为计算波,因为所有启用块都从启用块传播到每个流程图的第一个块的低到高转换。当转换信号继续传递到每个流程图的下一个块时,每个转换都流经第一个块,从而导致一个动作或“锁定”测试。一旦启用,流程图总是在某处传播。循环回先前执行的块的流程图路径将清除刚刚执行的路径,并通过该流程图开始新的过渡路径。

    你是对的,对于大多数工程师来说,决策块并不比大门好,但我发现它对领域专家来说是更好的。

    不需要延迟块,因为电路依赖于前沿。

    Flowpro机器有一个编译过程。目标是在图灵机上执行的Flowpro Machine编译为表示流程图的数据文件,然后由该图灵机的一个小内核执行。图灵机通过按顺序执行流程图来模拟Flowpro机。针对基板的Flowpro机器编译为固定电路,这些电路是“原子”动作和测试结构,然后组装成可变任务结构。

    “他们只画流程图”的一大优势是注意力集中在算法上,而不是执行算法的解决方案上。最重要的是,多个特定领域的专家可以参与创建算法,而无需考虑代码。我们的系统的复杂性正在增加,在我看来,多层流程图是管理复杂性的一种极好的方法。

    布尔代数不是定义逻辑设计的唯一方法,但在某些情况下它更好。使用一个门和两个信号将比执行相同功能的决策块使用更少的晶体管。或者,一个两个输入和门可以作为一个决策块的测试输入。但是当逻辑变得非常复杂时,我们发现图灵机上的流程图逻辑几乎总是使用更少的内存。越复杂,Flowpro的优势就越大。

    图灵机处理的任何解决方案也可以由Flowpro机器处理。相反是不正确的,因为真正的并行!

留下回复

有特色的博客
2022年12月28日
我不得不说,其中许多机械运动对我来说都是全新的,从第一个开始,我现在知道它是施密特耦合....
2022年12月25日
https://youtu.be/V2368Zo4Tb4直接链接,如果它说视频被屏蔽,在格罗夫兰CA(无人机飞行员凯里)周一:IEDM主题演讲:安凯莱赫对未来技术周二:RISC-V峰会第二天:Krste, Android周三:12月更新:陈明胡,闰秒,对…
2022年12月20日
作者:James Paris和Armen Asatryan在实现过程中自动进行简短检查,让设计团队快速找到并修复这些错误... ...
2022年12月20日
我们在Synopsys上回顾了2022年,包括基于云的芯片设计工具、机器学习和人工智能驱动的EDA解决方案、多模系统和安全接口IP。回顾一年:回顾2022年的关键技术进步和冒险,这篇文章首次出现在来自硅…

有特色的视频

基于软件的自检作为处理单元的安全机制

Synopsys对此

了解Synopsys ARC软件测试库如何帮助您在动力和区域预算范围内进行高性能安全关键型汽车设计。

了解更多

特色粉笔谈话亚博里的电子竞技

门把你的问题赶走

逮老鼠的电子产品而且英飞凌

隔离门驱动器是一个重要的设计元素,可以保护我们的设计免受过电压和短路。但是,我们如何微调这些孤立的门驱动器,以满足我们所需的设计要求呢?在本集Chalk Talk中,来自英飞亚博里的电子竞技凌的Amelia Dalton和Perry Rothenbaum探索了包含在英飞凌EiceDRIVER™X3单通道高度灵活隔离门驱动器中的可编程功能。他们还研究了为什么他们的可靠和准确的保护,精确和快速的开关和DESAT保护可以使他们非常适合您的下一个设计。

点击这里了解英飞凌技术EiceDRIVER™隔离和非隔离门驱动器的更多信息

Baidu