EEJournal

行业新闻
现在就订阅

Xilinx启动了迄今为止最强大的加速卡Alveo U55C,专为高性能计算和大数据工作负载而建

突破性的HPC集群解决方案和简化的可编程性使尖端计算能够跨现有客户基础设施和网络大规模扩展

Xilinx, Inc.(纳斯达克股票代码:XLNX),自适应计算的领导者,今天在圣路易斯SC21超级计算会议介绍了Alveo™U55C数据中心加速卡和一个新的基于标准的、api驱动的集群解决方案,用于大规模部署fpga。Alveo U55C加速器为高性能计算(HPC)和数据库工作负载带来了卓越的每瓦性能,并且很容易通过Xilinx扩展®HPC集群解决方案。

专门为高性能计算和大数据工作负载而构建的新Alveo U55C卡是该公司最强大的Alveo在Alveo加速器产品组合中,提供最高的计算密度和HBM容量。加上新的基于Xilinx RoCE v2的集群解决方案,拥有大规模计算工作负载的广大客户现在可以使用现有的数据中心基础设施和网络实现强大的基于fpga的HPC集群。

Xilinx数据中心集团执行副总裁兼总经理Salil Raje表示:“现在,将Alveo计算能力扩展到高性能计算工作负载上比以往更容易、更高效、更强大。“在架构上,基于fpga的加速器,如Alveo卡,为许多计算密集型工作负载提供了最低成本的最高性能。通过引入一种基于标准的方法,可以使用客户现有的基础设施和网络创建Alveo高性能计算集群,我们将这些关键优势大规模地交付给任何数据中心。对于整个数据中心更广泛地采用Alveo和自适应计算来说,这是一个重大的飞跃。”

专为高性能计算和大数据应用而建

Alveo U55C卡结合了当今HPC工作负载所需要的许多关键特性。它提供了更多的数据管道并行性,卓越的内存管理,优化了整个管道中的数据移动,并在Alveo组合中实现了最高的性能。

Alveo U55C卡是单槽全高、半长(FHHL)形式,最大功率低150W。它提供了优越的计算密度,并将HBM2的容量提高了一倍,达到了16GB,比它的前身双槽Alveo U280卡。U55C以更小的形式提供更多的计算,用于创建密集的基于Alveo加速器的集群。它是为高密度流数据、高IO数学和大计算问题而构建的,这些问题需要像大数据分析和人工智能应用程序这样的扩展。

利用RoCE v2和数据中心桥接,再加上200gbps带宽,api驱动的集群解决方案使Alveo网络在性能和延迟方面与InfiniBand网络竞争,而且没有厂商锁定。MPI集成允许HPC开发人员从Xilinx扩展出Alveo数据管道Vitis™统一软件平台.利用现有的开放标准和框架,现在可以跨数百个Alveo卡扩展,而不管服务器平台和网络基础设施,并共享工作负载和内存。

软件开发人员和数据科学家可以利用Vitis平台,通过应用程序和集群的高级可编程性,解锁Alveo和自适应计算的好处。Xilinx在Vitis开发平台和工具流上投入了大量资金,使不具备硬件专业知识的软件开发人员和数据科学家更容易获得自适应计算。支持主要的人工智能框架,如Pytorch和Tensorflow,以及高级编程语言,如C, c++和Python,允许开发人员使用特定的api和库构建领域解决方案,或利用Xilinx软件开发工具包,轻松加速现有数据中心的关键HPC工作负载。

高性能计算客户用例

CSIRO,澳大利亚的国家研究组织,以及世界上最大的射电天文学天线阵,正在使用Alveo U55C卡在平方公里阵列射电望远镜中进行信号处理。将Alveo卡作为与HBM网络连接的加速器部署,可以在整个HPC信号处理集群中实现大规模吞吐量。基于Alveo加速器的集群使CSIRO能够实时处理来自131,000个天线的大量数据聚合、过滤、准备和处理。信号处理集群的HBM2带宽为460Gbps,由420个肺泡U55C卡通过p4支持的100Gbps交换机完全联网。Alveo U55C集群以15Tb/s的总吞吐量提供处理性能,功耗紧凑,成本高效。CSIRO目前正在完成一个示例Alveo参考设计,以帮助其他射电天文学或邻近行业取得同样的成功。

Ansys LS-DYNA几乎世界上所有的汽车公司都在使用碰撞模拟软件。安全性和结构系统的设计取决于模型的性能,因为它们降低了使用计算机辅助设计有限元方法(FEM)模拟进行物理碰撞测试的成本。有限元求解器是驱动数亿自由度模拟的主要算法,这些庞大的算法可以分解成更基本的求解器,如PCG、稀疏矩阵、ICCG。通过使用超并行数据流水线跨多个肺槽卡扩展,LS-DYNA的性能比x86 cpu提高了5倍以上。这导致在每个时钟周期的肺泡管道中有更多的工作,LS-DYNA客户受益于游戏更改模拟时间。

Ansys战略合作总监Wim Slagter表示:“本着不断创新的精神,我们很高兴能与Xilinx合作,在LS-DYNA模拟应用中显著加快有限元求解器的速度,有限元求解器可以代表90%的隐式力学计算工作量。”“我们期待Xilinx的加速帮助我们实现支持工程领域创新者的使命。”

TigerGraph该公司正在使用多个Alveo U55C卡对驱动基于图的推荐和集群引擎的两种最多产的算法进行聚类和加速。图形数据库是数据科学家的颠覆性平台。图表从竖井中获取数据,并将重点放在数据之间的关系上。图形的下一个前沿是实时找到这些答案。Alveo U55C将推荐引擎的查询时间和预测从分钟加速到毫秒。通过使用多个U55C卡来扩展分析,优越的计算能力和内存带宽使图形查询速度比基于cpu的集群快45倍。分数的质量也提高了35%,从而提高了自信心,大大降低了假阳性到低个位数。

产品可用性和易于评估

Alveo U55C卡目前可在Xilinx.com和Xilinx授权分销商上购买。它还可以通过基于公共云的fpga as-a- service提供商轻松评估,以及选择托管数据中心进行私人预览。集群现在可用于私有预览,一般预计在明年第二季度可用。

在本周举行的SC21会议上,Xilinx展示了Alveo U55C加速卡,以及合作伙伴的解决方案。注册在SC21参观Xilinx虚拟展台。

关注Xilinx推特LinkedIn脸谱网

关于Xilinx

Xilinx, Inc.开发高度灵活和自适应的处理平台,实现从云、边缘到端点的各种技术的快速创新。Xilinx是FPGA和自适应soc(包括我们的自适应计算加速平台,简称ACAP)的发明者,旨在提供业内最动态的计算技术。我们与客户合作,创造可扩展的、差异化的和智能的解决方案,使未来的适应性、智能和互联世界成为可能。欲了解更多信息,请访问xilinx.com

留下一个回复

有特色的博客
2021年11月16日
当使用led时,我们是应该先修改亮度然后应用伽马校正,还是应该先应用伽马校正再修改亮度?
2021年11月16日
EDA工具正在向云计算转移;我们探讨了将云计算资源应用于正式芯片设计验证工作负载的成本/性能优势。“云上的正式验证:以你想要的成本获得你需要的计算资源”这篇文章首先出现了……
2021年11月16日
圣地亚哥最近主办了第54届微电子学国际研讨会。这是一个非常普通的标题,所以你应该知道它是由iMAPS,国际微电子学…[[点击标题进入Cadence社区网站的完整博客。]]…
2021年11月8日
Intel®FPGA技术日(IFTD)是一个为期四天的免费活动,将于2021年12月6日至9日在北美、中国、日本、EMEA和亚太地区通过虚拟方式举办。IFTD 2021年会的主题是“加速构建智能和互联世界”。这个虚拟事件…

有特色的视频

完整性3D-IC:业界首个全集成3D-IC平台

节奏设计系统

面对摩尔定律(Moore’s Law)的减速和先进节点成本的上升,集成电路的3D堆叠正成为芯片设计师的首选解决方案。然而,芯片堆叠带来了新的复杂性,需要对整个堆叠系统的机械、电气和热方面进行额外的考虑。观看本视频了解Cadence®Integrity™3D- ic概述,这是一个用于3D规划、实现和系统分析的综合平台,可实现多芯片设计的系统驱动PPA。

点击这里了解更多信息

了纸

3d ic设计的挑战和要求

节奏设计系统

3d ic预计将对网络、图形、AI/ML和高性能计算产生广泛影响。虽然人们对3d集成电路很感兴趣,但它仍处于早期阶段。缺乏标准定义,供应链生态系统处于变化之中,需要解决设计、分析、验证和测试方面的挑战。阅读本白皮书,了解多个堆叠模具的3D集成和包装、设计挑战、生态系统需求和所需的解决方案。

点击这里阅读更多信息

以注入式教学法亚博里的电子竞技

介绍Vivado ML版本

赛灵思公司

机器学习有很多方法可以帮助我们改进集成电路设计,但当涉及到结果的质量和设计迭代时,它是一个游戏规则的改变者。在这一集粉笔谈话中,Amelia Da亚博里的电子竞技lton和来自Xilinx的Nick Ni讨论了机器学习设计优化的好处,基于分层模块的编译带来了什么,以及为什么将模块设计扩展到端到端流程会对您的下一个IC设计产生巨大影响。

点击这里了解更多关于Vivado ML的信息

Baidu