芯片设计的新视野

AI如何推动更快的芯片验证覆盖和第一次正确的硅调试

Soc设计验证流程
作者:Taruna Reddy,员工产品经理,Robert Ruiz,产品线管理总监,Synopsys EDA Group

如今,问题不再是人工智能能做什么,而是它不能做什么。从ChatGPT这样的热门聊天机器人到自动驾驶汽车,人工智能正在我们的日常生活中无处不在。即使是芯片设计等可能是意料之外的行业,也从更高的智能中受益。

如果开发芯片过程中最费力、最耗时的步骤之一,能够为更快的第一次正确的硅带来智能冲击,会怎么样?想象一下将AI集成到芯片验证和调试阶段的可能性,尤其是在芯片变得越来越复杂的情况下。

当然,最终的目标是更快地达到您的验证覆盖率目标,并最终找到更多的bug。数字设计有大量的设计状态空间,可以在其中进行操作。要手动分析所有这些空间,并得出足够可操作的见解来发挥作用,几乎是不可能的。

但如果人工智能能够介入并伸出援手,验证工程师就可以专注于修复发现的漏洞。想想这对你的硅设计有什么好处。

持续数天的回归运行会成为过去吗?

芯片设计的复杂性已经在突飞猛进地增长,半导体行业正面临着一系列引人注目的挑战。从埃微米到多模集成和快速节点迁移,在提高工程生产率的同时,从未像现在这样需要找到创新的解决方案。然而,大多数soc需要一个昂贵的衍生,主要是由于逻辑和功能问题。正因为如此,SoC验证永远不会足够,然而,成本和上市时间的压力阻止了无休止的验证和调试循环。

一旦设置了芯片设计的RTL并配置了设计状态空间,验证过程就开始了。芯片验证工程师需要检查这些空间,以确保最终的SoC设计能够工作。覆盖关闭背后的目标是确保整个设计将按照预期的功能工作。

覆盖关闭面临三个主要挑战:

  • 计划覆盖率,因为知道在测试台的覆盖率定义中编写什么是很有挑战性的(需要什么类型的覆盖率组,差距在哪里,仍然需要编写什么,等等)。这对于确保100%的覆盖率确实意味着您已经找到了所有的错误是非常重要的。
  • 关闭覆盖率,因为很难知道哪些测试对覆盖率贡献最大。您可能会将相同的测试运行1000次,以达到50%的覆盖率。当你接近100%的覆盖率时,你可能会发现关闭最后几个百分比可能需要几周的时间。目标测试是这里的关键,但是开发这些测试需要大量的劳动。
  • 刺激开发和根本原因分析,因为您可能会遇到刺激不应该执行特定配置或错误的场景。或许刺激方案的编写方式根本达不到覆盖目标。

在传统的芯片验证周期中,验证工程师将设置一个目标并运行他们的回归环境。作为这个过程的一部分,工程师们建立了测试平台,以产生随机刺激,看看设计如何响应。对于一个给定的设计,有10,000到15,000个测试是很常见的,验证团队通常对每个测试的ROI没有感觉。回归可能会持续数天,占用宝贵的计算资源。

在SoC验证周期中,有两个迭代循环占用了大量时间:在运行回归和覆盖关闭后调试故障和修复错误(图1)。这两个迭代工作都是耗时的,迭代的工作,包括覆盖分析,在发现覆盖漏洞后进行调整,然后一遍又一遍地重复这一切。然后,当团队发现失败时,他们需要分析它们,在RTL或测试台中进行更改,并重新运行回归以确保错误实际上已经修复。这部分也是一个迭代循环。

Soc验证周期
图1:典型验证周期中的迭代循环。

此外,覆盖关闭过程的最后一点是最费力的,这并不少见。对整个过程产生的大量数据进行彻底的人工分析实际上是不可行的,因此团队通常需要对芯片设计漏洞的根本原因进行更多的深入了解。

学习如何更快地关闭验证覆盖

迭代循环的一个亮点是从中学习的潜力,这就是人工智能,特别是机器学习(ML)可以发挥关键作用的地方。如果ML引擎能够从某些模式中学习,那么它就能够从测试台上的一行代码中识别出可能的错误。知道了这一点,它将能够将这种洞察力应用于未来的回归,实现更快的覆盖关闭,特别是当系统得到训练时,可能会实现更高水平的覆盖。

人工智能正在半导体行业取得重大进展。屡获殊荣,行业第一Synopsys对此DSO.ai™最近,用于芯片设计的人工智能应用实现了首批100个生产带出。通过在芯片设计的大解空间中自动搜索优化目标,DSO。人工智能有助于提高工程生产力以及芯片的功率、性能和面积(PPA)。

在验证方面,为了减轻前面提到的调试和修复周期,可以使用Synopsys Verdi®自动调试系统回归调试自动化(RDA)技术提供人工智能驱动芯片验证。有了这个功能,用户就可以利用预测分析的优势,自动化手动和容易出错的过程,在测试设计和测试台中定位故障的根本原因。更多自动化调试周期的创新即将出现,最终实现完全自动化的调试和修复循环,无需人工干预。

这些例子仅仅是未来的开始,因为还有更多的EDA流程,在这些流程中,更强大的智能可以帮助工程师更高效地工作,从而产生更好的结果。例如,如果人工智能能够更好地了解需要哪些额外的覆盖范围呢?如果更高的智能可以最大限度地减少在运行回归过程中浪费的时间和精力呢?或者如果它能帮助更快地分析根本原因呢?也许一个通常需要几天时间的任务可以减少到几个小时,这可能会为额外的项目和/或更多增值的任务腾出资源。

更快地向市场交付正确的芯片

当今世界的复杂问题需要更复杂的计算系统来解决。自动化和智能可以补充工程师的工作,提高生产力,并使设计和验证专家专注于创建差异化的硅芯片,使这些系统进入生活。当ai驱动的EDA流程可以承担重复的任务时,工程师就可以获得带宽来修复错误并进一步推动他们的设计。从设计空间探索到覆盖和调试循环等等,人工智能可以产生不可磨灭影响的领域是广泛而广阔的。

在即将到来的SNUG硅谷会议上了解更多关于AI可以为验证和调试周期带来的可能性。

在今年的SNUG硅谷会议上,AMD将在上午11:15讨论随机模拟中的覆盖回归优化。3月29日在圣克拉拉会议中心举行。3月29日中午,还将有AMD、Meta和NVIDIA的午餐小组讨论,他们将探讨“AI如何推动EDA的下一波创新浪潮”。注册SNUG硅谷今天!

Baidu