并行AI RISC

内容摘要芬兰的 Flow Computing 已开始对其并行处理单元 (PPU) AI 模块的 RISC-V编译器进行 alpha 测试。本文引用地址:PPU 能够通过使用编译器使源代码利用该架构,将任何 CPU 架构增加多达 100 倍。第一次目

联系电话:400-962-3929

芬兰的 Flow Computing 已开始对其并行处理单元 (PPU) AI 模块的 RISC-V编译器进行 alpha 测试。

本文引用地址:

PPU 能够通过使用编译器使源代码利用该架构,将任何 CPU 架构增加多达 100 倍。第一次目标编译表明,通过重新编译现有代码,可以显著减少 RISC-V CPU 模型中常见的循环,达到 100 倍的预期性能。

相比之下,只需将一些 CPU 内核替换为 PPU,即可在不更改源代码的情况下进行 2 倍的改进,而无需重新编译。

编译器识别现有源代码中可由 PPU 有效加速的并行元素。分析代码以确定哪些部分可以通过 PPU 加速得到增强,然后编译器将可并行化功能直接分配给 PPU,绕过 CPU 瓶颈。

“我们在早期开发阶段充分证明的是,简单的并行工作负载会导致 CPU 中出现大量循环,而没有 PPU 增强,而在具有 PPU 的 CPU 中,这些循环会显著减少(如果不是实际上消除的话),”Flow Computing(芬兰研究实验室 VTT 的衍生公司)的首席技术官、首席架构师兼联合创始人 Martti Forsell 博士说。

“对于我们的工程师来说,在对集成到 RISC-V CPU 模型中的 PPU 架构的首次测试中,一个出乎意料的积极惊喜是,该软件具有最佳的代码质量。”

该编译器允许将高级程序编译为扩展的 RISC-V 二进制文件,并在 Flow 基于 gem5 的模拟器中执行。gem5 广泛应用于各种公司,特别是在处理器设计、学术研究和嵌入式系统领域。gem5 是一个开源模拟器,支持许多架构,包括 RISC-V,AMD、ARM、Google、Intel、Qualcomm 和 SiFive 等组织将其用于定制处理器设计的研究、开发和性能分析。

设计中的其他模块,如矩阵单元、矢量单元、NPU 和 GPU,也全面受益于 PPU 的性能,并从 CPU 获得重大提升。

 
举报 收藏 打赏 评论 0
今日推荐
浙ICP备19001410号-1

免责声明

本网站(以下简称“本站”)提供的内容来源于互联网收集或转载,仅供用户参考,不代表本站立场。本站不对内容的准确性、真实性或合法性承担责任。我们致力于保护知识产权,尊重所有合法权益,但由于互联网内容的开放性,本站无法核实所有资料,请用户自行判断其可靠性。

如您认为本站内容侵犯您的合法权益,请通过电子邮件与我们联系:675867094@qq.com。请提供相关证明材料,以便核实处理。收到投诉后,我们将尽快审查并在必要时采取适当措施(包括但不限于删除侵权内容)。本站内容均为互联网整理汇编,观点仅供参考,本站不承担任何责任。请谨慎决策,如发现涉嫌侵权或违法内容,请及时联系我们,核实后本站将立即处理。感谢您的理解与配合。

合作联系方式

如有合作或其他相关事宜,欢迎通过以下方式与我们联系: