OpenAI Triton开始合并AMD ROCm代码，9月20日举行开发者大会-脚本导航

OpenAI Triton开始合并AMD ROCm代码，9月20日举行开发者大会

来源：IT之家

2023-09-30 15:22:10

515

管理

IT之家 9 月 3 日消息，Triton 是一种类似于 Python 的开源编程语言，它可以使没有 CUDA 经验的研究人员顺利编写高效的 GPU 代码（可以理解为简化版 CUDA），而且号称小白也可以写出与专业人士相媲美的代码，就是让用户用相对较少的努力实现最高的硬件性能，但 Triton 初期只支持英伟达 GPU。

OpenAI 声称：Triton 只要 25 行代码，就能在 FP16 矩阵乘法上达到与 cuBLAS 相当的性能。

从 Github 我们可以看到，OpenAI 已经开始在最新的 Triton 版本中合并 AMD ROCm 相关分支代码，暴露了很多此前努力的工作。也就是说，最新 Triton 后端已适配 AMD 平台，可谓意义重大。

值得一提的是，Triton 是开源的，比起闭源的 CUDA，其他硬件加速器能直接集成到 Triton 中，大大减少了为新硬件建立 AI 编译器栈的时间。

在此前发布的 PyTorch 2.0 版本中，TorchInductor 便引入了 OpenAI Triton 支持，可为多个加速器和后端自动生成快速代码，同时实现用 Python 取代 CUDA 编程来写底层硬件的代码。也就是说，Triton 已经是 PyTorch 2.0 后端编译器关键构成部分。

实际上，此前 AMD ROCm 则主要是采用 Hipify 工具实现 CUDA 兼容，而随着 AMD 开始为 RDNA 3 消费级显卡提供 ROCm 支持，预计后续将会有更多平台选择适配 AMD 硬件。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

年亏损5亿刀，OpenAI 2024年破产？自曝GPU短缺，顶级人才掀离职潮

2023-09-30 15:23

280 亿！亚马逊投了 OpenAI 最大敌人

2023-09-30 15:21