英伟达发布最新版CUDA 13.1,官方直接定性:这是自2006年诞生以来最大的进步。 核心变化是推出全新的CUDA Tile编程模型,让开发者可以用Python写GPU内核,15行代码就能达到200行CUDA C++代码的性能。 Jim Keller参与设计过AMD Zen架构、苹果A系列芯片、特斯拉自动驾驶芯片 ...
英伟达把CUDA门槛砸了!新一代CUDA 13.1推出全新编程模型CUDA Tile,15行Python代码性能匹敌200行C++,被芯片界传奇人物Jim Keller质疑“自毁护城河”。
IT之家12 月 7 日消息,英伟达本周四发布了全新的 CUDA 13.1,这是自 2006 年 CUDA 平台问世以来规模最大的一次功能扩展更新。 英伟达介绍称,本次更新的重点在于引入了一种名为 CUDA Tile 的全新 GPU 编程方式,旨在让更广泛的开发者群体能够更轻松地运用强大的 AI ...
Python 速度提升80倍?探究如何用一行代码将你的代码变成GPU猛兽! GPU非常适合处理需要对不同数据执行相同操作的任务。这种方法名为单指令多数据(SIMD)。与只有几个强大核心的CPU不同,GPU拥有数千个较小的核心,它们可以同时运行这些重复性操作。你会在 ...
NVIDIA 推出 Wheel Variants,以简化 CUDA 加速的 Python 包安装,解决兼容性问题,并优化各种硬件配置的用户体验。 NVIDIA 宣布推出 Wheel Variants,这是一种新格式,旨在简化 CUDA 加速的 Python 包的安装和打包。根据 NVIDIA 的博客文章,由 Jonathan Dekhtiar 撰写,此举将解决与 ...
有一种新的编程语言,正在AI圈兴起,撬动英伟达的围墙花园。而CUDA也不再是护城河。 近日,一位大牛 Thomas Cherickal,发表了一篇博客,阐述了一种新的编程范式。他认为,基于 MLIR 的 Mojo 无疑将取代基于 LLVM 的 CUDA,而且这种方式已经几乎可以在其他任何芯片 ...
在 AI 领域,英伟达开发的 CUDA 是驱动大语言模型(LLM)训练和推理的核心计算引擎。 不过,CUDA 驱动的 LLM 推理面临着手动优化成本高、端到端延迟高等不足,需要进一步优化或者寻找更高效的替代方案。 近日,CMU 助理教授贾志豪(Zhihao Jia)团队创新玩法 ...
今年,英伟达可谓是全力押注,明确表示要确保 Python 成为 CUDA 并行编程框架中的“一等公民”。 多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。在近期的 GTC 大会上,英伟达宣布其 CUDA 工具包将为 Python ...
今年,英伟达可谓是全力押注,明确表示要确保 Python 成为 CUDA 并行编程框架中的“一等公民”。 多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。 在近期的 GTC 大会上,英伟达宣布其 CUDA 工具包将为 Python ...
编译 | 核子可乐、Tina 今年,英伟达可谓是全力押注,明确表示要确保 Python 成为 CUDA 并行编程框架中的“一等公民”。 多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。在近期的 GTC 大会上,英伟达 ...