本周,AMD 在其 "推动 AI" 活动上发布了 MI300X GPU,并正式向英伟达的 H100 发起挑战。AMD 宣称,它的 MI300X GPU 在诸多方面优于英伟达的 GPU,堪称全球最快的AI加速器。例如一份幻灯片显示,与H100相比,MI300X提供了2.4倍的内存容量,1.6倍的内存带宽,以及在FP8和FP16计算操作中分别提供了1.3倍的TFLOPS。在实际应用中,这也意味着 MI300X 在特定任务中的速度会比 H100 快1.6倍。
AMD 首席执行官 Lisa Su 举例说,在运行Bloom "吞吐量"(使用1760亿参数)的服务器平台中,8块MI300X芯片比HGX服务器中的8块H100快60%,在"延迟提升"上,使用70亿参数的Llama 2测试中也提高了40%。在单芯片对比中,AMD声称MI300X在FlashAttention-2和Llama 2等特定应用中依然有高达20%的速度优势。Su还表示,在直接的LLM培训中,8块MI300X GPU与HGX服务器中的H100持平,但是在推理性能上领先。
除了MI300X,AMD还宣布了其下一代软件套件,以与英伟达的CUDA平台竞争。该套件被命名为ROCm 6,并已更新以支持最新的大规模语言模型和AI应用。更新后的套件提供了许多性能提升的改进,将提升AI相关任务的性能,但我们还需要等待基准测试结果,看看它在实际应用中的表现如何。
如今,AMD已正式步入高性能计算(HPC)领域,并携正规的数据中心GPU,观察其与英伟达主导地位的角逐将会相当有趣。这场战斗类似于游戏GPU领域中的角逐,英伟达已占据了绝大多数市场份额,AMD 正为争夺剩余的市场而战。然而,MI300X对英伟达的H100构成了有力的竞争。甚至微软的首席技术官最近都表示,他认为AMD最终在这个市场上将非常有竞争力。然而,AMD真正面临的挑战是克服英伟达凭借CUDA在软件上的主导地位,这的确是一项艰巨的任务。
2023-12-07
2024-08-27
2024-10-10
2023-10-18
系统资讯推荐
win10系统推荐
系统教程推荐