DeepSeek准备适配国产GPU，绕开英伟达CUDA

知识 2025-02-06 05:55:15 6

DeepSeek要适配国产GPU了？准备这确实是大好事一件。据报道，适配DeepSeek在研发大模型时绕过了英伟达的国产护城河CUDA，这意味着可以直接根据GPU的开英驱动函数做一些新的开发，从而实现更加细粒度的伟达操作。

例如DeepSeek在多节点通信时绕过了 CUDA 直接使用 PTX（Parallel Thread Execution），准备其最多只能实现以算法的适配方式来高效利用硬件层面的加速。

一旦速度变得更快，国产打个比方这就意味着别人家的开英模型要训练十天，而DeepSeek只需要训练五天，伟达那么就能给模型喂更多的准备数据，即能让模型在同等时间内看到更多的适配数据，间接提高模型的国产效果。

按照消息人士的开英说法，DeepSeek拥有一些擅长写PTX语言的伟达内部开发者。

那么，假如它之后使用国产GPU，其在硬件适配方面将会更得心应手，其只要了解这些硬件驱动提供的一些基本函数接口，就可以仿照英伟达GPU硬件的编程接口去写相关的代码，从而让自家大模型更加容易适配国产硬件。

本文仅代表作者观点，不代表本站立场。
本文系作者授权发表，未经许可，不得转载。

CVSS 评分 9.9/10：微软火速修复 Azure AI 人脸识别服务高危漏洞

微软详解Windows 10 ESU付费支持：教育版仅需1美元

苹果 MacBook Air M2 新款笔记本电脑 5332元

英菲克i W8鼠标到手价34.8元还包邮

容声四开门冰箱，限时优惠到手2173元

超霸7号电池8.8元10粒，88VIP特惠！

谷歌 CEO 皮查伊盛赞 DeepSeek：非常出色，AI 成本下降有利于整个行业发展

OPPO Reno13 Pro 5G手机全新上市，惊喜开售