DeepSeek准备适配国产GPU,绕开英伟达CUDA
DeepSeek要适配国产GPU了?准备这确实是大好事一件。据报道,适配DeepSeek在研发大模型时绕过了英伟达的国产护城河CUDA,这意味着可以直接根据GPU的开英驱动函数做一些新的开发,从而实现更加细粒度的伟达操作。
例如DeepSeek在多节点通信时绕过了 CUDA 直接使用 PTX(Parallel Thread Execution),准备其最多只能实现以算法的适配方式来高效利用硬件层面的加速。
一旦速度变得更快,国产打个比方这就意味着别人家的开英模型要训练十天,而DeepSeek只需要训练五天,伟达那么就能给模型喂更多的准备数据,即能让模型在同等时间内看到更多的适配数据,间接提高模型的国产效果。
按照消息人士的开英说法,DeepSeek拥有一些擅长写PTX语言的伟达内部开发者。
那么,假如它之后使用国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达GPU硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。
本文地址:http://microstockbutton.com/news/01f8399915.html
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。