传DeepSeek跳出英伟达限制绕过CUDA或为适配中国国产GPU做

2025-02-11 科技 0

#8203;DeepSeek自发布以来，迅速攀升至140个国家的苹果App Store下载排行榜首位，并在美国的Android Play Store中同样占据榜首位置。 DeepSeek的全球爆火，再一次引发外界对GPU算力限制话题的关注。据报道，DeepSeek开发的大语言模型绕过了英伟达的CUDA框架，正为未来兼容国产GPU芯片做准备。众所周知，英伟达的CUDA能大幅降低研发大模型的难度，获全球开发商使用，一举将英伟达推上AI芯片领域的垄断地位。但最新发现显示，DeepSeek使用英伟达的H800芯片训练时，使用英伟达底层硬件指令PTX语言，而非高级编程语言CUDA。这样意味着DeepSeek绕过了CUDA，使用更底层的编程语言做优化。对于程序开发人员来说，CUDA是一种更加友好的高级语言，开发者只需要专注于程序和算法最相关的运行逻辑，而不太需要考虑具体的程序是如何在GPU等硬件上具体如何执行计算的，从而能够降低开发难度。而PTX在接近汇编语言的层级运行，允许进行细粒度的优化，如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护，所以行业通用的做法是使用CUDA这样的高级编程语言。DeepSeek把优化做到了极致。据媒体报道，北京航空航天大学副教授黄雷表示，绕过CUDA可以直接根据GPU的驱动函数做一些新的开发，从而实现更加细粒度的操作。这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。假如它之后使用国产GPU，其在硬件适配方面将会更得心应手，其只要了解这些硬件驱动提供的一些基本函数接口，就可以仿照英伟达GPU硬件的编程接口去写相关的代码，从而让自家大模型更加容易适配国产硬件。 “这凸显了DeepSeek非凡的工程水平，并表明美国对华制裁加剧的“GPU短缺危机”激发了他们紧迫感和创造力。”韩国Mirae Asset Securities Research的一名分析师表示。

标签：关于科技的事例素材、中国科技发展历程ppt 、科技节手抄报内容资料100字、我的黑科技大脑、公司测名

上一篇：什么就是在人事测评活动中我是怎么被老板夸奖的

下一篇：倾世皇妃穿越之谜与宠爱

传DeepSeek跳出英伟达限制绕过CUDA或为适配中国国产GPU做

家居美学时尚客厅装修灵感大汇集

财经界的风暴新浪首页揭秘隐藏在数字背后的惊人真相

学弱电到底要学多久才能掌握

中国芯片业迈新步伐7纳米技术的突破者们

小户型装修设计我是怎么让我的小房子变大又美观的