你的位置:kaiyun网页版登录入口 > 新闻资讯 > 开云kaiyun一举将英伟达推上AI芯片鸿沟的控制地位-kaiyun网页版登录入口

开云kaiyun一举将英伟达推上AI芯片鸿沟的控制地位-kaiyun网页版登录入口

时间:2025-02-28 04:54 点击:164 次

开云kaiyun一举将英伟达推上AI芯片鸿沟的控制地位-kaiyun网页版登录入口

快科技2月5日音讯开云kaiyun,DeepSeek各人爆火,再一次引发外界对GPU算力间隔话题的留情。

据报说念,DeepSeek设置的大谈话模子绕过了英伟达的CUDA框架,正为改日兼容国产GPU芯片作念准备。

家喻户晓,英伟达的CUDA(Compute Unified Device Architecture,和解运算架构)能大幅裁汰研发大模子的难度,获各人设置商使用,一举将英伟达推上AI芯片鸿沟的控制地位。

但最新发现表露,DeepSeek使用英伟达的H800芯片查考时,使用英伟达底层硬件提醒PTX(Parallel Thread Execution)谈话,而非高档编程谈话CUDA。

这么意味着DeepSeek绕过了CUDA,使用更底层的编程谈话作念优化。

关于神色设置东说念主员来说,CUDA是一种愈加友好的高档谈话,设置者只需要专注于神色和算法最关系的开动逻辑,而不太需要有计划具体的神色是如安在GPU等硬件上具体如何执行盘算的,从而不详裁汰设置难度。

而PTX在接近汇编谈话的层级开动,允许进行细粒度的优化,如寄存器分派和Thread / Warp级别的迤逦。这种编程止境复杂且难以珍爱,是以行业通用的作念法是使用CUDA这么的高档编程谈话。

换句话说,DeepSeek把优化作念到了极致。

北京航空航天大学副教诲黄雷默示,绕过CUDA不错径直左证GPU的驱动函数作念一些新的设置,从而终了愈加细粒度的操作。

这也诠释DeepSeek领有一些擅长写PTX谈话的里面设置者。假如它之后使用国产GPU,其在硬件适配方面将会更轻车熟路,其惟有了解这些硬件驱动提供的一些基本函数接口,就不错仿照英伟达GPU硬件的编程接口去写关系的代码,从而让自家大模子愈加容易适配国产硬件。

“这突显了DeepSeek异常的工程水平,并标明好意思国对华制裁加重的“GPU穷乏危险”引发了他们雄伟感和创造力。”韩国Mirae Asset Securities Research的又名分析师默示。

【本文间隔】如需转载请务必注明出处:快科技连累剪辑:朝日开云kaiyun著述本色举报

【本文间隔】如需转载请务必注明出处:快科技

连累剪辑:朝日

著述本色举报

]article_adlist-->   声明:新浪网独家稿件,未经授权不容转载。 -->
www.yazhujiaoyu.com
官方网站
关注我们
新闻资讯国际科技园1050号
公司地址

Powered by kaiyun网页版登录入口 RSS地图 HTML地图


kaiyun网页版登录入口-开云kaiyun一举将英伟达推上AI芯片鸿沟的控制地位-kaiyun网页版登录入口