DeepSeekV4下周发布引关注外媒称中国AI下一个冲击波在硬件领域
DeepSeekV4下周发布引关注外媒称中国AI下一个冲击波在硬件领域
今年的春节档有多个国产AI大模型发布,但DeepSeekV4并未如预期问世。好消息是,下周有可能就正式发布。
这一消息最初由英国FT金融时报援引消息人士报道。考虑到下周有全年最重磅的会议——两会开幕,而且是"十五五"计划开局,DeepSeekV4下周问世的消息可信度较高。
去年震撼美国AI行业
去年春节档发布的DeepSeekR1曾给美国AI行业带来巨大震撼,当时NVIDIA股价暴跌17%。美国因此患上了"DeepSeek恐惧症",生怕每次国产开源AI发布就给美国AI一波冲击。
美国CNBC制作了长达40分钟的视频——"ChinanextAIshockishardware",指出DeepSeekV4发布之后将冲击美国硬件行业。
将支持国产AI芯片
DeepSeek之前的大模型还用了NVIDIA的AI卡训练,但DeepSeekV4这一代显然会加大对国产AI芯片的支持,在国产芯片上完成训练、推理,并为多个国产AI芯片优化。目前可知华为昇腾及寒武纪的思元系列会有深度适配。
去年DeepSeekV3.1发布时,官方明确提到UE8M0FP8是即将发布的下一代国产芯片设计。之前国产AI芯片普遍只支持FP16格式,部分AI可以软件支持FP8,但显然不如原生FP8,后者相比FP16理论性能翻倍,对带宽要求也大幅降低,有助于降低成本。
此前有传闻称V4的成本只有对手的1/50。
华为昇腾系统领衔
国产AI芯片中目前最强的还是华为的昇腾系统,尤其是去年推出的超节点集群。路线图公布了昇腾Atlas950SuperPoD、Atlas960SuperPoD及Atlas970SuperPoD,今年问世的是Atlas950系列。
Atlas950超节点支持8192张基于Ascend950DT的昇腾卡,是Atlas900超节点的20多倍。满配包括128个计算柜、32个互联柜,共计160个机柜,占地面积1000平方米左右,柜间采用全光互联。
算力大幅提升,其中FP8算力达到8EFLOPS,FP4算力达到16EFLOPS,互联带宽达到16PB/s。这个数字意味着Atlas950一个产品的总互联带宽已经超过今天全球互联网峰值带宽的10倍有余。




