英伟达放大招全新芯片直指OpenAI
英伟达放大招!全新芯片直指OpenAI,AI推理格局要变天
英伟达又出王炸了!
英伟达计划发布一款专为OpenAI及其他客户定制的全新处理器,助力打造更快、更高效的工具。这是其业务的重大调整,或将重新定义AI竞赛格局!
新芯片什么来头?
据知情人士透露,这款新平台将于下月在圣何塞举办的英伟达GTC开发者大会上正式公布,将整合初创公司Groq设计的芯片。
OpenAI成为最大客户
部分知情人士称,OpenAI已同意成为这款新处理器的最大客户之一!这对英伟达而言是重大胜利。
上周五,OpenAI宣布将向英伟达大规模采购专用推理算力,同时还对英伟达进行了300亿美元投资。
为什么这时候推新芯片?
1.推理计算成为竞争焦点:谷歌和亚马逊均已推出芯片与英伟达旗舰产品抗衡
2.客户施压:部分客户发现GPU成本过高、功耗过大,并不完全适配模型实际运行需求
3.AI智能体崛起:随着智能体AI快速崛起,英伟达面临巨大压力,亟需研发成本更低、能效更高的推理芯片
英伟达的挑战
这是英伟达首次面临其旗舰产品的性能瓶颈。
上月,OpenAI与Cerebras达成数十亿美元的计算合作。Cerebras主打推理芯片,其首席执行官称,该芯片速度快于英伟达GPU。

英伟达于去年底以200亿美元获得Groq关键技术授权,并引进其核心管理团队,这是硅谷史上规模最大的"人才并购"交易之一。
AI推理的两大环节
- 预填充:模型理解用户提示词的过程
- 解码:模型逐词生成回复的过程
对大型AI模型而言,预填充通常更快,而解码往往尤其缓慢。
格局要变
编码应用已成为企业AI最重要、最赚钱的应用场景之一。英伟达的战略:跳出GPU范畴,抢占AI细分市场。
AI推理芯片大战,才刚刚开始!



