200亿美元!英伟达「收购」Groq工夫许可与「TPU原班人马」
栏目:客户案例 发布时间:2026-01-08
  外地时分 2025 年 12 月 24 日,一则英伟达以 200 亿美元收购 AI 专用芯片首创公司 Groq 资产的音讯爆料,欢喜了硅谷的圣诞节。

  外地时分 2025 年 12 月 24 日,一则英伟达以 200 亿美元收购 AI 专用芯片首创公司 Groq 资产的音讯爆料,欢喜了硅谷的圣诞节。

  很速,Groq 揭晓通告,称英伟达与 Groq 竣工的交往是「非排他性本领许可赞同」,英伟达将获取 Groq 的芯片本领授权,且 Groq 创始人兼 CEO Jonathan Ross(当年谷歌 TPU 的创始成员)、总裁 Sunny Madra 及其他中心团队将列入英伟达,而 Groq 公司将陆续独立运营。这是英伟达有史从此最大界限的一笔交往,远超 2019 年收购 Mellanox 的 70 亿美元。

  这一交往并非单独变乱,而是近年来环球 AI 市集角逐与形式演进的一个缩影,希奇是正正在环球界限内加快睁开的、缠绕 AI 专用算力的构造与转向:6 月,途透社报道,动作英伟达 GPU 长久从此的最大采购商之一的 OpenAI 已起初租用谷歌 TPU 为其 ChatGPT 及其他 AI 产物供应算力救援;10 月,谷歌与 Anthropic 官宣谷歌将向 Anthropic 供应至众 100 万块专用 AI 芯片 TPU 及附加的谷歌云效劳;11 月,The Information 报道称 Meta 正筹划于 2027 年将谷歌 TPU 布置至自少有据核心,特斯拉也官宣已正在车辆统制体例与数据核心大界限布置数百万颗自研 AI 芯片。

  顶级 AI 科技企业们的动态无不明晰开释出一个信号:环球 AI 算力基本步骤正慢慢走出以 GPU 架构为中心的简单范式,转向以 TPU 和类 TPU 为代外的 AI 专用芯片的新架构宗旨。

  纵然交往两边夸大其「非收购」本质,但过去两年里,通过「本领授权」的体例完毕「人才收购」或获取「本领让渡」,仍旧是硅谷科技巨头们屡用不鲜、既能规避古板并购或者面对的囚禁、又能迅疾将宗旨产物/本领/人才纳入麾下的「非规范收购」要领。

  2025 年,Meta 斥资近 150 亿美元收购 AI 数据标注首创公司 Scale AI 49% 股权,Scale AI 合伙创始人兼 CEO 列入 Meta,Scale AI 仍连结独立运营;AMD 与加拿大 AI 芯片创企 Untether AI 竣工赞同,吸纳 Untether AI 全盘 AI 硬件与软件工程团队;谷歌斥资 24 亿美元(约合群众币168亿元),引进 AI 代码天生首创公司 Windsurf 顶尖人才与本领。苹果、微软和亚马逊也都正在近两年举办过雷同的交往。

  而此次英伟达与 Groq 之间 200 亿美元的巨额交往,英伟达 CEO 黄仁勋正在内部邮件中阐释了其希图:“咱们筹划将 Groq 的低延迟措置器集成至 NVIDIA AI 工场架构,将该平台的运用界限扩展至更通常的 AI 推理与及时任务负载界限。”

  公然材料显示,Groq 创建于 2016 年,是一家用心于 AI 专用芯片研发的美邦公司,公司估值正在本年 9 月的最新一轮融资中到达 69 亿美元。其芯片产物取名为 LPU(说话措置器),专为 AI 推理场景安排,号称运转大说话模子的速率可达 GPU 的 10 倍,能耗却唯有极度之一。值得提神的是,Groq 创始人 Jonathan Ross 曾是谷歌 TPU(张量措置器)芯片项方针创始成员之一。

  正在 Meta 被报道筹划大界限布置谷歌 TPU、Anthropic 已缔结百万片 TPU 采购赞同之后,动作英伟达重要客户的各大模子厂商,正正在踊跃寻求并筹划实质采用以 TPU 为代外的新算力源。Groq 团队的 TPU 靠山,使其成为英伟达剖判以 TPU 为代外的 AI 专用算力芯片的最佳对象。AI 专用芯片已暴露出通用 GPU 架构难以抗拒的能效上风,且这一差异无法仅通过迭代现有产物线轻松抹平。

  GPU 最初安排用于图形措置,特别是及时烘托和图像措置,因而对个中场面组织的矩阵和向量运算做了特意优化,厥后渐渐发达成为通用阴谋修造(GPGPU)。GPU 具有大方组织较为浅易的并行措置单位,适合措置高度并行的职责,如图形烘托和科学阴谋,因而被通常运用于阴谋机图形学、逛戏开拓、视频编码/解码、深度进修陶冶和推理。

  TPU 是谷歌专为加快机械进修和深度进修职责而安排的专用芯片,希奇是针对深度进修模子的陶冶和推理。TPU 针对张量运算举办了高度优化,单个的脉动阵列架构模糊量和措置服从相较 GPU 有了更大擢升,希奇适合于措置矩阵乘法等常睹于神经搜集的操作,重要用于机械进修和深度进修模子的陶冶和推理,希奇是行使 TensorFlow 框架的职责。

  TPU 正在架构和安排上的根蒂性改正,使其成为比 GPU 更适合举办大方布置或行使的深度进修阴谋单位:

  众维度的阴谋单位普及阴谋服从:相较于 CPU 中的标量阴谋单位和 GPU 中的矢量阴谋单位,TPU 行使二维甚至更高维度的阴谋单位已毕阴谋职责,将卷积运算轮回睁开的体例完毕最大节制的数据复用,低落数据传输本钱,擢升加快服从;

  更省时的数据传输和高服从的统制单位:冯诺依曼架构带来的存储墙题目正在深度进修职责当中尤为优秀,而 TPU 采用更为激进的战略安排数据传输,且统制单位更小,给片上存储器和运算单位留下了更大的空间;

  安排面向 AI 的加快,加强 AI/ML 阴谋才力:定位切实,架构浅易,单线程统制,定制指令集,TPU 架构正在深度进修运算方面服从极高,且易于扩展,更适合超大界限的 AI 陶冶阴谋。

  跟着大模子参数界限与杂乱度的擢升,阴谋的中心日益纠合于大界限、高并行度的矩阵乘法运算(MatMul)。GPU的架构上风正在于措置高度并行但形式众变的图形阴谋,其通用性带来了生动性,但正在推广 AI 阴谋职责时,其杂乱的统制逻辑、众层级的内存体例会带来不成避免的功耗和服从开销。而谷歌 TPU 架构,则通过脉动阵列架构,将阴谋资源高度纠合于矩阵运算单位,并以片上高带宽存储取代杂乱的数据更动机制,从硬件层面重构阴谋途径。这种「以算为本」的安排理念,使其正在能效比、模糊密度和界限化布置上暴露出明显上风。

  方今,越来越众的天下顶尖科技公司正在踊跃运用以至自研 TPU 或类 TPU 架构的 AI 专用芯片:

  资金与财富层面的汇集行动,其基础正在于 AI 阴谋负载组织自己正正在发作长远蜕变。越来越众的头部科技公司起初将眼神投向 AI 专用架构。TPU 所代外的专用算力途径,正慢慢从「可选计划」演变为支持下一阶段 AI 发达的闭头基本步骤之一。

  中心创始团队组修于 2018 年,动作邦内唯逐一家控制 TPU 架构 AI 专用芯片中心本领并完毕全自研 TPU 芯片量产的公司,中昊芯英的创始人及 CEO 杨龚轶凡曾动作谷歌 TPU 芯片中心研发者,深度到场过 TPU v2/3/4 的安排与研发任务。

  TPU 为 AI 大模子而生的自然上风架构,使其正在面向 AI 阴谋场景时,正在一概坐蓐制程下相较于 GPU 可能具有 3-5 倍的机能擢升。以中昊芯英历时近五年全自研的邦内首枚已量产 TPU AI 芯片「刹那®」为例,「刹那®」正在措置大界限 AI 模子运算时与海外出名 GPU 芯片比拟,阴谋机能可能超越其近 1.5 倍,正在已毕相像阴谋职责量时的能耗低落 30%,将代价、算力和能耗归纳测算,「刹那®」的单元算力本钱仅为其 42%。

  环球 AI 算力财富的发达趋向显示,当阴谋服从与本钱成为 AI 大模子加快迭代及大界限商用落地的中心瓶颈时,对底层算力架构举办专用化、定制化改正,已成为驱动财富进取的厉重成分。看待中邦 AI 芯片财富而言,这一环球性趋向昭彰了用心特定赛道、深耕架构革新的计谋价钱。中昊芯英将陆续坚忍 TPU 本领途径,聚焦 AI 阴谋素质,努力于为市集供应高效、可行的专用算力治理计划。返回搜狐,查看更众

                       
                      Copyright © 2012-2024 od体育中国在线app官方入口(全站)官方网站-网页版/登录入口/app 版权所有
                      HTML地图XML地图TXT地图