1. 多轮连涨开启!全球模拟厂商7月纷纷提价
2. 股价表现亮眼,国产AI算力芯片进入落地应用爆发期
3. 英伟达B200租赁价格大跌超30%
4. 斥资近40亿美元!高通官宣收购AI软件创企Modular
5. 与博通合作,OpenAI发布首款定制AI芯片Jalapeño
6. 美光利润飙升近1400%,AI公司争相采购内存芯片
1. 多轮连涨开启!全球模拟厂商7月纷纷提价
模拟芯片赛道将于7月1日迎来确定性拐点。自5月以来,全球模拟厂集体“盖章发通知”:德州仪器、英飞凌接连甩出官方调价函,将新价生效日锁定7月1日,国产厂商其后全线跟进,业界热议许久的 “模拟大厂7月统一涨价” 终于落地。区别于过往单点厂商、小众料号的阶段性调价,本轮涨价堪称行业大型同步行动,具备极强协同性:调价时间统一、涨价逻辑同源、品类高度聚焦,绝大多数厂商已是年内第二次提价,不少企业更是开启第三轮连续涨价模式!
海内外龙头同涨,分层涨价特征明确
截至2026年6月25日,全球已有近20家主流模拟、功率半导体企业官宣7月1日调价,形成欧美龙头领涨、台系厂商跟进、国内企业同步适配的全域涨价格局。本次涨价并非“全料号一刀切暴涨”,而是按照应用赛道、产品壁垒、客户类型形成差异化调价体系,高端算力、车规、工业品类涨幅领跑全行业,低端消费品类调价温和,部分库存充足料号维持原价。
海外龙头作为行业定价锚,率先开启本轮调价,牢牢掌控高端模拟芯片定价权。全球模拟行业龙头德州仪器(TI)于5月7日面向全球代理商、直供终端下发正式调价通知,明确7月1日新签订单全部执行新价格,这是企业近12个月第四轮调价、2026年第二轮大规模涨价。有媒体指出,本次调价梯度大致为:AI服务器、数据中心专用PMIC、高压信号链模拟芯片涨幅15%—25%,工业自动化、储能隔离芯片涨幅10%—15%。
5月底,全球功率半导体厂商英飞凌向客户与合作伙伴表示,将自7月1日起调整部分产品价格。这是继2026年4月首轮提价之后,该公司年内的第二次价格上调。对于该次调价的理由,英飞凌解释主要有两点:一方面源自地缘政治紧张局势所带来的影响。这正导致整体价值链中的各项成本不断上升,涵盖能源、原材料、运输及服务等领域;另一方面,产品组合的需求正快速攀升,且增长幅度远超数月前的预期水平。英飞凌CEO Jochen Hanebeck在今年5月财报会议中也明确表示:“AI数据中心的电源解决方案需求非常旺盛。”
值得一提的是,意法半导体调价生效日为6月28日,时间临近7月,供需、成本涨价逻辑与TI、英飞凌完全一致,同属本轮全球涨价周期。
跟随海外定价节奏,国内模拟及功率IDM企业6月官宣调价,锁定7月1日落地,兼顾毛利率修复与全球价格适配:6月17日,珠海极海半导体发布官方调价函,调价原因为“受上游原材料成本大幅攀升、晶圆代工、封装测试等成本递增影响,行业供应链承压”;23日,扬杰科技对全系列产品价格进行调整,调整幅度为10%—15%。
除此之外,辉芒微、希荻微、英集芯、士兰微、必易微等国产芯片厂商今年先后宣布产品涨价信息。对于涨价风潮,头部终端企业通过签订年度长协锁价,调价缓冲周期长、涨幅可控;中小分销商、中小型终端工厂无长期产能保障,7月1日全额承接涨价成本,供应链承压更为明显。
基本面共振,夯实模拟芯片连涨逻辑**
回溯2021年模拟芯片涨价行情,涨价周期短、回落速度快。2023至2024年,模拟全产业链开启长达两年去库存周期。相较于2021年渠道投机囤货催生的假性缺货,本轮缺货源于真实终端刚需,库存低位叠加增量订单,支撑厂商分多轮稳步涨价,行情具备长期性、稳定性,难以出现短期暴涨暴跌。
供给方面,电源管理、信号链、车规模拟芯片、低压功率器件极大比例依托8英寸晶圆制程生产,先进制程产能无法向下兼容替代成熟制程产能。数据显示,2025年全球8英寸晶圆产能首次同比下滑0.3%,2026年同比降幅扩大至2.4%,伴随台积电、三星持续削减老旧低效8英寸产线,资本开支全面倾斜2nm-3nm先进工艺;联电、世界先进等专攻成熟制程代工厂产能全年满载,全球前十晶圆厂8英寸产线平均稼动率维持92%—96%,无富余产能承接新增订单。
与此同时,行业产能虹吸效应加剧,AI配套模拟芯片毛利率远超传统消费芯片,代工厂优先分配产能给算力、新能源订单,进一步挤压家电、低端数码模拟芯片产能,结构性缺货持续放大。
需求方面,本轮涨价最大增量来自AI算力产业迭代,成为模拟芯片连涨核心催化。除此之外,新能源车、光伏储能打造抗周期刚需底盘。叠加全球制造业自动化改造提速,工控、仪器仪表、工业互联网信号链芯片存量需求平稳,下游车企、工控Tier1主动将安全库存从4周提升至12周,渠道主动补库进一步放大订单缺口,形成“缺货—涨价—补库—紧缺”的正向循环。
成本方面,2025年模拟行业处于下行周期,海内外厂商主动压缩企业毛利,自行消化代工、原材料、物流成本,进入2026年供需反转后,成本压力集中释放,无短期缓解空间:
其一,晶圆成本走高,全年8英寸代工价格上涨;其二,封测原材料涨价显著,金线、铜框架、钯银贵金属价格年内波动上行,日月光、长电科技等封测大厂上调模拟封装服务费5%—20%;其三,地缘扰动推高综合成本,海外模拟龙头综合毛利率下滑,国产中小模拟厂商毛利逼近盈亏线,连续调价成为覆盖成本、稳定经营的必要手段。
全球模拟厂商调价,行业格局重构
本轮7月同步涨价看似步调统一,但海内外模拟企业在调价节奏、产品溢价、客户政策、发展诉求上存在显著差异,本轮涨价周期,也正在重塑全球模拟芯片竞争格局,加速国产替代落地。
从调价节奏来看,海外龙头前置预判,国内企业跟随适配。TI、英飞凌5月率先发布调价方案,提前锁定7月价格体系,依托长期晶圆锁价资源,最先预判8英寸产能紧缺与成本上行趋势,掌握行业定价主动权;国内模拟企业晶圆采购议价能力偏弱,需等待海外调价落地后同步调价,规避价格错位丢失下游客户,调价往往滞后海外龙头,属于被动跟随式涨价。
从产品溢价能力来看,TI、ADI、英飞凌垄断高端AI服务器、高可靠车规,技术壁垒高、可替代性极低,高端料号涨幅可达20%—25%,盈利弹性极强;国内头部模拟企业,产品集中在家电、工控、中端车载、消费电源等领域,高端算力芯片仍处于终端认证阶段,调价幅度控制在10%—15%,涨幅温和可控。利好在于,海外料号涨价、交期拉长,下游终端主动开启双供应链布局,大批量导入国产替代料号,同规格国产模拟芯片同步涨价后,性价比优势进一步凸显。
值得关注的是,欧美一线模拟大厂深度绑定全球头部云厂商、车企,长协客户调价循序渐进,盈利波动平稳;国内中小模拟企业7月1日直接全额执行新价,短期营收、毛利弹性更高,但直面下游中小工厂成本博弈,终端议价压力大;同时,拥有自有8英寸产线的士兰微、扬杰科技,相较纯设计厂商,代工成本更低、供货稳定性更强,在本轮涨价周期中竞争优势进一步放大。
整体来看,本轮连续涨价打破海外模拟企业长期低价垄断中端市场的格局,抬高下游更换供应商意愿,行业从“价格优先”转向“供货稳定优先”,为国产模拟企业突破认证、提升份额创造周期红利。
2. 股价表现亮眼,国产AI算力芯片进入落地应用爆发期
今年以来,中国市场对 AI 算力的需求并未因海外高端卡受限而降温,反而在应用扩散、模型部署、企业私有化和地方智算建设的多重驱动下持续攀升。与此同时,英伟达算力卡供应的不确定性持续走高,过去被视为“替代方案”的国产AI芯片,正在从政策驱动的备选角色,转向部分客户、部分场景中真正稀缺的主力算力资源。
沐曦万卡集群落地上海临港、摩尔线程夸娥智算万卡集群多城商用、燧原科技云燧系列 GPU 集群进驻成渝智算中心、中国移动呼和浩特国家级液冷智算中心混合部署壁砺与天数智芯…… 一连串落地信号的背后,是国产AI算力芯片行业正式迈过技术验证期,进入规模化落地应用的新阶段。反映到股价上,相关企业的股价也获得了大幅上涨。
智能体时代重构算力消耗逻辑
今年以来,国产AI算力芯片板块股价表现亮眼,多家企业涨幅显著,反映出市场对行业基本面改善的强烈预期。其中,寒武纪从年初的931.88元上涨至1507.46元,区间涨幅61.77%,市值稳居AI芯片板块前列。海光信息涨幅45.19%,从225.91元升至328.00元。沐曦股份上涨27.09%,龙芯中科与摩尔线程涨幅相对温和,也分别达到8.37%和7.96%。
港股标的同样涨幅惊人。天数智芯自1月8日上市以来,股价从156.80港元一路攀升至6 月18日的630.00港元,区间涨幅高达301.79%。壁仞科技同期涨幅也达到85.09%,从33.20港元上涨至61.45港元。

股价上涨的驱动因素,除了美国出口管制升级带来的国产替代预期外,更深层的逻辑在于智能体(Agent)时代的到来,正在改变AI算力的消耗方式。过去,AI 更多以网页问答入口的形式存在,用户提问、模型回答,是“一问一答”的单次交互模式。而进入智能体时代,AI开始深度嵌入企业内部流程,进入办公、研发、客服、销售、投研、设计、数据分析等具体业务场景,变成7×24 小时不间断运行的“数字员工”。
业界人士指出,这种变化带来三个重要的改变:一是推理算力需求全面超越训练。 据行业预测,2026年推理算力占比将突破70%,成为AI算力的主导需求。智能体执行复杂任务时,需要持续调用大模型进行推理、规划、决策,token消耗量呈指数级增长。有机构预测,到2026年三季度,智能体类工作负载的token 消耗量将超过传统对话式AI,成为企业算力消耗的第一大来源。
二是企业私有化部署需求激增。涉及核心财务数据、客户资源、研发资料的业务场景,很多企业均选择自建私有算力,部署垂直大模型与智能体应用。对于数据安全和自主可控有更高要求的政企客户,国产芯片成为首选。
三是算力需求从集中式走向分布式。智能体往往需要多模型协作、多步骤推理,对算力的需求不再是“超大集群集中训练”,而是“海量节点分布式推理”。这种需求结构与国产芯片的供给特点更加匹配。单卡性能虽与海外旗舰有差距,但在海量推理场景下,凭借性价比、供应稳定和本地化服务优势,国产芯片的竞争力正在快速凸显。
需求井喷国产AI芯片业绩高增
从市场应用角度来看,多个国产算力集群正在落地,从千卡示范到万卡商用。例如,华为昇腾在深圳、合肥等地建成多个万卡级智算中心;中科曙光郑州 3 万卡国产算力池正式上线运营,兼容多品牌国产加速卡;中国移动呼和浩特万卡液冷智算中心规模部署壁仞、天数智芯产品等。
市场需求的快速增长,也直接反映在相关企业的财报成绩单上。寒武纪一季度实现营业收入28.85亿元,同比大幅增长 159.56%,创下历史单季新高;归母净利润达10.13亿元,同比增长185.04%。公司产品持续在运营商、金融、互联网等重点行业落地,并已规模应用于大模型算法企业、服务器厂商,辐射云计算、能源等多个领域。
海光信息延续稳健高增态势,一季度营收达40.34亿元,同比增长68.06%;归母净利润8.77 亿元,同比增长22.90%,“CPU+DCU”双轮驱动战略成效显著。摩尔线程一季度实现营收7.38 亿元,同比增长155.35%,更重要的是实现了上市以来的首次单季盈利,归母净利润2936万元,标志着国产通用 GPU 商业化进程迎来关键拐点。
沐曦股份一季度营收5.62 亿元,同比增长75.37%;归母净利润亏损9884万元,同比大幅减亏57.49%,随着曦云C550等新品切入高端训练场景,盈利改善趋势明确。龙芯中科一季度营收 1.35 亿元,同比增长 7.96%,亏损同比收窄 24.66%,在CPU+AI 加速卡全栈自主路线上稳步推进。
未来趋势:生态自主化与商业兑现
展望未来发展,国产AI算力芯片行业将沿着两条主线展开:一是生态建设从兼容CUDA走向自主全栈;二是商业化从研发烧钱转向订单兑现与资本化提速。
软件生态曾是国产芯片最大的短板。长期以来,全球95%以上的AI开发者依赖英伟达CUDA 生态,国产芯片只能通过兼容层实现代码迁移,始终处于跟随者地位。2026 年,这一局面正在发生变化。目前主流国产GPU均推出了成熟的CUDA兼容工具链,开发者无需大规模改写代码即可迁移大模型。与此同时,产业链联合共建统一软件底座的趋势日益明显。芯片厂商、服务器厂商、云厂商、算法企业联合搭建统一编译框架、跨芯片调度中间件,打破单一厂商封闭生态。昇腾、昆仑芯、海光光合组织等生态平台各自聚集了数千家合作伙伴,算子库、开发社区、行业模型套件日趋完善,"有芯片无开发者" 的困境正在成为历史。
更具标志性意义的是,国产AI算力芯片行业正在走出“研发烧钱”的阶段,进入商业化兑现的周期。寒武纪实现连续盈利,经营活动现金流首次季度转正,开始摆脱依靠融资"的状态。摩尔线程成为首家实现季度盈利的国产通用GPU上市公司。沐曦、壁仞、燧原等企业亏损持续收窄,订单规模化落地带来的营收增长,正在逐步覆盖高强度的研发投入。
与此同时,国产芯片企业也在拓展多元化商业模式, 不再只销售硬件加速卡,而是衍生出整机服务器、算力租赁、私有化集群交付、MaaS 模型服务、算力运营等。地方智算中心普遍采用“芯片+机房+运维”打包采购模式,大幅提升了厂商的整体营收规模。从卖芯片到卖算力、从卖产品到卖服务,商业模式的升级正在为行业打开更大的成长空间。
3. 英伟达B200租赁价格大跌超30%
预测市场平台Kalshi的交易员押注,AI芯片大厂英伟达(Nvidia)旗舰级绘图处理器(GPU)B200的算力租赁价格在6月底前难以重返5月底高点。
英伟达股价近期表现疲弱,近一个月下跌约3%,今年来仅上涨14%;相较下,VanEck半导体ETF近一个月上涨15%,今年来大涨84%。
英伟达B200的算力租赁价格也同步下滑。根据即时GPU算力报价平台Ornn资料,B200每小时算力价格于5月30日升至6.11美元,创近三个月新高,但此后一路回落,截至6月21日已降至4.22美元。
Kalshi交易员目前并不看好英伟达AI芯片的算力价格能再超越5月高点。相关预测合约以第2季B200算力价格为标的,若Ornn显示的价格在6月30日前高于特定门槛,合约将判定为成立。
目前多数企业透过云端服务商或新创云端业者租用GPU运算资源。随着AI基础设施需求变化,GPU租赁价格也可能出现波动。
圣塔克拉拉大学(Santa Clara University)财务学教授Seoyoung Kim指出,“许多人不知道未来一年究竟需要多少算力,供应商也不知道该采购多少GPU,而包括英伟达在内的制造商,同样不知道该生产多少GPU。”
但市场仍有正面信号。本月初Google与SpaceX签署算力租赁协议,从2026年10月至2029年6月,每月支付9.2亿美元租用AI运算容量,Google将使用约11万颗英伟达GPU,以及CPU、存储器等相关设备。
RBC资本市场对此看法乐观,认为英伟达在2026下半年及2027年的表现“在同业中处于最佳位置”。 RBC分析师写道:“无论背后具体原因为何,这类GPU租赁协议至少在短期内,有助消除市场对英伟达市占率遭特殊应用芯片(ASIC)侵蚀的疑虑。”
4. 斥资近40亿美元!高通官宣收购AI软件创企Modular

高通公司宣布,将以全股票交易的方式收购人工智能软件初创公司Modular,交易价值近40亿美元(约合人民币270亿元)。此举将使高通获得一款可在芯片上运行人工智能模型的软件,无需为每个处理器编写代码。
收购Modular将使高通与CUDA展开竞争。CUDA是英伟达的软件平台,该平台通过将数百万开发者与这家市值5万亿美元的公司的芯片绑定,巩固了英伟达在人工智能领域的统治地位。
作为交易的一部分,高通预计将向Modular的股东发行至多1920万股普通股。基于高通最新收盘价的计算,此次交易价值39.2亿美元。
随着对生成式人工智能的需求激增,高通一直在寻求在数据中心市场占据更大的份额,并已开始瞄准该市场,计划在年底前推出数据中心处理器和其他人工智能芯片。
Emarketer分析师Jacob Bourne表示:“高通押注于通过拥有能够更高效地从硬件中榨取更多推理能力的软件,从而在数据中心市场占据一席之地。”
Modular的软件主要用于运行或“推理”人工智能模型,随着英伟达寻求抵御那些销售为内部使用而开发的定制芯片的竞争对手,这一市场已成为芯片制造商的最新战场。
这家初创公司将自己定位为人工智能计算的中立软件层,支持来自英伟达、AMD和其他供应商的芯片。
高通CEO安蒙表示:“我们相信,未来属于对开发者友好的横向平台,这些平台可以在各种计算环境中运行,并让客户真正自主选择如何以及在何处部署人工智能。”
预计这笔交易将于今年下半年完成。高通此举旨在进一步拓展人工智能和数据中心市场,以减少对智能手机芯片的依赖,而智能手机芯片目前是其主要收入来源。
近期还有报道称,作为其业务拓展计划的一部分,高通还在洽谈以80亿\~100亿美元收购人工智能芯片初创公司Tenstorrent。
5. 与博通合作,OpenAI发布首款定制AI芯片Jalapeño

OpenAI展示了其与博通合作设计的首款定制人工智能芯片Jalapeño,旨在加速其基础设施的开发。
OpenAI和Anthropic等人工智能实验室正努力获取足够的计算能力来运行最新、最强大的聊天机器人和编程应用程序。一些公司,例如OpenAI,已转向开发内部芯片,以降低成本并打造英伟达图形处理器(GPU)的替代方案,后者通常用于人工智能。
OpenAI的工程师与博通合作设计了这款Jalapeño芯片,用于执行一项推理人工智能任务,即处理数据以回答用户向ChatGPT等聊天机器人提出的查询。
博通公司CEO陈福阳表示,该团队研发的芯片性能与英伟达的Blackwell芯片或谷歌母公司Alphabet设计的张量处理单元(Tensor Processor Unit)不相上下。
OpenAI硬件负责人Richard Ho表示,Jalapeño处理器旨在快速高效地处理驱动众多人工智能应用的大型语言模型(LLM),它将适用于未来所有版本的LLM。
OpenAI表示,公司计划在今年年底前部署Jalapeño处理器,这是其多代芯片开发计划的第一步。
加拿大电子制造商Celestica将负责构建服务器系统,这些系统与芯片一样,将仅供OpenAI使用。
OpenAI表示,其实验室中已测试该芯片样品,这些样品在公司自主研发的GPT-5.3-Codex-Spark人工智能模型下,达到预期的功耗和性能。
OpenAI表示,公司工程师花了大约九个月的时间完成芯片设计,之后将其送往台积电进行生产,部分原因是利用人工智能加速了流程中的特定环节。
此前报道称,OpenAI曾考虑于2023年自主研发芯片。
为了自主研发芯片,Meta Platforms、亚马逊和谷歌等公司都选择了博通和Marvell等公司,这些公司提供特定的设计服务和知识产权,而这些服务和知识产权很难在公司内部复制。
4月报道称,Anthropic正在考虑自主研发人工智能芯片。
然而,陈福阳表示,目前由于人工智能带来的内存需求激增,博通定制芯片的利润率不如其生产的其他芯片(例如网络交换机)那么高。
陈福阳指出,人工智能芯片需要大量高带宽内存(HBM),这对博通定制人工智能芯片产品的利润率构成挑战。他还提到,SK海力士和三星电子为博通供应内存芯片。
6. 美光利润飙升近1400%,AI公司争相采购内存芯片
芯片巨头美光科技公布季度利润飙升近1400%,原因是各公司争相为人工智能(AI)蓬勃发展的核心——数据中心——采购内存芯片,推动这家市值1.3万亿美元的公司股价大幅上涨。
美光表示,截至5月28日的财季,其净利润从去年同期的19亿美元跃升至282亿美元,利润率扩大,比华尔街预期高出约40亿美元。
美光科技亮眼的季度业绩凸显了用于训练和托管领先AI模型的服务器的内存芯片短缺如何推高了相关产品的价格。
该集团表示,其5月份季度营收飙升近350%,达到415亿美元,并预测本财季销售额约500亿美元,远超Visible Alpha调查分析师437亿美元的预期。
这一利好消息推动美光科技股价在纽约盘后交易中上涨14%,市值达到约1.3万亿美元。
由于芯片已成为构建人工智能数据中心的瓶颈,今年内存价格大幅上涨。英伟达和AMD等公司的芯片需要少数几家公司(包括美光)生产的高带宽内存(HBM),才能应对训练和运行领先人工智能模型所需的高负载工作。
在全球供应短缺的情况下,美光能够收取高额溢价,这反映出其调整后的毛利率在5月份的季度中飙升至84.9%,而去年同期仅为39%。美光预计本财季毛利率将进一步上升至86%,比分析师的预测高出约一个百分点。
“英伟达几年前凭借其图形处理器实现了人工智能的突破……如今,内存从未像现在这样成为计算堆栈中如此重要的组成部分,”美光全球运营执行副总裁马尼什·巴蒂亚表示。
美光改变了以往内存供应合同的谈判方式,与一些最大的客户达成16项长期“战略协议”。为了确保供货,这些预付款首次高达数十亿美元。
巴蒂亚解释说,这些款项涵盖人工智能数据中心和消费电子客户,锁定3~5年的合同,并被视为押金,将在未来分期退还。他表示,这使得美光能够更清晰地了解未来的市场需求。
美光与SK海力士、三星共同主导着全球存储芯片市场,并已成为人工智能基础设施投资浪潮的主要受益者之一。四大科技巨头——亚马逊、Meta、微软和谷歌母公司Alphabet——今年预计将在人工智能基础设施上投入总计7250亿美元。
内存短缺对更传统的消费芯片产生了连锁反应,因为领先制造商正将新的生产线重点放在为数据中心生产先进的高带宽内存上。上周,苹果CEO蒂姆·库克警告称,芯片代际短缺将迫使公司提高产品价格。
今年5月,美光科技在弗吉尼亚州举办了一场活动,宣布其位于马纳萨斯的工厂开始生产一些最先进的内存芯片。
7.高通投资者日:宣布从芯片迈向全栈AI平台,非手机业务目标翻倍至400亿美元

北京时间6月25日凌晨,在高通举办的投资者日活动上,高通详细公布了备受关注数据中心战略。同时提出,到2029财年非手机收入目标翻倍至400亿美元。
“今天是个好日子!”高通CEO安蒙在开场词中强调,因为就在5年前,他接任了高通CEO,5年之后的今天举办投资者日,他希望这将开启高通的新篇章。
在数据中心业务的介绍中,高通试图通过实际行动回应外界对于“进入数据中心市场是否过晚”的质疑。
“对高通来说,永远都不算晚!这是一个变化非常迅速的市场。如果你拥有技术领先优势,就总会有发展空间。”安蒙强调。
数据中心业务四步走 2028年推出服务器产品

去年年底,高通宣布完成对于高速SerDes IP厂商Alphawave的收购,Alphawave的CEO Tony Pialis如今已成为高通数据中心业务的负责人,全面介绍了数据中心业务的情况。

Tony Pialis首先强调,智能体AI时代改变了计算的经济性。智能体的出现让Token的数量正在急剧增加,CPU的价值也日益凸显。传统基础设施将无法满足智能体AI的需求,行业需要一场范式变革。

当前,单个智能体在一次查询中会生成50到100次Token调用。而在推理请求中,单次查询就能生成超过一百万个Token。

如何支持智能体时代比今天多100倍的推理Toke调用量?传统的计算基础设施无法支撑如此庞大的规模,行业需要一种新的解决方案,包括:
为部署通用计算所需的每一项功能提供硬件加速的定制化解决方案。多种形态的CPU分别执行特定功能。独特的XPU,有的针对注意力机制进行预置,有的针对解码过程中的KV缓存,所有这些都通过铜互连和光互连协同加速,实现了全球领先的连接性能,构建起一个将彻底变革行业的计算网络。

基于上述背景,Tony Pialis介绍,高通将分四步骤推进数据中心业务(四条产品线):
首先,高通拥有源自Alphawave的连接产品组合,这在业内处于领先地位。过去两年,高通一直在推动该产品投入量产。目前,已成功通过了首家头部大型超大规模云服务商的认证,并将在未来四个季度为公司带来可观的收入。
随后是定制芯片,高通在这一领域正在取得成功,并将在今年,即从2027财年第一季度(2026年下半年)开始的自然年度实现可观的营收。
在2027年,高通将推出第二代AI加速器。它是业界首款近计算型AI加速器,将彻底变革推理计算的范式。

在2028年,高通还将推出业界首款Oryon服务器级计算解决方案。届时,将发布一系列具备智能体功能的通用计算与头节点计算产品,从而全面完善高通的基础设施布局。
HBC突破内存瓶颈 每瓦容量提升200倍
当前,Transformer模型规模在短短两年内增长了240倍,而同期计算内存却仅仅翻了一番。这意味着,除非突破内存瓶颈,否则再多的计算资源也无济于事。
Tony Pialis表示,传统的HBM方案无法跟上AI模型飞速增长的步伐,而高通成功突破了内存瓶颈。

通过对XPU的计算架构进行重新设计,将AI加速器与XPU彻底分离。将XPU直接置于DRAM堆栈之下。既保留了全部性能优势,又兼具HBM堆栈所拥有的高密度与大容量。这意味着以往“内存墙”带来的拥堵问题将不复存在。

这项技术带来的价值包括:更低的功耗、更少的发热,以及不再需要HBM方案所依赖的昂贵硅中介层。借助标准封装,就可以在单个计算设备内部署多个HBC堆栈。同时,也带来了巨大的性价比优势,让产品在单位成本下的性能表现更进一步。

高通的测试显示,HBC的每瓦容量优势比很多厂商使用的传统SRAM方案高两百倍。在高吞吐量负载方面,这类任务长期以来一直由GPU和HBM主导。而采用HBC后,每瓦内存带宽是竞争对手HBM方案的六倍。
“当整个行业还在努力部署两种不同的解决方案来应对这些特定场景时,我们却凭借HBC一举打通了整个工作负载领域,并带来数倍的性能提升。每瓦性能与每美元性能的双重优势,为客户提供了直接TCO的降低。”他说。

微软CEO萨提亚·纳德拉表示,微软将在Azure数据中心中部署HBC。他对高通在数据中心领域的创新,尤其是围绕高带宽计算方面的突破充满期待。
Tony Pialis指出,从经济价值方面,借助部署HBC,高通的目标是一个规模达6800亿美元的可拓展的市场空间。根据具体工作负载的不同,高通能够带来四到八倍的性能优势,这一优势可以直接转化为实际经济效益。

2027年年中,高通将在AI250加速器产品中推出首款采用HBC技术的近存计算芯片。在2028年,在推出AI300中,将采用第二代HBC技术,整合UALink和Ultra Ethernet最新的大规模扩展网络架构,而在横向扩展方面,将同时部署铜缆和光网络来连接AI集群。
宣布重磅收购Modular 欲破CUDA生态壁垒

除了强悍的硬件之外,高通还将部署完整的软件解决方案栈。包含最复杂的编排器,能够管理流量在解耦式计算集群中的路由,并贯穿各个框架,尤其是开放框架,使模型开发者既能开发和部署模型,又能安全地运行模型。高通将提供所有必要的内核和编译器,以便将最新模型优化至专用硬件上。
就在今天投资者日活动召开之前,高通宣布已达成对于全球领先的AI软件解决方案商Modular的收购协议。

Modular的价值在于,能够让AI模型在任何硬件上运行,对于开发者和企业而言,这意味着只需一次开发,即可在任意环境中部署,降低大规模运行AI的成本。
Modular的联合创始人兼总裁蒂姆·戴维斯指出,Modular是NVIDIA软件栈的高效替代方案,从设计之初就为各类AI加速器量身打造,核心竞争力包括:

MAX推理框架提供了所需的模型与推理层,而无需依赖Triton或TRT LLM。同时,Cloud为企业提供了所需的分布式推理基础设施,且不受单一芯片厂商的限制。二者相结合,便构成了面向异构数据中心的完整AI计算平台。
2025年9月,Modular成功让英伟达Blackwell B200与AMD MI355X在统一平台上运行,并使AMD芯片的性能在免代码重构的前提下,比运行原厂软件提升了约50%。
数据中心CPU业界最高主频 250+核心
高通宣布推出专为数据中心打造的处理器系列C1000,配备业界最快的内核,主频超过5GHz,比任何竞品快30%以上。该CPU提供超过250个核心,以运行最高吞吐量的工作负载。每瓦性能提升2倍。借助Alphawave领先的互联技术,I/O带宽可实现超过2TB的每秒传输速率。

Tony Pialis指出,借助高通在内存领域的领先优势,采用最高性能的LPDDR、最低成本的内存解决方案,高通还将在硬件中直接嵌入服务器级RAS安全功能。
C1000系列CPU原生支持AI,支持AI推理引擎的HBC技术,将AI工作负载原生加速到C1000上。

C1000系列包括三条产品演进路线:
首先是Agentic CPU,利用HBC技术,提供业界最佳性能;随后,将它部署在运行虚拟化容器工作负载的通用CPU上;最后是AI头节点CPU。
Tony Pialis强调,C1000系列产品面向的是一个规模达2000亿美元的市场。

Meta创始人兼首席执行官马克·扎克伯格在视频发言中表示,Meta计划将C1000系列部署到下一代数据中心中,并强调这是一项跨多代产品的合作。
ASIC芯片斩获两项超大规模云服务商大单
高通专注于定制化芯片领域,旨在服务最高端的客户群体,通过充分发挥强大的IP组合优势,为客户创造最大价值。

Tony Pialis透露,在该领域,自收购Alphawave六个月后,目前已经成功斩获两项面向大型超规模云服务商的重要订单,这将为高通带来可观的收入贡献。预计2029财年定制芯片可拓展的市场空间为1150亿美元。

“通过与客户紧密合作,根据他们的规格要求,帮助打造芯片,无论是在前端的RTL设计阶段,还是协助他们将设计方案转化为基于芯粒的解决方案,从而提供全球最先进的计算机网络解决方案,并充分利用高通的制造规模与专业技术。优化客户的良率,助力其大规模部署量身定制的解决方案至数据中心。高通的广泛的IP组合,自有计算平台,HBC技术,硅光技术、制造和供应链方面的领先技术,这就是我们在六个月内取得成绩的原因。不是高通找客户,而是客户自己找过来。”Tony Pialis难掩兴奋之情。

全链路互联 2028年第三代方案推出
在解决了内存、软件等方面的瓶颈之后,高通将目标瞄准连接。
超大规模云服务商在部署集群时,随着人工智能算力每两年翻一番,连接能力也每两年提升一倍。与此同时,行业正在经历从铜连接向光互连解决方案的转型,后者具备更低的延迟,并支持横向扩展与纵向扩展的架构。

Tony Pialis表示,高通目前已具备支持从毫米级互连到数十公里长距离连接所需的能力,从业界领先的Die toDie,到将全球最快、功耗最低的互连技术直接置于计算单元旁的共封装光学接口。此外,高通还提供业界领先的PAM4电气与光学高速接口技术,以推动当今网络的纵向扩展与横向扩展——目前已有224 Gbps的产品投入量产,不久后还将推出448 Gbps的产品,未来将实现相干光技术的商用。

目前,高通已经量产了第一代800G产品。今年年底,将推出第二代电光解决方案,带宽翻倍至1.6T,对应224Gbps SerDes技术,这些产品已获得头部超大规模云服务商的订单。预计2028年,高通将推出第三代连接解决方案。该方案将以448Gbps SerDes连接为基础,同时还将部署下一代相干光解决方案。
数据中心业务已实现数十亿美元收入增长
在最后总结中,Tony Pialis表示,当前高通已经打造了一套变革性的基础设施,表现已在业界脱颖而出。目前拥有四条产品线,每一条都已斩获多项客户订单。最近的六个月,高通数据中心产品实现了数十亿美元的收入增长。

此外,各条产品线在价值和各项关键指标上也表现出令人惊叹的成绩:
与传统GPU相比,每瓦每秒算力最高可达八倍;内存技术更是超过传统方案的200倍;每瓦内存带宽提升至六倍;CPU的性能也比竞争对手的同类产品高出两倍。所有这一切都直接带来了显著的总体拥有成本优势。
为何选择此时入局数据中心业务市场?Tony Pialis又呼应了开场的问题。

“因为我们具备行业所需的卓越性能。最后,我想提醒大家:每瓦算力取代了每秒浮点运算次数(FLOPS)。游戏规则已然改变。如今,一场全新的竞赛正在上演——那就是打造以智能体为核心的机架级平台,实现全球最优的总体拥有成本。”Tony Pialis强调。
