GPU2024展望:繁花似锦 暗战无极

来源:爱集微 #GPU# #英伟达# #AMD# #华为海思#
14.1w

错过了GPU,也就错过了第四次工业革命的入场券?

随着生成式AI的爆火,AI芯片GPU俨然成为时下炙手可热的“硬通货”。所谓时势造英雄,英伟达以其GPU+CUDA双剑合璧碾压一众竞争对手,一骑绝尘,英特尔、AMD紧追不舍。同时,一众云厂商纷纷下海自研,同时以英伟达+自研双管齐下探路。而在国际供应链不确定性背景下,国产GPU也迎来了发展的关键窗口期。

而生成式AI开启的GPU盛宴仍将持续上演。据Verified Market Research数据统计,2027年全球GPU市场规模有望达到1853.1亿美元,年平均增速高达32.82%,千亿级赛道风口已至。

如果说芯片是中国硬科技最需要补足的短板,那么GPU就是短板上最长的那根刺。2023年国产GPU千帆竞秀,但英伟达的护城河依旧牢不可破;在2024年到来之际,GPU三强争霸会如何演变,国产GPU厂商能否在架构、工艺和生态层面取得新的战绩,飞龙在天?

缺货涨价和禁令升级“齐飞”

ChatGPT横空出世,大模型风起云涌,在算力激增的背景下,英伟达的GPU100/H100成为“抢手货”。

据媒体猜测,GPT-4至少需要8192张H100芯片,以每小时2美元的价格,在约55天内可以完成预训练,成本约为1.5亿元人民币。而且 ,ChatGPT所需要的AI芯片并不是固定的,而是逐次递增。ChatGPT越聪明,背后的代价是所需算力越来越多。据摩根士丹利预测,到了GPT-5大概需要使用2.5万个GPU,约是GPT-4的三倍之多。

英伟达正在经历一场比“挖矿时代”更疯狂的市场浪潮,一方面英伟达产能受限于台积电、HBM、CoWos封装等产能,H100的“严重缺货问题”至少会持续到2024年底;另一方面,巨大缺口也导致英伟达H100暴涨,有报道称,英伟达的H100 AI加速卡的物料成本约为3000美元,而在年中售价已经达到了3.5万美元左右,甚至在eBay上卖出了超过4w美元的价格。

饶是如此,英伟达订单仍如雪片飞来,让英伟达成为最受关注的卖铲人。据市调机构Omdia统计,2023年第三季度,英伟达售出50万块旗舰产品H100 GPU。按照英伟达官方的说法,2024年第一季度之前的GPU芯片早已全部售罄。业内预估,2024年英伟达的出货量将达到150万-200万块。

凡此种种,也让英伟达在2023年横扫了游戏、挖矿、AI多个风口迎来而立之年之际,总市值突破万亿美元,铸就了新的里程碑。

这边厢英伟达一飞冲天,那边厢英特尔、AMD也紧追不舍,相继祭出Gaudi2和MI300A加速处理器等利器力图分羹,但由于平台、生态等影响,取得实质性突破仍需时日。

尽管英伟达气势如虹,但后院也在频频起火。美国政府为持续打压中国科技进步、遏制中国AI产业发展,在去年10月再次祭出升级 AI 芯片出口管制政策,从性能密度、出口许可、设备许可等多个维度进行打压。因而,英伟达此前专门为应对美国出口限制而推出的A800和H800 GPU芯片、英特尔面向中国市场推出的AI芯片Gaudi 2以及AMD的相关AI芯片都将受到影响,特别是对中国市场占其营收五分之一的英伟达而言冲击不小。

而美国管制政策的进一步收紧也再次告诉我们:要放弃幻想,以自主谋出路,这也将进一步加速我国AI核心环节自主可控进度。

云厂商纷纷下场 双管齐下

随着AI的崛起和大模型的深度商用,GPU逐渐成为新的王者。云厂商作为AI算力需求的主要承载方,一场由GPU主导的变革正在悄然兴起,它不仅重塑着数据中心的内部结构,更是在推进整个云计算界的地壳运动。

这场变革的突出表现在云厂商纷纷下场造芯,结合GPU的短缺、高昂成本、应对云服务更加智能化、自主化、灵活化和可扩展化的需求和广阔前景,微软、Meta、Google、亚马逊、特斯拉以及国内的阿里、百度、腾讯等都在投入更多资源研发AI芯片,甚至OpenAI都开始筹备芯片项目。

从时间节点来看,谷歌TPU v5e于2023年8月发布,成为人工智能硬件领域的强大力量,专为大型语言模型和生成式人工智能量身定制。11月初,微软也采取了类似的思路,首款人工智能芯片Maia 100问世。随后亚马逊宣布推出最新的Trainium2,其性能是其前一代的四倍,能源效率是其两倍。

反观国内,华为、阿里、百度等云巨头在自研AI芯片方面也在倾力押注,逐级迭代。

尽管自研芯片闪亮登场,但在当下,云厂商都“不约而同”采取了某种“双管齐下”的思路:既推出自研芯片,也同时提供英伟达最新AI芯片这样的可选项。

谷歌方面一方面在赞赏英伟达的H100,一方面云服务器上已经用上了自家TPU。微软也表示微软云(Azure)将配备英伟达H200;AWS与英伟达扩大战略合作,将联合推出先进的基础设施、软件及服务,推动客户在生成式AI的创新。

尽管看起来此举会蚕食英伟达的领地,如谷歌投资的Anthropic宣布大规模部署TPUv5e,处理其大模型Claude的推理工作;初创公司Databricks和OpenAI竞争对手Anthropic计划使用新的亚马逊的Trainium2芯片构建模型,但其实两者并不违和。

某知名分析师对集微网表示,云巨头自研芯片虽然有优势,但可能大都只能是“备胎”,因为一直以来推动AI发展方向、都能配合的只有英伟达。尽管这些云巨头财大气粗,但开发的专用芯片侧重于特定场景,双方面向的市场并不冲突。

国产厂商破解挑战 走向好用

在这一场新的军备赛中,尤其是在美国的围追堵截之下,国产GPU厂商不能更不应缺席这场“盛宴”。在当前地缘政治、大国博弈的背景下,相较于有一定积累的国产CPU,GPU的破局更具紧迫性和必要性。毕竟,国产GPU不仅孕育着千亿量级的市场空间,还承担着国产替代和打破巨头垄断的重任。

随着国内GPU赛道上一个又一个有力的选手交出真刀真枪的产品,国产GPU正迅速走过进入“从可用到好用”的迭代阶段。华为海思、燧原科技、壁仞、天数智芯、沐曦、珠海芯动力、摩尔线程、海光等厂商在GPU产品、集群、生态和应用层面全面发力,表现可圈可点。

深存科技创始人&CEO袁静丰总结,2023年国产GPU厂商面对国内市场,在更加务实地在做产品、建生态、推应用,在这些层面各家都有一定的优势,而准确定位是关键。

总体来看,国产GPU厂商在持续自主开发好用易用的通用GPU,不断升级算力解决方案,以适配支持更高效、更复杂算法的大模型。在生态层面,先期兼容现有生态发展壮大,后续将拥抱开源或发展自有生态为目标;为拓展应用,也在由小及大、小步快跑,为我国大模型创新发展和应用落地提供更加坚实的算力支撑。

国内某厂商代表尹然(化名)指出,国产GPU厂商可从几十上百个卡集群的推理任务入手,相比性能层面与国外产品基本持平,然后在此基础上再逐步拓展,扩展到上千或上万个卡集群,以时间换空间。

国产GPU的“后劲”也在持续发酵。去年9月28日,燧原科技宣布完成D轮融资,总额为20 亿元,超过15家机构参与,成为AI芯片领域最大规模的融资事件之一。

此外,GPU厂商也在向一体化平台商转型试水。前不久,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式举办,宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地。

展望2024年,无论是禁运以及供应缺口等问题,国产GPU的机遇依旧“在线”。袁静丰认为,机会仍大于困难,这也是国产替代的良机,特别是面向未来的大模型等应用。国产化需要时间,但是行则将至。

2024群雄逐鹿 引发新变局

将时针指向2024年,新的擂台赛也将紧锣密鼓开展,或将引发新的变局。

英伟达计划在2024年推出大量新的加速器、GPU 架构和网络套件,英特尔最新的AI芯片Gaudi 3也将正式上市,也将在新品性能和生态层面持续发力,AMD的MI300也将在生态层面加码,搅入战局。

不止如此,大量半导体初创公司如 Ampere、Graphcore、Cerebras、SambaNova、Groq 等,希望在AI新世界秩序中开辟一席之地,2024年将更是“天下风云出我辈”的一年。

Dell'Oro研究报告就预计,2024年GPU产值将同比增长70%。尽管英伟达目前在该市场占据主导地位,但AMD和英特尔的新竞争产品以及超大规模云服务提供商定制化AI加速器的出新,带来了潜在的挑战。

此外,英特尔虽然GPU性能强悍,但CUDA的闭源特性也蕴含隐忧。英特尔CEO Pat Gelsinger曾公开抨击了英伟达的CUDA生态,称其是一种“封闭和专有的”平台,限制了AI的发展和创新。他表示,英特尔致力于打造一个开放和兼容的AI生态系统,支持各种硬件和软件的协同工作,为开发者和用户提供更多的选择和灵活性。

AMD也不断“补短”,发布了全新升级的ROCm 6.0,目前已经开放源代码下载,尽管相比CUDA仍有差距,但在一定程度上仍会对英伟达形成较大的竞争压力。

国产GPU作为新的一极,仍面临微架构、先进工艺、生态等挑战。

“挑战最大的是先进工艺,如何利用落后一两代的工艺实现有竞争力的产品将是全行业的挑战,因而发展合适的产品和定位就尤为重要。当下不能光靠工艺发展的角度突破,而是关注架构创新和生态建设。”袁静丰进一步分析,“架构创新也非常重要,我们不能着眼于传统的架构,而是如何利用新的架构和思路去发展,才有机会;着眼基础设施和底层技术的开发,资本和市场需要给国产GPU和大芯片一些时间。在生态层面,生态建设是个长期的过程,需要瞄准独立的生态才能有长足的发展,但是过渡期兼容性问题需要仔细考虑。”

还要看到的是,面对美国“全方位无死角”的升级禁令,国内AI芯片企业唯有迎难而上,众志成城,全面打造一个不受美国制约的、健全完整的供应链才是自由之路。

对于市场的破局,尹然乐观表示,随着时间的推移,国产GPU性能不断攀升、应用全面开花,有望在5~10年实现追赶。

责编: 张轶群
来源:爱集微 #GPU# #英伟达# #AMD# #华为海思#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...