涨薪谈判失败!芯片大厂面临罢工!英伟达最新AI芯片:每颗3万~4万美元

来源:爱集微 #英伟达# #三星# #关键词:集微峰会#
3w

1.报名开启!2024集微半导体峰会官网正式上线

2.涨薪谈判失败,三星电子面临罢工风险

3.台积电、新思科技将英伟达计算光刻平台投入生产 加快芯片制造

4.中西学者共同警告:需对人工智能安全采取联合措施 以避免灾难

5.英伟达GTC大会:“黑科技”扎推、B200巩固AI芯片“王座”

6.英伟达B200售价曝光:每颗3万~4万美元,研发费用100亿美元

7.Meta预计英伟达最新Blackwell架构AI芯片2025年交付


1.报名开启!2024集微半导体峰会官网正式上线

 又逐春风到“鹭岛”,2024第八届集微半导体峰会正式定档,拟于6月28日-29日在厦门国际会议中心酒店举办。

自2017年首次举办以来,集微半导体峰会已连续举办7届,规模逐年扩大、影响日益增大,被誉为产业发展的“风向标”。2023集微半导体峰会超五千人的参会总规模更是打破纪录,现场人山人海、摩肩接踵,主题分享、圆桌讨论等环节将盛会直接推向高潮!

3月19日,2024第八届集微半导体峰会网站正式上线,报名通道同步开启,诚邀您出席本次盛会,共话中国半导体“芯”机遇。

2024集微峰会报名入口

过去的一年,注定要在半导体产业坐标轴上留下印记:OpenAI的一记漂亮起笔,推开人工智能发展大潮;国内外大环境跌宕起伏,倒闭收购合并风起云涌;传统智能手机退场,AI硬件层出不穷……繁荣与谢幕、传统与革新,半导体人亟待一场面对面的交流盛宴。

本届峰会紧扣时代发展脉搏,拥抱创新性可持续发展趋势,聚焦新质生产力,围绕商业本质,盛邀院士专家、半导体龙头企业负责人、全球投资机构创始合伙人、微电子学院院长等数百名重磅嘉宾出席,针对人工智能、汽车电子、半导体制造、新材料等领域开展高峰对话,为产业各界打开一扇观察半导体产业发展趋势和技术创新活力之窗。

· 参会嘉宾阵容强大,集结全球顶尖智慧。他们是战略决策人,是行业领军者,是创新先锋队,是智慧分享者……其中包含董事长/CEO、院士/专家、投资机构合伙人、地方政府及园区嘉宾、高校微电子学院院长及企业代表等,预计参会者将超6000人。

· 提质升级新阶段,“行业嘉年华”来袭。本届峰会设置“1+50+1”架构,即1个主论坛、50场专题论坛、1个半导体展,突出国际化、专业化、特色化,紧密衔接国家产业政策,重点拓宽国际视野,彰显半导体产业元素。作为半导体行业一年一度的“行业嘉年华”,峰会50场专题论坛涉及半导体产业链多个细分领域,如“EDA”“通用芯片”“半导体制造”“投融资”等;内容形式丰富多彩,如“上市公司董事长面对面”“人力资源大会”“分析师大会”“芯力量路演”“政策峰会”“集微之夜”等,全方位满足各界人士参会需求。

· 吹响校友主题“集结号”,志存高远要合作。作为产业、资本、政府之外的“第四极”,高校力量是集微半导体峰会的重要组成部分。集微峰会校友论坛自2019年设立至今,阵容不断升级。据悉,本届峰会拟举办“清华、北大、中国科大、上海交大、浙大、复旦、成电、西电、华中科大、厦大”等超过30场校友论坛。

· 凸显全产业链生态,打造行业年度大展。除主题鲜明的论坛会议,集微半导体峰会展览功能也屡受到业内人士和产业媒体的关注——集微半导体展为期两天,与峰会在6月28日—29日同步举行,秉持“朋友圈”扩容、“产业链”拓展的办会初衷,汇聚新技术、新产品、新趋势,现场开设EDA专区、芯力量专区、半导体制造专区、高科技园区等,超百个展位覆盖芯片设计、设备材料、封装测试、射频前端等全产业链各细分领域,真正做到“办好一个展、凸出一条链、提升一座城”。

集微半导体展既是全产业链的年度大展,也可以视作‘生态丛林’的一次近距离观察。参展企业汇聚产业链上下游企业、独角兽企业、行业头部企业、初创企业以及各地园区与相关机构,展现集成电路产业发展成果、国内外领先产品和技术发展等,搭建半导体企业成果与合作交流的全新平台。

· 专业报告重磅发布,勾勒产业图谱与脉络。截至目前,爱集微已发布 100+ 集微咨询行业报告,内容涵盖政策解读、产业发展、知识产权、人才供需等多领域,助力半导体企业洞察趋势、把握先机。本届峰会将继续向与会者提供行业报告,为政府部门、投资机构、相关业者以及社会公众更好地了解产业发展情况提供参考。

峰会报名信息

山的那边、海的岸头,以高举产业的信念铸成的强有力的“芯力量”,是每一届集微半导体峰会的孜孜追求。当夏日来临,我们跨山越海相聚厦门,在产业的道路上相邀共进。第八届集微半导体峰会相关资讯将持续发布,诚邀集成电路行业人士及社会各界嘉宾拨冗参会!

会务咨询:陈先生 18515273680  微信:ch253607325


2.涨薪谈判失败,三星电子面临罢工风险

三星电子今年再次未能解决薪资谈判,预示着另一轮工会带来的罢工风险。由于三星是存储龙头厂,三星如果发生罢工,对目前存储供需市场是否造成影响,成为市场关注焦点。

三星电子最大的工会——“三星电子全国工会”于3月18日宣布成立劳资纠纷委员会,将从当天开始进行劳资斗争。

3月14日,韩国国家劳动关系委员会召开第三次调解会议,工会依法获得了罢工权利,并作出中止调解的决定。但工会应资方要求搁置了争议,并于3月14日上午与资方进行了新一轮谈判,但最终谈判破裂。

三星电子劳资双方于2023年9月举行破冰会议,直至2024年2月为止五个月内举行10次工资谈判,双方分歧甚远。三星电子管理层将基本工资涨幅从2.5%提高到3%,加上绩效奖金2.1%的增幅,整体薪资增长5.1%。然而,工会要求加薪整体幅度为6.5%,并要求增加固定加班费和假期等福利条件。

双方对于扩大公司福利体系的看法也存在很大分歧。谈判会后,工会表示,“在上次与管理层的谈话中,我们拒绝接受基于绩效的奖金制度改变以及让员工休息的休假计划,因此我们将陷入争议局面。”

工会将于即日起至4月5日就是否采取罢工行动进行投票。如果多数会员投票赞成,工会即可合法举行罢工。该工会还计划组织一次全国性的巡回宣传活动,以向管理层施压。

三星电子自1969年成立以来,已经有55年没有发生过罢工。工会获得了2022年和2023年的罢工权,但并没有采取行动。

与此同时,自三星电子会长李在镕于2020年宣布公司将结束长期无工会的管理以来,三星电子的工会活动有所增加。这家韩国电子巨头拥有五个工会,其中最大的工会是“三星电子全国工会”,拥有20000名会员,占员工总数124000人的16%。此外,另外四个工会由龟尾工厂的白领和员工以及设备体验部门的员工组成。

业界人士分析,三星电子全国工会会员人数占三星全体员工比重不高,即使工会投下赞成票罢工,对三星电子产能产生立即性影响应该有限。

厂商认为,三星DRAM厂2024年会注重于高带宽存储(HBM)以及DDR5生产,在产能上的调整,有可能会造成后续的缺货,但还需要观察供需的状况。


3.台积电、新思科技将英伟达计算光刻平台投入生产 加快芯片制造

英伟达3月18日宣布,台积电、新思科技已将英伟达的计算光刻平台投入生产,以加速下一代先进半导体芯片的制造,并突破物理极限。台积电、新思科技已将英伟达cuLitho技术与其软件、制造工业和系统集成,以加快芯片制造速度,并帮助制造最新一代英伟达Blackwell架构GPU。

英伟达CEO黄仁勋表示:“计算光刻技术是芯片制造的基石,我们与台积电和新思科技合作开发的cuLitho技术,应用了计算加速和生成式人工智能(AI),从而开辟半导体制造的新领域。”英伟达同时宣布推出新的生成式AI算法,增强cuLitho。与当前基于CPU计算的方法相比,可显著改进半导体制造工艺。

据英伟达介绍,计算光刻是半导体制造过程中计算最密集的工作负载,每年消耗数百亿小时CPU运行时间。其中芯片生产关键步骤中的典型掩模,可能需要耗费3000万或者更多小时CPU计算时间,这就需要在半导体代工厂内建设大型数据中心。

通过英伟达加速计算技术,350套H100组成的系统现在已经可取代40000颗CPU构成的计算集群,这样可以加快生产时间,同时降低成本、空间和功耗。

台积电CEO魏哲家表示,“我们与英伟达合作,将GPU加速计算整合到台积电的工作流程中,实现了性能的飞跃、吞吐量大幅提升、制造周期的缩短以及功耗的降低。”

新思科技作为EDA软件厂商,在英伟达cuLitho软件库上运行的Proteus光学邻近校正软件大大加快了计算工作量。借助Proteus光掩模合成软件功能,台积电等制造商可以在邻近校正、建立校正模型以及分析已校正和未校正集成电路布局图案的邻近效应方面实现卓越的精度、效率和速度,从而彻底改变芯片制造工艺。

据了解,英伟达开发了生成式人工智能算法,以进一步提升cuLitho平台的价值。新的生成式AI智能工作流程,可将某些工艺速度提高2倍。通过生成式AI技术,可以创建近乎于完美的反向掩模或者反向解决方案,以考虑到光衍射的影响。然后,用传统的物理方法制造最终的成品掩模,从而将整个光学邻近校正(OPC)过程加快2倍。


4.中西学者共同警告:需对人工智能安全采取联合措施 以避免灾难

西方和中国领先的人工智能(AI)科学家发出严正警告,要应对人工智能这一强大技术的风险,需要全球合作。

国际知名专家近日在北京举行会议,确定了人工智能发展的“红线”,包括制造生物武器和发动网络攻击。

在一份声明中,这些学者警告说,需要对人工智能安全采取联合措施,以阻止“在我们有生之年给人类带来灾难性甚至是生存性的风险”。人类需要进行协调,以避免前所未有的技术可能带来的灾难。

签名者包括Geoffrey Hinton和Yoshua Bengio,他们因在神经网络方面的研究而获得图灵奖,常被称为人工智能的教父;加州大学伯克利分校计算机科学教授Stuart Russell;以及中国最杰出的计算机科学家之一姚期智。

该声明是在近日于北京举行的人工智能安全国际对话之后发表的,中国相关机构官员也出席了此次会议。

学术界要求科技公司和相关部门在人工智能安全问题上开展合作,特别是通过将世界上的两个科技超级大国中国和美国聚集在一起。

最近几个月,全球领先的人工智能公司与中国的人工智能专家进行了会谈。

2023年11月,在英国的人工智能安全峰会上,包括中国在内的28个国家/地区和领先的人工智能公司达成广泛承诺,将共同努力应对先进人工智能带来的生存风险。

近日,专家们讨论了与通用人工智能(AGI,即等同于或优于人类的人工智能系统)的发展有关的威胁。

Bengio说:讨论的核心重点是任何强大的人工智能系统都不应跨越的红线,以及世界各国政府在开发和部署人工智能时应规定的红线。

这些红线与日益自主的系统有关,声明指出,任何人工智能系统都不应在未经人类明确批准和协助的情况下复制或改进自身,或采取不适当的行动增强自身的力量和影响力。

科学家们补充说,任何系统都不应大幅提高行为者设计大规模毁灭性武器、违反生物或化学武器公约的能力,或自主实施网络攻击,造成严重的经济损失或同等伤害。


5.英伟达GTC大会:“黑科技”扎推、B200巩固AI芯片“王座”

  备受瞩目的英伟达GTC 2024大会于3月19日如期举行。本次大会是近五年来首次恢复线下,现场聚集了超11,000名与会者,在线观众数以万计,是迄今为止最大规模的GTC大会。

会上,英伟达创始人兼CEO黄仁勋发表主题演讲《见证AI的变革时刻》。在两个小时的演讲中,他发布了NVIDIA Blackwell、NIM微服务、Omniverse Cloud API和Isaac Robotics平台等多项产品及服务,在这场被称为AI界“春晚”的活动上掀起一阵阵热潮。

其中最为关键的B200芯片拥有2080亿个晶体管,采用台积电定制的4NP工艺制造,Die之间的通信速度可以达到10TB/秒。在此基础上,一个GB200加速卡结合了两个B200 GPU和一个独立的Grace CPU,将能够使大模型推理工作负载的性能提升30倍,而且在成本、能源消耗、效率和训练速度等方面的表现均数倍优于上一代H100芯片。

加速计算达到“临界点”

长期以来,黄仁勋多次向产业界强调,摩尔定律已死,计算范式正发生改变,由CPU主导的通用计算转向GPU的加速计算,GPU在行业场景下有大量替代CPU的机会,而生成式AI更大大加速了这一进程,并有望彻底改变它所触及的每一个行业。

在GTC 2024大会上,黄仁勋首先用一张手绘图回顾了计算机产业的发展史,以及英伟达的发家史。他说,从1964年IBM推出世界首个通用计算机开始,伴随着Windows 95、加速计算乃至深度学习模型AlexNet的出现,再到2016年其亲手将第一台DGX-1超级计算机送给了OpenAI。在2022年,随着聊天机器人ChatGPT横空出世,生成式AI带来了全新一轮产业革命。

接着,黄仁勋强调了加速计算对于推动各行各业的数字化转型的重要作用,特别是在气候科技、工业仿真、生命科学和机器人领域。同时,他还讨论了生成型AI在半导体制造中的重要性,以及为满足大型语言模型的计算需求而需要更大的GPU的必要性。

“加速计算已到达临界点,通用计算已失去动力。我们需要一种全新的计算方式——由此我们才可以继续扩展,继续降低计算成本,并在保证可持续性的同时继续进行越来越多的计算。与通用计算相比,加速计算使每个行业都可以大幅提速。”

黄仁勋认为,多模态AI的崛起能够处理由不同模型负责的多样化数据类型,并赋予了AI更大的适应性和能力。通过增加参数,这些模型可以处理更复杂的分析任务。但这也意味着对计算能力的需求显著上升。随着这些协作、多模态系统变得更加复杂(参数多达万亿),对先进计算基础设施的需求也随之增加。

“我们需要更大的模型,”黄仁勋表示,“我们将使用多模态数据来训练它,而不仅仅是互联网上的文本。我们将使用文本和图像、图形和图表来训练它,就像我们从电视中学习一样,它也需要从海量视频中学习。”

全新AI芯片隆重登场

众所周知,英伟达目前按照平均两年一次的更新频率升级GPU架构,对产品性能进行大幅提升。在GTC 2024大会上,黄仁勋也带来了本次主题演讲的重头戏,即最新一代AI芯片Blackwell GPU。

他说,“Hopper很棒,但我们需要更大的GPU”,并在现场展示了英伟达的首款Blackwell芯片。这款芯片被命名为B200,是一款为生成性人工智能而设计的新一代GPU平台它拥有2080亿个晶体管,可以处理数万亿个参数的模型,计划于今年晚些时候上市。

英伟达B200 GPU

据介绍,新架构以一位加州大学伯克利分校的数学家David Harold Blackwell而命名。他专门研究博弈论和统计学,也是第一位入选美国国家科学院的黑人学者。新架构超越了两年前推出的NVIDIA Hopper架构,不仅加速性能全面提升,而且更擅长处理AI相关任务。

Blackwell采用台积电定制的4NP工艺制造,在单芯片训练方面的FP8性能是其上一代架构的2.5倍,在推理方面的FP4性能是其上一代架构的5倍。它具有第五代NVLink互连,速度是Hopper的两倍,Die之间的通信速度可以达到10TB/秒,并且可扩展至576个GPU。

在此基础上,一个GB200加速卡结合了两个B200 GPU和一个独立的Grace CPU,通过900GB/s超低功耗的NVLink芯片间互连,将能够使大模型推理工作负载的性能提升30倍,同时提高效率。相比于H100,它可以“将成本和能源消耗降至1/25”。而在参数为1750亿的GPT-3 LLM基准测试中,GB200的性能达到了H100的7倍,而训练速度则达到了H100的4倍。

在演讲中,黄仁勋举起一块带有系统的电路板说,“这台计算机是同类计算机中的第一台,能够在这么小的空间容纳如此多的计算量。由于它的内存是连贯的,感觉就像一个幸福的大家庭一起开发一个应用程序。”

为了获得最高的AI性能,基于GB200的系统可以与同期发布的NVIDIA Quantum-X800 InfiniBand和Spectrum-X800以太网平台连接,这些平台可提供速度高达800Gb/s的高级网络。

“这样我们可以大量地节省能源、网络带宽量和时间。”黄仁勋表示,“未来将是可生成的,这就是为什么这是一个全新的行业。我们的计算方式有本质差异,所以英伟达为生成式AI时代打造了一款全新处理器。”

为了扩大Blackwell的规模,英伟达构建了一款名为NVLink Switch的新芯片。每个芯片可以以每秒1.8 TB的速度连接四个NVLink,并通过减少网络内流量来消除流量拥塞。

英伟达Switch和GB200是黄仁勋所称的“一个巨型GPU”,也是英伟达GB200 NVL72的关键组件,包含600,000个零件。英伟达GB200 NVL72是一种多节点、液冷、机架级系统,利用Blackwell为万亿参数模型提供强力计算,在单个机架中可实现720 petaflops的AI训练性能和1.4 exaflops的AI推理性能。

黄仁勋在介绍此台机器时说道:“此时此刻,地球上也许只有三台百亿亿次浮点运算(exaflop)机器。而这是一个单一机架中的1个百亿亿次浮点运算AI系统。”

此外,英伟达还推出了更强大的新一代AI超级计算机——由GB200 Grace Blackwell超级芯片提供支持的NVIDIA DGX SuperPOD,可用于处理万亿参数模型,并具有持续的正常运行时间,以实现超大规模生成式AI训练和推理工作负载。

全新DGX SuperPOD采用新型高效液冷机架规模架构,可在FP4精度下提供11.5 exaflops的AI超级计算能力和240 TB的快速内存,并可通过额外的机架进行扩展。

“未来,数据中心将成为AI工厂”,黄仁勋说,“AI工厂的使命是创造收入,同时也创造智能。”不过,英伟达并没有公布关于B200和其相关产品的价格。

目前,英伟达Blackwell芯片正在被全球各大云服务提供商、领先的AI公司、系统和服务器供应商,以及世界各地的区域云服务提供商和电信公司所采用。“整个行业都在为Blackwell做准备”,黄仁勋表示。

开创软件服务新方式

随着人工智能技术加速在各领域的渗透和变革,生成式AI正在改变应用程序的编写方式。黄仁勋表示,未来的公司会将精力放在组装AI模型,赋予它们任务,给出工作产品示例,审查计划和中间结果,而不是编写软件。

为此,英伟达推出了推理微服务,即NVIDIA NIM。据黄仁勋介绍,这是一种全新的软件打包和交付方式,能够将开发者与数亿个GPU连接起来,以部署各种定制AI。其是根据英伟达的加速计算库和生成式AI模型构建。

英伟达NeMo Retriever与微服务的结合

“未来我们如何构建软件?你不太可能从头开始编写,也不太可能写一大堆Python代码或类似的东西,”黄仁勋说,“很可能你只需要组建一支AI团队就够了。”

这些微服务支持行业标准API、易于连接,可在英伟达庞大的CUDA安装基础上工作,针对新GPU进行重新优化,并不断扫描安全漏洞和威胁。

黄仁勋表示,客户可以使用现成的NIM微服务,或者英伟达可以为之构建专属的AI和AI助手,为特定公司所需的模型专业技能提供专门训练,以助力您创建宝贵的新服务。

“企业IT行业正坐在一座‘金矿’上,”黄仁勋说道,“他们拥有多年来创建的所有这些令人惊叹的工具(和数据)。如果他们能把这个‘金矿’变成AI助手,就能给用户提供更多可能。”

此外,为了推进AI技术对各行业的加速变革,英伟达还推出了多项相关服务。

其中,在电信领域,黄仁勋宣布推出NVIDIA 6G研究云,这是一个由AI和Omniverse支持的生成平台,旨在推动下一个通信时代的发展。它采用英伟达的Sionna神经无线电框架、Aerial CUDA加速无线电接入网络和Aerial Omniverse Digital Twin for 6G构建。

在半导体设计和制造领域,黄仁勋宣布,英伟达正在与TSMC和Synopsys合作,将其突破性的计算光刻平台cuLitho投入生产。该平台将把半导体制造中计算最密集的工作负载加速40-60倍。

同时,黄仁勋还宣布了NVIDIA地球气候数字孪生。该云平台现已推出,可实现交互式高分辨率模拟,以加速气候和天气预报。

黄仁勋表示,AI的最大影响将体现在医疗领域,英伟达已经涉足成像系统、基因测序仪器,并与领先的手术机器人公司合作。英伟达正在推出一种新型生物学软件。

总体上,英伟达在GTC 2024大会上发布了二十多个新的微服务,使全球医疗企业能够在任何地方、任何云上利用生成式AI的最新进展。这些微服务可提供先进的成像、自然语言和语音识别,以及数字生物学生成、预测和模拟功能。

英伟达希望通过这些服务来吸引购买英伟达服务器的客户来注册英伟达企业版NVIDIA AI Enterprise 5.0,对每个GPU每年收取4500美元的费用。企业可以自己选择基础设施来部署这些微服务,同时已有超过400个英伟达认证系统支持NVIDIA微服务。

机器智能将迎“GPT时刻”

除了硬件和软件,黄仁勋还在演讲中花了大篇幅来介绍英伟达的仿真平台Omniverse和适用于自主移动机器人的Isaac Robotics平台。

黄仁勋表示:“我们需要一个模拟引擎,来以数字方式为机器人呈现世界,这样机器人就有了一个学习如何成为机器人的‘健身房’,我们称这个虚拟世界为Omniverse。”

因此,英伟达宣布将以API形式提供NVIDIA Omniverse Cloud,从而将全球领先的工业数字孪生应用和工作流创建平台的覆盖范围扩展到整个软件制造商生态系统。

借助五个全新Omniverse Cloud应用编程接口(API),开发者能够轻松地将Omniverse 的核心技术直接集成到现有的数字孪生设计与自动化软件应用中,或是集成到用于测试和验证机器人或自动驾驶汽车等自主机器的仿真工作流中。

为了展示其工作原理,黄仁勋分享了一个机器人仓库的演示——使用多摄像头感知和追踪,看顾工人并协调机器人叉车,在整个机器人堆栈运行的情况下,这些叉车能够实现自动驾驶。他还宣布,英伟达将把Omniverse引入Apple Vision Pro中,通过新的Omniverse Cloud API,开发者可以将交互式工业数字孪生流式传输到VR头显中。

关于机器人领域,黄仁勋在现场宣布,英伟达推出名为Project GROOT Foundation的AI模型,旨在创建性能更好的人形机器人。此外,还发布了一款专用于机器人的名为Thor的系统芯片。

黄仁勋表示:“机器人领域出现ChatGPT时刻的可能性近在咫尺,我们已经花了一段时间来构建端到端的机器人系统。”所有会动的东西都可能成为机器人,汽车行业将是其中的一个重要部分,英伟达的计算平台已经应用在乘用车、卡车、配送机器人和自动驾驶出租车中。

黄仁勋宣布,世界上最大的自动驾驶汽车公司比亚迪已选择英伟达的下一代计算平台用于其自动驾驶汽车,在DRIVE Thor上构建其下一代电动汽车车队。

为了帮助机器人更好地感知所处环境,黄仁勋还发布了Isaac Perceptor软件开发工具包,该工具包具有最先进的多摄像头视觉里程计、3D重建和占用地图,以及深度感知功能;为了使机械臂更具适应性,英伟达宣布推出Isaac Manipulator——一个先进的机械臂感知、路径规划和运动学控制库。

此外,黄仁勋宣布了Project GR00T,这是一个为人形机器人设计的通用基础模型,旨在进一步推动英伟达在机器人技术和具身智能方面的突破性工作。

为了支持这一努力,黄仁勋推出了一款用于人形机器人的新型计算机Jetson Thor,它基于NVIDIA Thor系统级芯片,并对NVIDIA Isaac机器人平台进行了重大升级。

最后,黄仁勋展示了来自迪士尼研究院的一对由NVIDIA驱动的小型机器人。他表示:“计算机图形学、物理学和AI是英伟达的灵魂所在,生成式AI时代一切改变都有可能发生。”


6.英伟达B200售价曝光:每颗3万~4万美元,研发费用100亿美元

英伟达全新一代Blackwell架构人工智能(AI)GPU已发布,首款产品为B200。英伟达CEO黄仁勋在海外媒体节目中透露,Blackwell新产品每颗成本在30000~40000美元之间,其研发费用大约花费了100亿美元。

这一定价,可能使得B200在人工智能领域受到欢迎,因为其前身H100的定价约在25000~40000美元之间,而新产品的性能远超前代。

黄仁勋透露,新产品的成本不仅与芯片本身有关,还代表了藉此设计数据中心和集成适配到其他公司数据中心的成本。

B200的体积比英伟达上一代AI芯片Hopper大了一倍,集成有2080亿个晶体管,配备192GB HBM3E高带宽存储,执行部分计算的性能是H100的30倍。该公司预计新产品将于2024年晚些时候出货,但要等到2025年才会大批量供应。


7.Meta预计英伟达最新Blackwell架构AI芯片2025年交付

英伟达于3月18日在GTC 2024年大会发布全新Blackwell架构人工智能(AI)芯片B200 GPU,其采用台积电N4P制程工艺,性能相比上一代成倍提升。Meta公司3月19日透露,该公司预计今年不会收到英伟达最新旗舰人工智能芯片,至少要等到2025年。

英伟达表示,B200在执行如聊天机器人等AI服务时,任务处理速度最高可提高30倍,由B200组成的服务器集群相比上一代在算力方面也有显著提升,可成倍提高大语言模型训练速度。

英伟达首席财务官Colette Kress3月19日对金融分析师表示,“我们认为新产品将于今年晚些时候上市。”同时预计新的GPU出货要等到2025年才会放量。

社交媒体巨头Meta(Facebook)是英伟达的最大客户之一,该公司持续大量采购英伟达AI芯片,购买数量已达数十万块,用于训练生成式人工智能,以及用于增强内容推荐系统。

Meta CEO马克·扎克伯格(Mark Zuckerberg)于1月透露,该公司计划在今年年底前储备约35万个H100芯片。他补充道,与其它型号GPU结合使用时,届时Meta将拥有相当于60万个H100的总算力。

在英伟达发布全新B200芯片后,Meta公司随后表示计划使用Blackwell芯片来训练该公司的LIama大模型。目前Meta正在两个GPU集群上训练第三代LIama模型,据了解每个集群约包含24000个H100GPU。Meta公司发言人表示,计划继续使用这些集群训练LIama 3,并将使用新一代Blackwell来训练未来几代大模型。


责编: 爱集微
来源:爱集微 #英伟达# #三星# #关键词:集微峰会#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...