作为算力的坚实底座,数据中心负责数据信息的交换、计算和存储。无论是我们的日常生活,还是千行百业的运转发展,都离不开数据中心。
数据中心是什么
数据中心即互联网数据中心(Internet Data Center),是算力的载体。
我们可以将数据中心理解为一个超大规模的机房,存放了大量服务器、存储设备、网络设备,以及其他相关物理基础设施。
各设备和模块之间协同工作,提供强大的计算能力、存储能力和网络连接能力。
数据中心里有什么
数据中心的三大基础结构分别是计算、存储和网络。
2.1 计算
采用高性能CPU、显卡(GPU)、大容量内存和高速存储的服务器是数据中心的计算主力军,拥有强大算力,满足各类高性能应用的需求。
CPU负责逻辑判断、数据运算和控制调度等任务,CPU的计算能力决定了服务器的整体性能。
GPU是专门设计用于高效并行处理大量数据的处理器。在大规模并行计算场景下,GPU能极大地提升计算效率,适用于图形渲染、深度学习、科学计算等领域。
据国外研究机构统计,2023年全球数据中心GPU总出货量达到了385万颗,相比2022年的267万颗增长了44.2%。
除此之外,还有FPGA和ASIC,是根据特定应用需求进行半定制或全定制设计的AI芯片,专业性更强、算力更高、功耗更低。
2.2 存储
数据中心的存储设备包括硬盘、磁盘阵列、分布式存储系统,以及NAS、SAN等外挂式网络存储。
数据中心的存力决定了数据的实际存储量和可用性,对于数据长期保存的完整性和安全性至关重要。
2.3 网络
数据中心的网络设备包括交换机、路由器、防火墙等,是数据中心内部与外部互联互通的基础设施,确保数据能在计算节点、存储设备以及外部用户之间高效安全地传输。
当面对庞大业务量时,网络设备能够满足数据中心内大规模、高并发的数据传输需求,同时兼顾网络的管理效率和安全性,为数据中心内部所有设备提供稳定可靠的数据通信。
在数据中心的网络架构中,较为常见的是叶脊网络,具有可扩展性、高可靠性和高性能。
叶脊网络由叶交换机(Leaf Switch)和脊交换机(Spine Switch)组成。叶交换机用于连接服务器和存储设备,脊用于连接叶交换机,是网络的骨干。
2.4 其他相关物理基础设施
除了以上介绍的三大基础结构,数据中心还拥有电力、制冷、安防、消防等系统,提供综合管理和运维功能。
各个系统协同作用,确保数据中心稳定运行,全方位保障数据中心内的设备和数据安全。
数据中心有哪些类型
首先,算力分为以下三类:
通用算力:由CPU芯片提供的计算能力。
智能算力:由GPU、FPGA、ASIC等加速芯片提供的AI计算能力。
超算算力:由超级计算机提供的极高性能的计算能力。
根据算力类型,数据中心可分为以下三类:
通用数据中心
提供基础通用算力,应用于电子商务、政务服务、企业办公等日常的互联网服务。
智算数据中心
提供AI计算能力,支持语音识别、图像/视频处理、模型训练和推理,应用于自动驾驶,智慧医疗、智能安防等领域。
超算数据中心
提供超高性能的计算能力,侧重于复杂和大规模的计算密集型任务,应用于重大工程或科学计算领域,比如:航空航天设计、天气预报、地震预测、能源勘探。
近年来,国家积极推进算力基础设施建设,数据中心已进入高速发展期。
据工信部统计,截至2023年底,我国在用数据中心机架总规模超过810万标准机架,算力总规模达230 EFLOPS,即每秒230百亿亿次浮点运算,位居全球第二。
根据第56期全球超级计算机TOP500榜单数据,我国的超级计算机数量位列全球第一,达到226台。
截至2023年,我国已建设14座国家级超算中心,形成了覆盖全国的超级计算服务网络。
目前,智能算力已成为我国算力规模增长的主要驱动力,2023年智能算力规模已达到70 EFLOPS,增速超过70%。
据业界专家预测,智算数据中心将进行重点大规模布局,成为推动社会经济智慧化转型的核心基础设施。
数据中心如何发展
在数字时代,算力就像“心脏”,为人工智能、大数据、云计算等技术的发展提供动力。社会对算力的需求呈爆发式增长,推动数据中心朝着以下方面不断发展。
4.1 大规模
在云计算时代,用户对计算、存储和网络资源的需求大幅增长,同时虚拟化和容器等技术使得资源利用率和管理效率大大提高,共同推动了数据中心向超大规模发展。
“东数西算”工程统筹优化算力资源,推动各枢纽节点的数据中心集群建设。截至今年3月底,10个国家数据中心集群算力总规模超过146万标准机架,整体上架率为62.72%,较2022年提升4%。
通过全国一体化算力体系建设,未来数据中心规模将实现稳步有序增长,提升整体算力水平。
4.2 高智能
在运维方面,融合AI技术有助于提升数据中心的运维效率和质量。
比如:通过AI预测数据中心能耗,分析资源需求,优化资源调度,助力节能减排;利用AI实现智能的资源调度、监控预警,检测排障,保障系统的稳定性和可靠性。
将AI技术应用于数据中心的规划、建设、运营、维护全生命周期,可实现数据中心高智能化。
据业界预测,2030年领先的数据中心的自动化运行能力等级将达到L4,几乎实现无人化。
在算力方面,AIGC技术迅猛发展,推动智算算力的需求激增。
据国家信息中心统计,在智算中心实现80%应用水平的情况下,城市对智算中心的投资可带动人工智能核心产业增长约2.9~3.4倍、带动相关产业增长约36~42倍。
未来智算数据中心将加速建设,源源不断地提供各种智算服务,成为数字经济的新动力引擎。
4.3 低能耗
数据中心的大规模化使得节能降耗成为了一大难题,国家据此提出相应要求,全国范围内新建数据中心的电源利用效率(PUE)<1.2。
在制冷方面,液冷技术成为了新型数据中心建设的重要选择。相比传统的风冷系统,液冷系统能够节约电量30%~50%,散热效率也更高。
PUE = 数据中心总能耗 / IT设备能耗
PUE越接近1,表示非IT设备耗能越少,数据中心能效水平越高。
在能源方面,据业界预测,2030年全国数据中心能耗总量将超过4000亿千瓦时。节能减排是数据中心持续绿色发展的重中之重。需充分利用新能源技术,应用可再生能源电力,提升绿电比例,降低碳排放。
算力已成为推动社会发展的新质生产力,数据中心作为算力的重要载体,正在迅猛发展,成为支撑信息化建设的“新基建”。
在不远的未来,也许数据中心能实现算力的融合与互联互通,推进构建算力网络体系,让算力像水电一样即取即用。
文章来源:中兴文档