液冷赋能,AI算力锐不可当_液冷

近年来,随着人工智能、大数据、大模型等技术的快速发展,对高效散热的需求不断增加,液冷技术得到了广泛关注和应用。许多知名企业纷纷投入液冷技术的研发和应用,推动其不断创新和发展。液冷技术在5G通信、边缘计算等领域的应用也在逐渐拓展,为这些领域的发展提供了有力支持。

根据市场研究机构的数据,全球液冷市场规模预计将在未来几年内保持高速增长,到2025年将达到数十亿美元。在中国市场,液冷技术的应用也在逐渐增加,市场规模有望在未来几年内实现翻倍增长。

算力与散热的演进

在算力演进的道路上,散热扮演着至关重要的角色,每一次算力的重大突破往往都伴随着散热技术的同步提升。早期主要以风冷散热为主。通过风扇带动空气流动来带走热量,这是较为传统和常见的散热方式。

随着算力提升和发热增加,出现了更高效的热管散热技术。热管利用工作流体的蒸发和冷凝来传递热量,具有较好的导热性能。接着,液冷散热技术逐渐兴起。它通过液体循环来更有效地吸收和转移热量,相较于风冷散热效率更高。当前异构、HPC、AI等算力需求进一步提高,液冷散热的重要性愈发彰显。

液冷赋能,AI算力锐不可当_数据中心_02


先进封装是在半导体制程接近物理极限的情况下延续摩尔定律的重要路径,除了通过制程工艺来缩小器件尺寸、研发新材料以及电路结构以提升单位面积的晶体管数量之外,改变封装方式来提升集成电路容纳性也是重要的一个方向。而在多芯片的2.5D、3D封装等提升系统性能,且架构堆叠加上系统功率与热源密度提升的情况下,液冷作为高效的散热方案在算力网络的产业框架中不可或缺。

AI训推重构算网架构,大模型参数量的增速显著大于GPU内存增速,高集成度+大内存+多GPU的系统更适配大模型训推。为应对AIDC机柜的芯片密度显著提升,传统散热向高效液冷演进是必然。

液冷赋能,AI算力锐不可当_液冷_03


液冷应用场景和技术


芯片层面,芯片的典型功耗超过300W时,需要使用液冷才能保证算力性能释放; 整机层面,AI服务器单柜功率10kW级增至数十kW以上,密度激增迫切需要液冷;机房层面,IDC PUE从1.5以上降至1.2只能选择液冷。

目前国内主流液冷方案包括冷板式、浸没式、喷淋式三大类,冷板式应用较多。

液冷赋能,AI算力锐不可当_IDC_04

液冷赋能,AI算力锐不可当_液冷_05


随着对计算性能要求的提高,液冷技术在以下关键应用场景中发挥着重要作用。

  1. 数据中心:用于冷却服务器和其他 IT 设备,提高能源效率和降低运营成本。
  2. 超级计算机:处理大规模计算任务,确保高性能和稳定性。
  3. 人工智能:训练和运行深度学习模型,加速计算过程。
  4. 医疗设备:如 MRI 机器,保持设备的正常运行温度。
  5. 工业制造:冷却加工设备,提高生产效率和产品质量。
  6. 电动汽车:电池组的冷却,延长电池寿命和提高安全性。
  7. 航空航天:冷却电子设备和发动机部件。
  8. 科研领域:各种实验设备的冷却。
  9. 游戏电脑:提供高性能的散热解决方案。

液冷技术的发展趋势

在节能减排的大环境下,液冷技术的优势逐渐显现,其发展呈现出一些新的趋势:

  1. 更高的效率:不断提高散热效率,以满足日益增长的计算需求。
  2. 更低的能耗:通过优化设计和材料,降低液冷系统的能耗。
  3. 更广泛的应用:拓展到更多领域,如 5G 通信、边缘计算等。
  4. 智能化管理:实现对液冷系统的智能监控和管理。
  5. 绿色环保:采用环保的冷却液和材料。
  6. 集成化设计:与其他技术集成,提高系统的整体性能。
  7. 成本降低:随着技术的成熟和规模化应用,降低成本。
  8. 可靠性提升:提高液冷系统的整体可靠性和稳定性。
  9. 定制化解决方案:根据不同应用场景提供定制化的液冷方案。
  10. 热回收利用:探索液冷系统产生的热量的回收和再利用。


常见液冷技术的特点和应用场景

液冷赋能,AI算力锐不可当_算力_06


液冷 — "算力的尽头是电力"

谈到“东数西算”,IDC/AIDC作为高耗能行业,算力与电力匹配是现实需求。据Omdia 2020,全球数据中心的耗电量占社会耗电总量比例已达2%。据中国能源报,2022年,我国IDC耗电量达2700亿千瓦时,占全社会用电量约3%;预计到2025年,全国IDC用电量占全社会用电量的比重将提升至5%,2030年全国IDC耗电量将接近4000亿千瓦时。

PUE是评价IDC项目经济性、能耗指标审批的重要标准之一。“东数西算”对数据中心PUE水平的要求高于当前水平(全国项目普遍要求PUE在1.2左右),能耗达标的核心环节是温控节能设备。“东数西算”意味着我国整体算力水平大幅提升,与之配套的温控散热节能设备需求将同步提升。


  • PUE = IDC总能耗/IT设备能耗
  • IT设备能耗 = 单机柜额定用电量×机柜上电数量×24小时×全年天数×负荷率


提升液冷经济性

拆分AIDC成本结构,液冷已具经济性,原因在于功率密度而非仅液冷成本。

  • Capex视角:土建(空间成本)、配电(电力容量)、热管理设备成本(风冷or液冷)占初始投资绝大部分(不考虑ICT设备,成本占比>50%)
  • Opex视角:电费与折旧则是日常经营的主要成本项(成本占比可达80%+)

衡量液冷经济性的核心因素在于PUE优化后的电费节省、密度提升、能否超越设备初始投资的增项。

液冷赋能,AI算力锐不可当_算力_07

液冷经济性的逻辑框架


过去传统IDC的建设成本,土建、配电、空调是影响项目经济性的核心因素。随着机柜功率密度的增加,电力设备Capex和每年电费Opex在IDC商业模型中的影响力显著提升。

液冷赋能,AI算力锐不可当_数据中心_08


算力液冷


AI算力体系类似,储能系统的高效稳定运行也对工况的温度、湿度有较高要求,温度直接影响电池容量和工作效率衰减,且和热失控事故直接相关。目前主流的储能温控技术有风冷、液冷、热管冷却、相变冷却。其中风、液冷是产业主流。

据中国储能网,储能系统中电池成本占比约55%,PCS占比约20%,BMS和EMS合计占比约11%,热管理成本根据所选温控技术方案的不同,成本在2-4%之间。

随新能源电站、离网储能等大容量、高密度的储能电站建设,以及大型能源集团、大型系统集成商的带动,储能液冷正持续提升。国内储能温控由IDC精密温控、工业温控、新能源车温控等领域拓展而来,表明延伸可能。

液冷赋能,AI算力锐不可当_算力_09


储能温控产业链下游集中度较高、话语权和议价能力强,一旦供应资格形成后粘性强,先发优势较为重要。核心AI芯片、终端大厂的认证、服务能力提升算力液冷的核心竞争壁垒。

风冷、液冷系统在储能领域大规模应用,需求迅速放量,产品交付能力以及成本控制能力是核心。通过制造、成本控制能力,降低ICT、IDC环节的投资成本。

随着储能容量变大,产品定制化需求较强,液冷系统的流道数量、流量、流速等定制化设计要求高,客户更多选择具备联合设计能力的厂商。零部件环节标品,重性能,实际产品力差异巨大,横向拓展可能性大;系统环节非标品,需要理解热管理技术,具备ICT、IDC相关知识。

液冷赋能,AI算力锐不可当_算力_10


如何选择合适的液冷技术

选择适合自己的液冷技术需要考虑以下几个因素:


  1. 散热需求:

首先要确定自己的设备或系统的散热需求。不同的应用场景和设备对散热的要求不同,例如高性能计算、数据中心、游戏电脑等可能需要更强大的散热能力。


  1. 技术类型:

了解不同类型的液冷技术,如冷板式、浸没式、喷淋式等。每种技术都有其特点和适用范围,需根据具体情况进行选择。


  1. 成本:

液冷技术的成本相对较高,包括设备成本、安装成本和维护成本等。需要根据自己的预算来选择合适的技术。


  1. 空间要求:

液冷系统通常需要一定的空间来安装和运行,需要考虑设备的尺寸和空间限制。


  1. 可靠性和维护:

选择可靠的液冷技术和供应商,确保系统的稳定性和可靠性。同时,了解系统的维护要求和难度,以便进行日常维护和故障排除。


  1. 兼容性:

确保液冷技术与自己的设备和组件兼容,不会对其他部件造成损害。


  1. 性能和效率:

比较不同液冷技术的散热性能和效率,选择能够满足自己需求的技术。


  1. 环保和安全:

考虑液冷技术对环境的影响和安全性,选择环保、无毒、不易燃的冷却液。


  1. 技术支持和服务:

选择能够提供良好技术支持和售后服务的供应商,以便在使用过程中遇到问题时能够及时得到解决。

综合考虑以上因素,根据自己的具体需求和情况,选择适合自己的液冷技术。在选择之前,可以咨询专业的液冷技术供应商获取更详细的信息和建议。

液冷赋能,AI算力锐不可当_应用场景_11


随着技术的不断进步,液冷技术将更加成熟和普及,应用领域也将不断拓展。未来,液冷技术可能会与人工智能、物联网等相结合,实现更加智能化的散热管理。液冷技术的发展将为各个行业带来更多的机遇和挑战,需要不断创新和探索。

#数据中心#液冷数据中心#液冷服务器#智算中心#液冷算力#水冷服务器