首个商业化液冷服务器推动中国HPC生态圈蓬勃发展 : CPC的产品成功配套在曙光服务器液冷系统
网络与存储 时间:2018-03-13来源:电子产品世界
在近几年的国际超级计算机展会上,中国企业凭借丰硕的成果在国际舞台上赢得了业界的关注和认可。中国的超级计算机也首次在新的全球超级计算机500强排行榜上以202台的总数反超了美国,并从2013年开始稳居全球超算速度之首。除了在计算速度上取得的瞩目成就,国内企业在商用超级计算机环保节能方面也大放异彩。其中一款备受瞩目的“地球数值模拟装置”来自中科曙光:此装置运用了我国首款成功商业化的冷板式液冷服务器TC4600E-LP,可以完全模拟地球土壤、海洋和大气运动变化,同时大幅提升速度、降低能耗,是一台协助人工智能更进一步的深度学习一体机。该项目在帮助人类社会进一步了解地球环境的同时也做到了服务器全年自然冷却,可谓在绿色发展道路上迈出了意义非凡的一步。
引领液冷服务器商业化
计算能力的突飞猛进使人工智能在各个行业都具备无限的可能性。大量的计算芯片需要高密度部署,一个服务器机柜的发热量也将增至数十千瓦。CPU作为服务器的主要驱动力对电源和散热有着极高的要求——电源系统需要提供更大的功率,冷却系统也要做到与之相匹配的散热能力。这是传统的风冷技术无法达到的。因此,能够精确到CPU的液冷技术成了曙光节能技术(北京)股份有限公司(以下简称曙光节能)主要的研究方向,也是解决目前数据中心节能问题的必然趋势。相较风冷,液冷能达到更低的PUE值、有效降低风扇噪音和大幅降低耗电量。
虽然液冷技术问世已有一段时间,但囿于技术成熟度和成本等因素,液冷高性能计算机始终未能得到大规模应用。对于习惯运营风冷机房的用户来说,从风冷到液冷的过度也是一个充满挑战的过程。除了服务器架构搭建上的不同,机房的维护方法和程序也需要做出相应的改变。
以此为出发点,曙光节能开始与曙光服务器事业部、上下游厂商合作,致力研发性价比和用户接受度高的产品,使其满足科技商业化的必要条件。这一研发项目的成果就是TC4600E-LP冷板式液冷服务器。它采用风冷和液冷混合散热模式对服务器主要部件进行冷却,将液冷散热占比提高至90%以上,从而降低了风机功耗。TC4600E-LP采用了集成管理模块设计,在整箱刀片式液冷服务器中的CPU芯片和内存上安装固定水冷板,冷媒通过进出口循环流动。TC4600E-LP投入市场2年来,先后为中科院大气所“地球数值模拟装置原型系统”和国家电网电力科学研究院仿真中心超级计算系统项目提供了超过2000节点的计算能力,整柜密度超过25kW,空调系统功耗直接降低70%,PUE值始终控制在1.2左右。
冷板式服务器因其对计算机系统较小的改动要求成为液冷技术商业化合适的选择,只需将原风冷散热片替换为液冷板,并将冷媒管路引出机箱即可。快速插拔管路连接也使运行维护更加接近用户现有的使用习惯,安全便捷。
建设中国HPC生态圈
据曙光节能总经理何继盛介绍,曙光节能专注于自己的专业领域,其价值在于让其它应用液冷技术的产业能够专心钻研自身的工作,取得经济与资源上的高效率。这不仅需要曙光节能本身技术实力雄厚,也需要一个生机盎然的产业生态圈来帮助国内高科技企业实现更快的技术应用和大项目部署。
近年来,曙光节能通过研发制造过程中与上下游合作伙伴的接触与沟通,将创新链与产业链结合,深度利用特定的应用进行各类产品的开发和优化。由于国内的HPC产业链尚未成熟,曙光节能十分看重上游厂商的研发定制能力,在不同的应用中与供应商进行深入的技术交流,借此希望更多的厂家能在液冷技术配套原材料和零部件研发方面投入更多的精力。
对此,曙光节能液冷系统研发总监崔新涛强调:“液冷系统各个部件都是非常关键的,哪个部件出现问题对服务器来说都是致命的影响。正因为有了这些关键供应商的支持,才促成这个液冷系统的诞生。”
上游零部件厂商合作:小部件,大作用
在液冷系统的设计中,液冷管路连接是其中重要的一环。机房的空间结构、管路的安全性和易维护性是选择与设计管路接头关键的考量。崔总监解释道:“管路接头是水冷模块中比较核心的部件,需要保证用户在使用和维护过程中可以快速插拔,并且冷却液不泄露。”
在这一环节上与曙光节能合作的上游厂商是快速插拔接头研发制造商CPC。早在2010年,CPC由于意识到无溢漏接头在液冷系统解决方案中所起到的重要作用开始与曙光节能进行联系,并于2013年正式建立合作关系。曙光节能也注意到CPC的产品曾多次被应用在国际名企的液体传输和处理系统中。漂亮的成绩单和不断的沟通使双方对彼此的专业度都有着极高的信赖。
在研发初期,服务器液冷系统技术尚处摸索阶段,项目因此以原型机的测试为主导。曙光节能在全浸没前置式验证机上试用了CPC的PMC12塑料接头,对其气密性和安全性进行了长期观察和测试。
由于PMC12接头在各方面表现理想,一年之后,曙光节能对CPC要求试用金属接头,以满足用户对连接器材质的新需求。随着技术的进步和双方研发人员不断的讨论和沟通,曙光节能开始在冷板式服务器上对CPC的LQ6金属接头进行测试。这款专为液冷应用设计的快速插拔接头采用镀铬黄铜、聚砜和不锈钢材料制造,确保了可信赖的强度以及对大范围应用的化学相容性。在保障电子设备安全方面,接头具有特殊的断面和阀门技术,使其在长时间保持连接之后还能在断开时实现无滴漏,符合超级计算机的使用维护特点。除此之外,LQ6还优化了流量效率、配备了具有符合人体工程学的拇指锁,并运用蓝、红两种颜色编码为运维人员提供视觉提示,以预防误接。预紧螺纹设计也有效避免了设备在运行中由于振动所导致接头松动的风险。
在接下来的合作中,曙光节能根据客户反馈和冷板式服务器的结构提出了盲插设计的想法,让服务器刀片在有误差的情形下也能保证接头顺利连接。CPC于2015年为TC4600E-LP冷板式服务器订制了RP-LQ2盲插产品, 其独特的自对中设计容许刀片和机架在对接时位置发生少许偏移,以确保其它电子连接准确无误为前提自动校对到中心,实现盲插接头的无损对接。盲插使液冷服务器的维护方式与风冷散热服务器基本无差别,加上多层泄漏检测和溢流技术,提高了数据中心的安全和稳定。
研发总监崔新涛如此评价与CPC的合作:“CPC具有强大的技术实力,并在研发制造易维护的快速插拔连接器方面具有丰富的经验。因此,曙光节能乐意与CPC这样技术成熟的厂商进行合作,选择它作为曙光节能液冷模块接头的主要供应商。”\
对于CPC 来说,与曙光节能的技术交流也是提高自身研发订制能力的佳平台。CPC工程经理张欣说道:“我相信双方的合作能促使液体冷却技术更加完善,推动行业成长。”
未来的推广与创新之路
为何要大力推广商业化?对此,崔总监一针见血地指出:“虽然我们的服务器在技术上已经是国际水平,但不同的是,在需求上,国外的大用户在节能环保意识上更为超前,也更为积极地部署液冷系统。相比之下,国内的环保节能意识开始得稍微晚一些,但我们产业的发展速度却是超前的。”由此可见,国内市场需要依靠高科技企业的不断推广和商业化研发来使液冷技术更为普及,这也包括了对未来趋势的展望和研究。崔总监提到,浸没式服务器虽然是不可避免的趋势,但在世界范围内都是一个应用难题,需要控制液体的相变或保证空间压力。正因如此,现在能实现真正商用的全浸没液冷服务器在世界上也是极为罕见。
这并没有阻止HPC产业对浸没式商业化的追求。自2010年起,曙光节能联合曙光服务器事业部就在实验室中同时开展了冷板式和浸没式两种液冷方案的科研。继2015年曙光TC4600E-LP冷板式液冷服务器亮相并成功竞标多个大型项目之后,曙光节能也在竭力开发商用浸没式液冷系统。
为了更好地推动这一切的发展,曙光节能持续主动地与生态圈内的合作伙伴保持沟通。CPC作为曙光节能重要的零部件供应商之一也在这个过程中不断完善液体处理技术。双方工程师以更好响应液冷发展趋势为目标,通过不懈的专业交流让高性能计算走出实验室,携手研发开辟未来的创新产品。
关键词: 计算机 服务器 曙光
|