如今,AI大模型正在掀起新一轮人工智能的热潮。科技部新一代人工智能发展研究中心日前发布的《中国人工智能大模型地图研究报告》显示,目前,中国和美国研发的大模型数量占全球总数的80%以上。其中,中国10亿参数规模以上的大模型已发布79个。而AI大模型的爆发也正在加速推进数字基础设施建设,芯片、服务器、数据中心、先进封装、算力租赁等领域迎来利好……

与此同时,算力已经成为数字经济时代的关键生产力,是全社会数字化、智能化转型的重要基石,伴随而来的是行业智能化转型进一步深化,算力产业正在以智能化、绿色化、融合化为主攻方向,在基础设施建设、产业基础创新和深度融合应用的持续推进下,做大做强。据IDC报告显示,随着生成式人工智能应用的爆发,各行业对智算的需求首次超过通用算力。


【资料图】

日前举办的2023中国算力大会,尤其是大会期间联想AI算力战略、AI服务器新品以及联想智算中心解决方案和服务核心产品的发布,更是让人们深刻地感受到AI大模型深入发展与普及带来的算力变革。在此背景下,联想正在通过AI内嵌的智能终端、AI导向的基础设施、AI原生的方案服务,加速人工智能在千行百业的普及和渗透。

会议期间,联想发布两款全新AI服务器产品——联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器,满足客户从训练到推理等多样的算力需求。联想还公布普惠算力的价值主张,致力于让算力成为电力一样的公共资源,让人人都可以用上普适和普惠的算力,并发布联想AI算力战略。

联想集团副总裁、中国区基础设施业务群服务器事业部总经理陈振宽表示:“联想从‘AI赋智 绿色赋能’的AI算力的两大特征出发,打造AI导向的基础设施。联想致力打造AI导向的基础设施,通过领先的AI技术,覆盖全域应用,加速实现普惠算力。”

迎接新算力时代到来,打造AI导向的基础设施

IDC统计,中国AI算力持续高速增长,2022年规模达268百亿亿次/秒(EFLOPS),未来几年的复合增长率高达52.3%。陈振宽在接受天极网等媒体的采访时表示:“随着Transformer大模型的推出,算力已经不是像过去一样,每18-20个月翻一倍,也不是在深度学习时候,每6个月翻一倍,而是现在每年数百倍的增长。”

由此可见,AI算力已经成为中国算力发展的主要方向,中国算力行业也需要做好准备迎接新算力时代——智算的到来。陈振宽认为,从千万级的参数到千亿级的参数,从深度学习需要中等规模地训练和推理到现在要全面地去实现超大规模的训练,区别于通用算力,AI算力需要依据AI数据和算法的特性设计和优化。

为此,AI算力基础设施也要根据特性进行针对性地优化。针对AI算力的“AI赋智”“绿色赋能”两大特征,联想发布AI算力战略规划,计划让100%的算力基础设施产品支持AI,50%基础设施研发投入在AI领域,全面技术覆盖全域AI应用。据悉,联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器将覆盖从大模型AI训练,自然语言处理到AI生成等广泛的应用场景。

与此同时,“联想以十年技术积累和创新能力所引领的液冷技术,助力实现绿色算力,以此全面布局和引领液冷技术。”陈振宽表示。在实际应用中,联想自主研发的海神温水水冷技术将PUE值降低至1.1,散热效率可高达98%。受益于此,上海交通大学“思源一号”高性能计算集群计算密度达到通用算力中心的5倍,而所需机房面积仅为通用机房的1/10。

联想正在全面布局和引领液冷技术,打造液冷集群方案灯塔,以绿色算力基础设施助推智算产业可持续发展。联想还在持续研发和引领未来液冷技术,解决未来千瓦级芯片散热难题,提高内存液冷覆盖效率,探索能效极致。

满足AI运算需求,联想AI服务器有哪些实力?

如今,大模型作为政府和企业推进人工智能产业发展的重要抓手,在识别、理解、决策、生成等AI任务的泛化性、通用性、迁移性方面都表现出显著优势和巨大潜力。其中,AI服务器作为算力基础设施之一,能够快速准确地处理大量数据,满足AI大模型的运算需求。

为此,联想重磅发布联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器。陈振宽表示:“全新推出的两款联想问天AI服务器,秉承‘AI赋智,绿色赋能’的两大战略特征,通过领先的AI技术,覆盖全域应用,打造全面的AI导向基础设施。”

两款全新AI服务器是“联想问天”品牌家族的重要组成部分,传承了联想服务器高性能、高可靠、高扩展、低功耗“三高一低”的特性。联想问天与联想ThinkSystem形成服务器双品牌驱动,以联想问天“本地创新+敏捷高效”与联想ThinkSystem“全球智慧+本地交付”的优势,为企业客户锻造强劲算力服务引擎。陈振宽表示:“全新的AI服务器能够与推理服务器、边缘AI设备等配合,完善联想算力基础设施产品组合。”

1)联想问天WA7780 G3 AI大模型训练服务器

在算力方面,联想问天WA7780 G3 AI大模型训练服务器基于第四代英特尔至强可扩展处理器。NVIDIA HGX H800系统配备8颗H800 NVLink GPU,将AI算力提升了3.44倍,至高可达32P FLOPS AI算力。

同时,NVIDIA H800 GPU匹配第四代Tensor Core配合Transformer引擎(FP8精度),与上一代产品相比,可为大模型AI训练速度带来高达9倍提升,可将大模型AI推理速度提升高达30倍。

在架构方面,联想问天WA7780 G3支持IB、RoCE等多种对外网络连接方案。最高可以支持8张RDMA高速网卡,提供3.2Tb/s聚合带宽。充分满足了超大模型训练并行计算时,跨节点的通信需求。

在本地存储的设计上,采用了GPU Direct Storage (GDS) 技术。通过GDS技术,GPU与NVMe实现了快速低延迟互联,能够有效提高训练数据载入的速度,提升大模型训练的性能。

在节能方面,联想问天WA7780 G3在产品设计中采用了三重独立风道设计,针对不同部件的散热特性,进行了系统性地优化,有效降低了由风扇带来的散热功耗。相比同级别产品,联想问天WA7780 G3 AI大模型训练服务器功耗降低约10%。

为了满足未来智算中心对PUE值更低的要求,本产品预留了液冷冷板设计,未来将支持液冷,这将大幅度节省在AI大模型训练过程中,因系统散热带来的额外能耗,PUE值有望低于1.1。

陈振宽表示:“联想问天WA5480 G3AI训推一体服务器的推出,支持多元算力和丰富的生态,提供了最多10张多类型、多品牌的AI加速卡,能够为AI模型的训练推理提供极致可靠的算力,加速人工智能在千行百业的落地。”

2)联想问天WA5480 G3 AI训推一体服务器

在算力方面,联想问天WA5480 G3采用2颗第四代英特尔至强可扩展处理器,支持最新PCIe 5.0。通过PCIe扩展,最多可以支持10张包括最新NVIDIA H800 GPU在内的,多类型、多品牌AI加速卡。可以灵活应用于AI通用模型训练、大模型推理、AI生成、云游戏、科学计算等多种应用场景,为AI的多样场景提供多元算力。

在设计方面,联想问天WA5480 G3 AI训推一体服务器基于不同AI工作负载,可以为客户提供包括直通、Balance、Common多种CPU-GPU互联方式,避免了因为CPU-GPU数据通信方式单一与工作负载不匹配,带来的潜在性能瓶颈和系统效率下降。结合不同种类,不同数量的加速卡选择,真正实现了对AI各种复杂场景的完美匹配。

在性能方面,联想问天WA5480 G3支持电源N+N冗余,节点内电源间互为备份,对外可以连接双路市电,保障服务器24小时在线运行。支持CPU、GPU、内存等关键部件的功耗监测,整机功耗封顶调控,动态保障服务器运行在合理的功耗区间,保证性能的稳定,以及风扇N+1冗余等多种安全设计保障高环温无间断运行。

“未来,联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器将与联想其它AI基础设施产品组合多向赋能,助力AI算力覆盖AI全域应用。”陈振宽表示。

联想通过全栈智能加速AI普及

何为联想全栈智能?具体体现在AI内嵌的智能终端、AI导向的基础设施、AI原生的方案服务。陈振宽表示:“联想通过这三个不同的维度,来呈现我们的全栈智能。”其中,以AI导向的基础设施方面,无论是联想AI算力战略还是联想推出的“联想ThinkSystem”和“联想问天”双品牌,均属于其范畴。据悉,联想双品牌在AI方面已有60多款产品。

作为发布会的又一重头戏,AI原生的方案服务也进行了集中呈现。据悉,AI原生的方案服务包括联想智算中心解决方案、联想混合云解决方案、联想大脑嵌入式解决方案和端到端全周期的联想智算中心服务和臻算服务。

在发布会上,联想集团副总裁、中国区方案服务业务群总经理戴炜也对AI原生的方案服务进行深入解读。他表示:“针联想方案服务将以三种交付方式(混合云、臻算服务2.0订阅式和一站式)支持三类算力场景(普算、智算、超算)的混合计算需求。”

在建设智算数据中心层面,联想集咨询、设计、集成和运维的一站式服务解决方案,为不同客户提供全生命周期服务,全程陪伴客户智能化转型。通过“一切皆可订阅”的联想臻算服务2.0,客户可按需订阅、灵活付费,全面助力解决客户痛点,触达多行业、覆盖全场景。

写在最后

如今,随着AI技术的发展,人工智能已经慢慢渗透到生活的各个方面,它赋予了千行百业更多的遐想空间,人工智能正在不断地解放人类的工作、提高人们的生活质量

同时,我们也应该注意到,AI算力也迎来新的发展机遇与挑战。为了充分应对挑战,紧抓时代机遇,企业应加大对先进计算软硬件研发的力度,构建从智能芯片到算法框架,再到行业大模型的全栈式产业链,加快人工智能算力发展。

“画竹,必先成竹于胸。”在中国算力产业进入智算新时代的时候,联想也正在致力于打造AI导向的基础设施,通过领先的AI技术,覆盖全域应用,加速实现普慧算力。面对通用人工智能的火热带动了智能算力基础设施的需求量增大,“联想将携手合作伙伴共同努力,加速支撑中国不断爆发的算力需求,打造AI 导向的算力基础设施,领跑中国智能化转型。”陈振宽表示。

推荐内容