每经记者 张蕊 北京摄影报道 每经编辑 陈旭
近几年来,新型基础设施建设进行得如火如荼,以智能计算中心为代表的算力基础设施是其中不可或缺的一项。
继南京等地人工智能计算中心落成之后,多个城市的地方政府也在积极推进城市级人工智能计算中心的建设,越来越多的地方将其视为实现支撑和引领数字经济、智能产业、智慧城市、智慧社会发展的关键性信息基础设施。
今年7月,工信部发布《新型数据中心发展三年行动计划(2021-2023年)》,提出要打造新型智能算力生态体系,有效支撑各领域数字化转型,更是把智能计算提高到一个新的高度。
智能计算的发展现状如何?面临哪些问题?在“双碳”目标下,智能计算将如何发展?在10月26日于北京举行的2021人工智能计算大会(AICC2021)上,业界专家就上述问题进行了探讨。
从芯片到算力的转化还需跨越鸿沟
本次大会发布了《2021-2022中国人工智能计算力发展评估报告》。该报告指出,算力已经成为数字时代的核心生产力,是拉动数字经济向前发展的新动能。对于AI算力的投入,将加快人工智能这一重要的数字化技术与实体经济的融合,赋能传统产业转型升级,催生新产业新业务新模式。
中国工程院院士、浪潮集团首席科学家王恩东在大会上表示,“人工智能带来指数级增长的算力需求,计算产业正面临着多元化、巨量化、生态离散化交织的趋势与挑战。”
王恩东表示,一方面多样化的智能场景需要多元化的算力,巨量化的模型、数据和应用规模需要巨量的算力,算力已经成为人工智能继续发展的重中之重。
另一方面,从芯片到算力的转化依然存在巨大鸿沟,多元算力价值并未得到充分释放。如何快速完成多元芯片到计算系统的创新,已经成为推动人工智能产业发展的关键环节。
芯片的多元化为产业AI化的加速提供了重要的产业基础和更加丰富的选择。但是,芯片从造出来到大规模用起来,还隔着一个巨大的产业鸿沟。
具体来说,算力的供给需要构建算力平台,需要解决架构设计、核心部件、高速互联、散热设计等一系列问题。
以一台AI服务器研制为例,整个系统需要经过30多个开发流程,使用150多种加工制造工艺,对280多个关键过程控制点的质量进行严格把控,并且还要实现与算法框架和AI应用的优化和适配等问题。
与此同时,面对大规模AI算力部署,AI算力平台建设又面临高功耗、高电流密度、高总线速率、高系统复杂度的新问题。
王恩东表示,就像我们能造出性能强大的火箭发动机,但要想造出安全、高性能的运载火箭,还要在循环、控制、结构等很多领域做大量的工作。芯片到计算系统同样如此,需要完成体系结构、信号完整性、散热、可靠性等大量系统性设计工作。
浪潮信息副总裁、AI&HPC产品线总经理刘军对《每日经济新闻》记者坦言,“目前智能计算还处在起步阶段,但它的成长速度是很快的,成长空间也非常广阔。”
刘军解释,如果从计算量来看,智能计算实际上已经超过了传统CPU的计算量,它每瓦的计算力与传统CPU相比至少高10倍以上。但是为了满足对巨量计算力的需求,智能计算整个链条使用的都是产业里最先进的技术,所以它的成本现在还比较高。
“为什么现在多元的发展是件好事,只有多元发展,在量上铺开了,大家的成本才能降下来,整个产业的运行效率才能提上去。”刘军说。
“双碳”目标下智能计算面临减碳压力
大会召开当天,国务院印发《2030年前碳达峰行动方案》,明确提出要加强新型基础设施节能降碳,统筹谋划、科学配置数据中心等新型基础设施,避免低水平重复建设。
这一方案还提出,要加强新型基础设施用能管理,将年综合能耗超过1万吨标准煤的数据中心全部纳入重点用能单位能耗在线监测系统,开展能源计量审查。
“双碳”背景下,智能计算未来将面临什么样的挑战?
大会间隙,IDC企业研究助理副总裁周震刚在接受包括《每日经济新闻》记者在内的媒体采访时表示,数据中心是耗电大户,在“双碳”目标下,无论是整体的通用计算还是人工智能计算都面临很大压力。
周震刚表示,最近其所在机构通过相关研究去量化云计算和数据中心对于碳减排的影响。“一方面是放在云里面,它整个效率会高,整个PUE(PUE = 数据中心总设备能耗/IT设备能耗,是评价数据中心能源效率的指标,PUE越接近1表明能效水平越高)会提升,消耗的能量会减少。”
另一方面,可以把数据中心放在距离清洁能源比较近的地方,比如内蒙古等地,这样可以有效降低碳排放。
刘军表示,对智能计算而言,“双碳”意味着要让能源转化成计算、转化成智能的效率更高,这是本质的问题。这就需要考虑同样是用一吨煤,最终能产出多少计算力和多少的智能。实际上,智能计算在同样的功耗、同样的人员条件下,所能获得的计算力和智能的提炼,是远远高于普通架构的。
“这也是为什么我们会看到目前基于异构计算(加速计算)的算力输出,在去年已经超过了通用CPU的计算力。从这方面来说,AI计算的架构是非常好的。”刘军说,这里面也还存在着瓶颈,因为要获得更多的计算力、更多的智能信息量,需要突破一些门槛,需要有效地把比特转化为知识,这是一个需要靠生态、开放、社区等一起来做的工作。
刘军表示,现在AI服务器、AI算力解决的都是前人未曾克服的难题,它也代表了整个半导体工艺最尖端的东西,所以需要很强的芯片才能提供很大的算力,由此需要很大的功耗和电流,很好的散热去支撑。
“这就提出了一系列挑战,能量转换怎样才能更高效,散热方式怎么提升,更高效的风能、更有效的液冷怎么结合等等,这既是挑战也是机会。”刘军说,最新的一些节能降耗技术通常首先都会在AI技术领域得到尝试,进入生产,得到普及,再往下延伸到通常的计算设备上。
每日经济新闻