我国数字经济的蓬勃发展对构建现代化经济体系、实现高质量发展的支撑作用不断凸显。为推动数字经济发展,有关部门陆续出台系列举措,加快构建以算力和网络为核心的新型基础设施体系。今年5月,国家发改委、工信部等四部门联合印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》,明确提出布局全国算力网络国家枢纽节点,启动实施“东数西算”工程;7月,工信部印发《新型数据中心发展三年行动计划(2021-2023年)》,计划用3年时间基本形成布局合理、技术先进、绿色低碳、算力规模与数字经济增长相适应的新型数据中心发展格局。
从四个方面推动算力发展
王恩东认为,相关算力企业需要认真贯彻落实国家发展算力枢纽的统筹布局,围绕国家枢纽节点建设的九项重点任务要求,在算力技术创新、算力枢纽平台建设、算力服务水平提升、算力产业生态链构建等方面,积极参与新型基础设施建设。他对此进行了详细阐述。
第一,在推动算力技术创新层面,坚持需求导向,围绕重点领域持续创新。同其他基础设施产业不同,IT是一个高度创新的产业,技术迭代远快于其他领域,因而,要加快服务器芯片、算力系统、融合架构、高速互联、绿色节能等领域技术创新,不断开发和升级场景化计算力方案。一方面,要满足大型、超大型数据中心集约高效发展的需求。另一方面,要满足现有数据中心的绿色节能升级改造需求。推动数据中心、智算中心的更新迭代,为活跃的数字经济打造先进的算力底座。
第二,在助推算力枢纽平台建设方面,抓住算力到应用转变的“牛鼻子”,兼顾算力和算法基础设施创新。打造以智算中心为代表的领先算力基础设施,同时也要在算法基础设施层面进行创新突破。目前,全球在人工智能算法领域的竞争非常激烈,美国2020年6月发布的GPT-3人工智能框架,总参数达1750亿。今年,浪潮也推出了全球最大中文AI巨量模型,参数量达到2457亿,训练数据集规模为5000GB,相比GPT-3模型1750亿参数量和570GB训练数据集,参数规模增加了40%,训练数据集规模增加近10倍,并支持面向AI典型场景,按需定义训练和推理系统。
第三,在提升算力服务水平层面,算力调度和运营能力兼顾。通过发展领先的智算中心调度系统、云数据中心操作系统,增强多云、云边、云网协同算力资源调度能力。同时结合电信、云服务运营商领先的运营能力,提升算力的精细化、场景化运营能力以及按需服务水平,打通跨行业、跨地域、跨层级的算力资源调度能力。此外,还要考虑对多种应用场景的支持,既要提升骨干枢纽节点巨量算力处理能力,也要增强近线、边缘场景的实时计算响应能力。
第四,在推动算力产业生态链构建层面,建设多元生态,打造有全球竞争力的计算产业链。一是把技术到应用的产业链条理顺激活,从体系结构、芯片设计、系统设计、系统软件、开发环境等各个领域形成分工明确又协同灵活的局面,同时要“引进来,走出去”,让中国的计算产业参与全球分工,把全球领先的计算技术和经验引进来,让先进的计算产品走出去,不断提升中国在全球产业中的话语权。二是加快推动开放标准建设,通过统一的、规范的标准,加快计算产业的发展,让不同产业环节的衔接更顺畅,让算力到应用的转变更快捷。
算力网络是计算和网络融合的重要锚点
随着算力基础设施从点状数据中心到网状算力枢纽网络逐步演进,算力网络正在成为新型基础设施的重要组成部分。王恩东认为,算力网络作为计算和网络融合的一个重要锚点,将新型算力基础设施和新型网络基础设施结合在一起,形成了未来新型算力融合基础设施。对于算力网络的发展,王恩东提出了三点建议。
首先,算力网络的建设布局要与电网、城市基建形成有效协同。“应用在哪里,算网覆盖到哪里”,既要保证对东部地区近线、高并发的应用需求提供充沛的算力,又要发挥西部地区电力资源充沛、自然温度较低的优势,将算力网络节点、智算中心适当布局。此外,“东数”也要考虑“西电东输”的压力,“西算”要考虑“东数西传”的骨干网络承载能力。
其次,算力网络在保证技术先进性的同时,也需要适度超前规划布局,以支撑数字经济的高质量发展。算力网络建设属于新基建范畴,具有很多不可量化、经济效益之外的潜在社会效益。
最后,要重视产业链的分工和上下游的协同。各个环节需要专业分工,更需协作,满足集约、绿色、互联互通的整体需求。
2021年11月,《中国移动算力网络白皮书》发布,中国移动向业界提出算力网络发展倡议。对此,王恩东认为,中国移动提出的算力网络,从目标愿景、场景展望、发展路径和关键技术等方面系统阐述了算力网络的全新理念,向业界展示了中国移动算网共生发展的新蓝图,对于支撑国家新型算力枢纽设施建设和“东数西算”工程,助力数字中国、智慧社会发展战略落地具有重要的产业促进和实践指导意义。
王恩东表示:“希望中国移动能够发挥自身的技术积累、场景覆盖、运营服务等方面的优势,以算为中心、以网为根基,推动‘网、云、数、智、安、边、端、链’等多技术、全场景能力的融合创新,与业界领先伙伴携手打造数字经济、算力枢纽的核心引擎。”
关注算力提升两大突破点
当算力成为信息社会的核心生产力时,对计算机性能提出了更高要求。在后摩尔定律时代,如何突破冯·诺依曼结构的瓶颈,实现算力的提升?王恩东认为有两大突破点。
首先,冯·诺依曼结构尚有较大的优化空间可挖掘。一方面,半导体工艺进步的速度虽然趋缓,但依然在进步。7nm、5nm制程技术已经开始普及,下一代工艺也在研发中,先进工艺和先进封装技术将继续支撑经典计算机的算力持续提升。另一方面,上层软件对底层晶体管资源的利用尚不充分。计算机性能的提升并不仅仅依赖于硬件技术的发展,也需要从软硬件一体化的角度来重新思考。通过创新软件技术高效地利用底层晶体管资源,依然有很大的空间可挖掘。例如,用C语言重写当前基于Python语言实现的矩阵乘法代码,性能可以提高50倍,如果再充分挖掘循环并行化、访存优化、SIMD等体系结构特性,性能甚至可以提高6.3万倍。
其次,工艺进步趋缓催生体系结构创新,体系结构创新同样会提高计算机性能。图灵奖获得者John Hennessy和David Patterson在《计算机架构的新黄金时代》中也提到了相关的观点,“当摩尔定律不再适用,一种以硬件为中心的针对特定问题领域定制设计的计算机体系架构方法DSAs(Domain- Specific Architectures)会成为主导”。冯·诺依曼体系结构面临的挑战是存算分离带来的通信墙等一系列问题,新型计算在机理上是存算一体化的,并且具有超高的并行性。目前,谷歌、IBM、微软、浪潮等都设立了相关的研究团队,不久可能走出实验室实现真正落地。
王恩东表示,一些新的计算技术,比如量子计算、光计算、生物计算等也在快速发展,将成为引领信息技术发展的革命性力量。
“少耗能、耗新能”是算力基础设施绿色高效发展方向
数字经济在我国经济中占比不断提升,算力基础设施是数字经济的核心承载,王恩东认为,“少耗能、耗新能”将是未来算力基础设施绿色高效发展的重要方向。
“少耗能,要依靠技术创新,特别是依靠节能技术的发展。”王恩东强调。
能耗是创新技术省出来的,今天一部智能手机的性能同20年前的一套超算的性能基本相同,但是能耗已截然不同。能耗也是各类节能技术省出来的,比如高效能供电、液冷等,尽量减少在输电、散热等方面的不必要消耗,降低智算中心、数据中心的整体能源消耗。
耗新能是指让数据中心、智算中心更多消耗风电、太阳能等新能源。很大一部分互联网负载,尤其是企业领域的负载都是在上班时间,这个时段与风电和太阳能的生产时段重合度非常高,不需要储能和峰谷调节,具有先天的优势。这方面,整个产业还处于探索中,随着中国风电和太阳能产业的不断扩大与产品技术的不断成熟,中国数据中心和智算中心直接用上风电、太阳能并不遥远。
王恩东介绍,推动智算基础设施绿色节能已在众多行业中开展探索和实践。比如在金融行业,浪潮信息与工商银行携手进行预制化数据中心创新,引入光伏发电﹢间接蒸发冷却技术,实现全年超长时间的100%自然冷却,整体PUE<1.2,运维效率提升40%;在通信领域,浪潮信息助力国内某大型电信运营商实现上万计算节点的整机柜服务器部署,采用机柜级模块化设计,集中供电、散热和管理,能耗降低20%,空间利用率高达90%。