横空出世的ChatGPT引发全球人工智能(AI)第三轮热潮。在AI三大要素“算力、数据、算法”中,算力首当其冲,有分析认为算力即权力、算力即国力。算力分为通用算力、智能算力和超算算力三种类型:通用算力无法高效处理大规模并行计算任务;超算算力的高精度数值计算主要用于科学计算与工程计算等高端领域,基本上是国家的科研、工程条件设施,只是有限度的商用,成本比较高;智能算力则是支撑人工智能应用和产业发展的最优解。在2024年3月全国“两会”上,政府工作报告首次提到了“人工智能+”,同时要求“适度超前建设数字基础设施,加快形成全国一体化算力体系,培育算力产业生态”。
最近三个月,云宏研究院联动高校、科研单位组成课题组,全面汇总分析了全网智算中心数据,实地走访了15家广东各类型智算中心和比亚迪、华为、小鹏汽车、亿航智能总部和联想华南分部等业界标杆企业,实地调研了广东省级和各地市多个政府管理部门,面对面深入访谈了50多位国家级智库和知名高校专家、业界人士,并结合作者本人2019~2020年创建韶关市“东数西算”首个数据中心项目实务经验,形成本份调查分析。
10个月涌现196家智算中心,
机遇与风险并存
据《证券时报》报道,赛迪顾问人工智能与大数据研究中心提供的数据显示:截至2024年上半年,国内已经建设和正在建设的智算中心超过250个。而通过中国政府采购网、中国招投标公共服务平台、天眼查、新浪新闻等公开渠道及内部数据库,我们发现,从2024年1月1日~10月底,围绕IT基础架构、土建基础设施、能耗指标等建设内容,含新建、扩建、审批等类型,在港澳台地区之外,涉及到的全国各类智算中心达到196个。下面的统计和分析,则是基于今年新增的这196个智算中心而展开。
一、地域分布统计
从196个公开披露信息的智算中心来看,广东、山东作为经济大省,各有23个、17个,分居前二。新疆电力资源充沛,排名第三。排名第四的安徽是“东数西算”集群所在地之一。根据今年5月各省市区发电量排名,内蒙古、广东、江苏、山东、新疆排在前五,而这些区域也是智算中心集中地。作为耗电大户,数据中心2022年全年耗电量达到2700亿千瓦时,占全社会用电量约3%,预计2025年这个比重将提升至5%。
在国家信息中心信息化和产业发展部主任单志广看来,我国算力产业发展当前存在“三多三少”的结构性失衡。一是传统数据中心多、真正意义上的智能计算中心少,数据中心底层架构和服务能力存在结构性失衡。二是数据中心东部多中西部少、中小型多大型少,区域分布和规模类型存在结构性失衡。三是进口依赖多、国产自主少,数据中心核心芯片和软件产品存在结构性失衡。
二、建设主导方统计
196个智算中心中,明确建设主体的有188个。它们的建设主导方主要分为以下三类:一是通信运营商,包括电信、移动、联通;二是企业,包括国企、民企、混合所有制企业;三是公共机构,包括政府机构、高等院校、研究院等。通信运营商是智算中心规划、建设、运营流程的“主心骨”,即使是其他企业或者公共机构主导建设的智算中心,也需要和通信运营商深入合作。
公共机构主导建设的智算中心,占比13.3%,绝对份额不大,却是供需市场“关键的少数”,起到了“鳗鱼效应”和“压舱石”作用,一定程度上左右了市场价格。有业内人士直言不讳地指出,“现在数据中心的市场价格太卷,几近白菜价,有一个原因是公共机构提供的免费、优惠数据服务太多”。也有专家认为,这表明智能计算是具有很强公共属性的市场交易产品。
在三大运营商直接主导的64家智算中心项目中,移动有25家,电信有21家,联通有18家,大致为三分天下。运营商以各种方式积极参与智算中心产业,主要原因有:一是仍代表国家资本;二是从企业行为坚定执行国家战略、政策;三是发挥自身业务地域分布及信息高速公路优势;四是传统数据中心容易升级为智算中心;五是依靠品牌效应抢占智算商用市场;六是AI算力需求集中是大模型参数固化前训练的需要,前期训练需求大,后续模型运用需求小,如果不用增值服务,算力资源容易浪费,需要多方联合建设,大家分段或者并发使用。
三、投资额统计
对其中135个可查到确切投资额的智算中心进行统计分析,每个智算中心平均投资额为28.57亿元。过百亿投资的超大规模智算中心一般由运营商主导建设运营。国际上公认的进行AI大模型训练研发的投资门槛是10亿美元,折合人民币约72.3亿元,其中的一大部分就是建设或租用智算中心成本。
10个月涌现196家智算中心,以上述每家平均投资额28.57亿元测算,总投资额为5599亿元,再加上计划建设的、已建但未公开披露信息的智算中心,该行业总投资额近万亿元。“数据地产”的社会标签形象呼之欲出。如此庞大的新基建规模,是中国蓬勃兴起的数字经济的一个生动写照,但其正外部性、负外部性值得我们审视及警惕。智算中心大热带来的一个后果是,位于供应链上游原本一度滞销的部分国产品牌柴油发电机,最近突然畅销,“订货单基本排到半年后了”。有业内人士直接发问:如果未来五年生成式人工智能或者大模型不能维持高热度,这些成百上千亿元的投资该如何处理?
四、算力规模统计
对其中112个可查到确切算力规模的智算中心进行统计分析,大部分的智算中心规划算力在2000PFLOPS左右,规划算力大于10000PFLOPS的有17个,几乎全是由运营商主导建设。每个智算中心平均算力规模6282PFLOPS,以此测算196家智算中心能够提供的总算力为1231EFLOPS(注:1EFLOPS=1000PFLOPS)。而2023年10月工信部等六部门联合印发《算力基础设施高质量发展行动计划》,提出到2025年全国算力规模超过300EFLOPS,这个数字远低于196家智算中心能够提供的理论总算力值。这个反差至少说明了三个事实:
一是当下各类智算中心主动对外宣介的算力规模和投资规模等或者是有注水、虚假宣传的成分,或者只是未来3~5年的可能建设规划,估计不能全当真;二是当下的各类数据中心上架率比较低,远远未达到理论值,规划目标与实际使用值有差距;三是未来的智算中心将面临更加剧烈的市场竞争,高性能、高功率、高稳定性、高附加值、绿色安全的数据中心才有价值。
五、单机柜功率统计
对其中37个可查到确切单机柜功率的智算中心进行统计,48.6%的智算中心低于8KW,51.4%的智算中心高于8KW。业界一般认为,8KW是智算中心单机柜功率的一个基本门槛,如果低于这个数值,较大可能这是一个正在改造升级的普算中心,当然也有可能采用了国际最新水准的GPU芯片,导致算力极高、能耗极低,但这种可能性较小。这组数据也表明,扣除各类“伪智算中心”“虚假宣传智算中心”,真正货真价实、具备足够技术参数的智算中心数量全国大约为80~100家,它们是顶起中国AI产业的脊梁。目前可知的单机柜最高功率是80KW,未来能否突破100KW,我们拭目以待。
本项测得,智算中心平均单机柜功率为14.49KW。这对数据中心的国家建设行业标准是一个新的挑战,现在通行的表述是按2.5KW标准机柜折算,而2.5KW标准机柜所对应的冷媒技术,与14.49KW高性能机柜所要求的冷媒技术截然不同。
六、机柜数量统计
对其中56个可查到确切机柜数量的智算中心进行统计分析,每个智算中心平均机柜数量为5598个,与上表每个智算中心平均算力规模为6282P进行比照分析,中国智算中心单个机柜算力平均为1P,由此也不难推断这些智算中心使用的芯片类型、资本投入、能耗等。
与机柜数量直接相关的就是上架率,即机柜的实际使用比率。这一数字对各家数据中心来说都是高度商业机密,原则上不会在公开数据中如实透露,但通过一些私下交流,以及用电量比对分析来看,这个数值非常不乐观。根据工业和信息化部的数据,截至2021年底,中国在用数据中心机架总规模超过520万标准机架,平均上架率超过55%。由于这几年的建设热潮,增量算力供给超过了增量算力需求,因此最新的平均上架率估计低于50%,也就是说全国一半的数据中心机柜是“待字闺中”,这为激烈的市场价格竞争、结构性竞争态势埋下了伏笔。
综上,我们可以对中国的智算中心进行一个基本画像:造价约30亿元,算力规模约6000PFLOPS,单机柜功率超过14KW,位于东部沿海经济发达地区,分2~3年建设,由运营商或者是企业主导建设。未来社会80%的数字化应用场景都是基于人工智能,在人类空间、物理社会和信息空间构成的三元数字孪生社会中,智能计算中心作为关键基础将支撑起一个全新的人工智能驱动的“智慧社会”。国家信息中心信息化和产业发展部主任单志广曾撰文指出,智能计算中心具有很强的公共属性,就像水、电、气等的运营平台,其建设模式必须要总体规划、政企协同、需求牵引,并聚焦先进的技术和适配典型场景。这种路径的引导,能够解决过去传统数据中心的无序建设和散乱问题。
国家政策释放民间资本活力,
“东数西算”工程影响深远
在相当长的一段时间,数据中心属于国企特许经营领域,民间资本不得进入。依照2010年5月颁布的《国务院关于鼓励和引导民间投资健康发展的若干意见》精神,工业和信息化部于2012年6月发布《关于鼓励和引导民间资本进一步进入电信业的实施意见》,明确“支持民间资本在互联网领域投资,进一步明确对民间资本开放因特网数据中心(IDC)和因特网接入服务(ISP)业务的相关政策,引导民间资本参与IDC和ISP业务的经营活动”。这份实施意见具有重要的节点性意义,鼓励和引导了民间资本进入数据中心这个“法律法规未明确禁止准入的行业和领域”。需要特别说明的是,国家并非对IDC完全放任不管,因为建设IDC需要关键的能耗指标,这个“通行证”由各地发改系统、能源局宏观把控。这种把控的时、度、效,直接检验的是数字化时代各地方政府在推进治理能力和治理体系现代化建设中的水准及成效。
党的十八大于2012年11月在北京召开,新时期中国新基建从此迎来了波澜壮阔的新历程。2017年12月,中央政治局就实施国家大数据战略进行集体学习,要求“加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济社会发展和人民生活改善”。2020年4月,《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》发布,数据作为一种新型生产要素写入文件中,与土地、劳动力、资本、技术等传统要素并列为要素之一。
2013 年 1 月,国家工业和信息化部、发展改革委等五部委发布《关于数据中心建设布局的指导意见》,倡导企业利用云计算、绿色节能等先进技术进行整合、改造和升级已建数据中心,促进产业健康发展。2017年7月,国务院《新一代人工智能发展规划》提出“建立人工智能超级计算中心”,首次将智能计算中心提升至国家战略高度,开启了产业萌芽期。2020年4月,国家发展改革委首次明确新型基础设施范围,将智能计算中心作为算力基础设施的重要代表纳入信息基础设施范畴。
2021年5月,一份重磅文件公开发布,国家“东数西算 ”工程正式启动。国家发展改革委、中央网信办、工业和信息化部、国家能源局等部门印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》,在京津冀、长三角、粤港澳大湾区、成渝,以及贵州、内蒙古、甘肃、宁夏等地布局建设全国一体化算力网络国家枢纽节点,发展数据中心集群,引导数据中心集约化、规模化、绿色化发展。在这之后,2022年颁布的《“十四五”数字经济发展规划》、2024年颁布的《数据中心绿色低碳发展专项行动计划》等文件,对“推动智能计算中心有序发展,打造智能算力、通用算法和开发平台一体化的新型智能基础设施”等进行了具体部署。
全球数据总量呈现高速井喷状态,全球数据量将在2024年达到159.2ZB(Zettabyte,即十万亿亿字节),中国数据量约占全球数据总量的10.5%。按照前述国家规划,到2025年全国算力规模超过300 EFLOPS(注:1EFLOPS=1000PFLOPS,PFLOPS表示每秒一千万亿次的浮点运算),智能算力占比达到35%,东西部算力平衡协调发展。
具体到今年前10个月我国新建/审批/扩建智算中心数量最多的广东省而言,到2025年,在计算力方面,算力规模达到38EFLOPS,智能算力占比达到50%,建成智能计算中心10个,基本形成算力规模体量与数字化发展需求相适应、算力供给结构与业务需求相匹配的发展格局。综合算来,广东2025年算力规模占全国的12.67%,这一比例与广东及大湾区在全国GDP总量中的占比相当,也与中国在全球数据总量中的占比相匹配。
对一座城市而言,如果不计外向服务互联网头部企业或重大科研机构的算力数量,算力的匹配与区域内的人口总量、土地面积、经济总量、互联网应用活跃度等相关,以珠三角某地为例,人口600万左右,全年GDP为4000亿元左右,土地面积一万平方公里左右,那么该市匹配的算力规模接近2000PFLOPS。
2023年8月,国家工信部部长金壮龙2在2023中国算力大会开幕式上介绍,截至当时,我国在用数据中心机架总规模超过760万标准机架,算力总规模达到197EFLOPS,算力总规模近五年年均增速近30%,围绕算力枢纽节点建设了130条干线光缆,数据传输性能大幅改善。从全球算力规模份额来看,美国算力规模占全球所有算力的比例为36%,而中国达到了31%,与美国只有五个百分点的差距,排第三的日本仅有6%,只有中国的五分之一左右。从算力规模上来看,中国与美国差距不大,但在算力质量方面,我们还要继续努力。
2024年11月大湾区科学论坛在广州举行,中国科学院院士、深圳大学校长毛军发认为,中国的算力基础设施建设已取得长足进步,同时在算法、芯片上空间和潜力都很大,他也明确指出,当下国内高校一窝蜂地设立人工智能学院,“不利于培养人工智能领军人才”。
由此我们不难得出我国在智算中心建设领域的顶层调控思路:
一方面,用“有形的手”“无形的手”在量上相对温和地调控,坚决防止过热、极端泡沫化,避免“数据地产”重蹈类似恒大地产乱象覆辙,另一方面,集聚各界力量在质上鲜明引导及强力提升,联动上下游科研及产业力量,闯出一条有我们自己特色的智算中心新质生产力发展之路,同时还要面向世界、面向未来、面向新技术发展趋势。
瞄准AI强省的广东,
能否再设一个数据中心“副集群”?
我国广东省是改革开放前沿阵地,是经济大省、人口大省、互联网应用大省,也是数据数量大省、数据中心大省、民营经济大省。全省和各地市政府在积极贯彻落实中央指示精神的同时,也充分尊重了基层政府部门主动改革创新精神、民间资本勇于尝试创新传统。前些年曾有省外媒体形容广东民营企业家既是“敢饮头啖汤”,又是“遇到绿灯往前走,看到黄灯赶紧走,碰上红灯绕着走”。
近年来,广东省人民政府先后制定印发了《广东省新一代人工智能发展规划》《广东省人民政府关于加快建设通用人工智能产业创新引领地的实施意见》《广东省关于人工智能赋能千行百业的若干措施》等政策文件,带动重点地市陆续出台了相关政策,体系化地布局人工智能的工作,打造了算力平台、省实验室、高水平创新研究院、开放创新平台等各类科技创新的载体,布局了四批次人工智能重大专项,在金融、教育、医疗、安防、交通等若干领域推出了一批场景示范应用。在2023年全省人工智能核心产业规模达到1800亿元,位居国内第一方阵,形成了涵盖基础层、技术层、应用层的完整产业链,培育11个省级人工智能产业园,拥有人工智能企业超过1000家,已形成了以广州、深圳为主引擎,珠三角其他城市为核心,粤东西北各地市协同联动的人工智能产业区域发展格局。广东通过鹏城实验室、琶洲实验室等国家级研发机构,联动互联网头部企业和广州数字科技集团等国企中坚力量,围绕落实省委“1310”具体部署,正在全力打造全国AI强省、全球AI先锋示范区。
具体到数据中心领域,2020年6月,经广东省人民政府同意,广东省工信厅发布《广东省5G基站和数据中心总体布局规划(2021-2025年)》,按照“双核九中心”的总体布局,全省将形成广州、深圳两个低时延数据中心核心区和汕头、韶关、梅州、惠州、汕尾、湛江、肇庆、清远、云浮九个数据中心集聚区。从当时的产业发展、土地存储、电力配置、地理位置等综合情况来看,这份“双核九中心”总体布局比较符合广东实际,多个地市摩拳擦掌,意欲大干一场。但是还没等到这个布局全面铺开,次年 5 月,国家“东数西算 ”政策出台,广东迅速调整政策方向,与中央要求严格保持一致,即便国家文件指出粤港澳大湾区“原则上布局不超过两个集群”,广东仍然只选择在韶关设立惟一集群。与此比照,长三角枢纽、成渝枢纽则充分用足了国家政策,各自设立了两个集群,分别是芜湖集群、长三角生态绿色一体化发展示范区集群和天府集群、重庆集群。多位不愿具名的珠三角业内人士提议:粤港澳大湾区枢纽能否像长三角、成渝枢纽一样也设立两个集群,或者是一个韶关“主集群”,另外在广州、深圳的交接地带,如惠州或东莞设立一个“副集群”。比如粤港澳大湾区(惠州)数据产业园地理位置优越,毗邻机场、核电站,便于对接深圳、广州AI数据产业。
上文提到,在2024年1~10月,广东涌现了23个智算中心,它们分布在八个地市,分别是:广州八个、深圳八个、韶关两个、东莞一个、惠州一个、佛山一个、珠海一个、梅州一个。这个呈现与2020年“双核九中心”的总体布局大体上惊人的一致。在一些经济学者看来,广东当年坚定地设立韶关惟一集群,也有出于产业扶贫、推动粤东西北与珠三角协同发展的考虑。从最新网络公开数据来看,昔日的“工业重镇”韶关虽然在2021年迎来了改革开放之后“对韶关市最利好的扶持政策”,但政策效果还需要更长的时间才能得到体现。2023年,韶关GDP增速为4.6%,低于全省4.8%增速,2024年前三季度增速不到3%,仍然低于全省平均水平。被寄予厚望的韶关还留有充沛的发展后劲。
打破“珠三角经济活跃带”与粤北“韶关数据中心集群”之间这个“前店后厂”战略均衡态势的,除了“双核九中心”的产业固态力量,另一股力量是2022年底ChatGPT涌现而带来的AI智能井喷热潮。实事求是地说,任何人在此之前都很难精准预测这股热潮,我们需要跟上的是政策的弹性、市场主体的灵活度。正如牛顿力学适合宏观物体、低速运动,微观物体、高速运动需要量子力学和相对论一样,AI智能计算训练及推理呼唤智算中心,如能就近部署就是最优解,尤其是针对智算推理。ChatGPT模型从GPT-1、GPT-2到GPT-3的迭代过程中,参数量从1.17亿增至1750亿,预训练数据量也从5GB增至45TB,这些数据的增加对算力的需求提出了更高的要求。GPT-4的诞生地就在美国爱荷华州的“AI超级计算数据中心”,是微软专为OpenAI提供的“训练场”。近期多位深圳业内人士向笔者表达了对韶关集群的真实看法:“不是不爱韶关,而是韶关距离深圳太远,时延耗不起,那地方也偏落后,即便智算中心建过去了,人过不去,产业过不去,还是空转。”
关于数据中心,有五个关键指标,分别是:规模、安全级别、能耗PUE值、上架率、时延,其中时延是衡量算力中心对外服务能力的“硬指标”。韶关电信智算中心专家2024年5月接受《南方日报》记者采访时介绍,在“城域网”层级,韶关网络数据与省内其他地市交互需通过广州、深圳绕转,而成为“国家网络骨干节点”后则减少绕转,一跳直达粤港澳大湾区各城市,进一步降低网络时延。目前电信已建成“韶关-广州-深圳”的超高速400G全光运力网,实现到广州传输时延1.7毫秒,到深圳传输时延1.9毫秒。移动、联通的骨干运营网也将在年内建成。届时,与大湾区物理时空上有200~300公里距离的韶关将实现到大湾区各市数据传输时延三毫秒、省内其他地市五毫秒以内,到全国其他枢纽中心、主要省会城市传输时延也将缩小至20毫秒以内。对此,有深圳业内人士表达了不同意见,认为这些指标均为理论值,实际情况下的时延将要延长数倍,而且不少数据传输到智算中心运算后还要返回出发地,也就是说时延要计算两倍。这位业内人士指出,智能计算推理和金融、证券、工业互联网、自动驾驶等各种实时算力必须低时延需求,以一辆时速80公里的自动驾驶汽车为例,每毫秒移动的距离是80×1000÷3600÷1000=0.022米,即2.2厘米,以3毫秒时延为例,就是6.6厘米,而如果再算上往返时延,这很可能意味着交通事故,与乘客性命攸关。
需要说明的是,自动驾驶还涉及到单体智能和协同智能的问题。现在智能驾驶还是以单体智能为主、协同智能为辅的状态,包括传感、处理、判断、控制等进程,主要依赖智能车自身的能力,应急响应实时性不高的可预测的则由协同智能提供,如路线导航、前方情况告警等。未来道路的智能传感、边缘智算等方面提升了,那时协同智能比例大幅度提升,那么网络延迟问题更会成为要关注的因素。
2024年被称为低空经济元年,无人机、直升机和eVTOL(电动垂直起降飞行器)的时速比汽车要快上几倍。以珠三角城市惠州为例,2024年5月印发了《惠州市推动低空经济高质量发展行动方案(2024-2026)》,明确“建设完善多层次的算力供给体系,满足规模化低空飞行中异构、高密度、高频次和高复杂度的感知需求”。
同时,我们也注意到,韶关干部群众秉承“脚上有土,心中有谱”的实干精神,联动各相关企业,在数据中心建设方面呈现了好的开局。目前,已有22个数据中心(算力中心)项目签约落户,总投资621亿元,建设超54万标准机架。
智算中心热火朝天局面的背后,
是高端专业人才的短缺
党的二十届三中全会特别强调“必须深入实施科教兴国战略、人才强国战略、创新驱动发展战略”。科技是第一生产力,创新是第一动力,人才是第一资源,高素质人才对实现高水平科技自立自强,推动经济高质量发展,培育新质生产力,具有重大意义。推动中国智算中心建设,人才是重中之重。对此,笔者深有体会。
2021年5月,国家“东数西算 ”政策出台,粤北边城韶关,瞬间从“默默无闻”变成了万众瞩目之地。韶关能有机会承载国家重大战略,与韶关市地理、气候、交通等以及工业时代积累等综合优势分不开,也与历任市委市政府主要负责同志一张蓝图绘到底的务实创新作风分不开。
消息传来,不少朋友表扬笔者“眼光独特”“中大彩了”,为什么呢?因为在“东数西算”战略出台之前,韶关市的第一个数据中心落地项目——华韶数据谷,是笔者联合专家团队、带领工作小组发起建设的。在2016年受当时的广东省大数据局委托,当时还在南方报业传媒集团工作的笔者,组织举办广东省首届大数据应用及产业发展大会,邀请中国工程院院士、现鹏城实验室主任高文和国家信息化专家咨询委员会常务副主任周宏仁等知名专家主题演讲,与会领导、专家传递给了我一个学术信息:数据存储处理、数据中心建设很重要,是大数据时代的底座和基石。经两年时间酝酿、准备,团队于2019年初以云润研究院为主体正式向韶关市政府正式递交建设方案,当年5月与市政府签订建设华韶数据谷战略协议,9月动工建设,规划建设五万个标准机柜,总投资65亿元。至2020年4月顺利完成第一阶段工作,笔者也圆满完成了项目首任总经理的任务。目前在项目一期IDC01号数据中心内,已投运2736个高功率机架(5KW及6KW)。业内公认,华韶数据谷的立项、开工、建设、运营,对于韶关数据中心集群后来的成功申请、顺利建设,具有火车头式的拉动意义。笔者也很荣幸当了一回“火车司机”,当然指挥员不是笔者,是广东省省主管部门负责人和韶关市市委市政府领导。华韶数据谷的成功模式还辐射到重庆,2024年5月重庆华韶智算中心一期开工仪式在重庆市大渡口区举行,项目预计2025年上半年投产,总规划建设五万个8KW机柜,总投资100亿元,这些项目的规划建设得到了珠三角民营资本的鼎力支持。
笔者在韶关负责华韶数据谷项目时,一个很大的苦恼就是招不到优秀的员工,即便是开出不低于深圳、广州的薪水,也招不到足够多的人才,即便招入,也呆不久,他们抱怨缺乏同行交流氛围。《中国科学报》2024年9月的一篇报道指出了同样的症结。智算集群和超算类似,本质上都是并行计算程序,其特点是所有计算单元要同步运行,如果其中一个计算节点或通信模块出现故障,整个程序就会失灵,训练任务就会中断。这就要求在系统搭建之初不能有任何软件或技术上的问题,必须把每一件事都做到极致,才有可能达到尽可能高的系统稳定性。这些技术细节决定算力集群的建设、运维和应用等环节,高度依赖专业运维和技术队伍。在中国计算机学会副理事长陈健看来,热火朝天部署智算中心的背后,恰恰是专业人才的短缺,全国范围内能称得上顶尖的一站式计算服务团队的数量,“两只手数得过来”。
笔者近期与广东省粤有数专委会、广东数字政府研究院、华南师范大学政治与公共管理学院专家团队在深圳易信智算中心现场调研时,看到该中心通过自有知识产权的液冷技术,实现了芯片总价值超几千万元的50KW单机柜长时间安全运转,笔者紧紧地握住了该中心技术负责人刘和军7的手,同行朋友说我那一刻“两眼放光”。
智算中心表面上存放的是“数”,干的是“算”事,但核心还是要依靠人、服务人、幸福人,要释放并激发人的创造性。如果让奥地利作家茨威格(Stefan Zweig)重写《人类群星闪耀时》,他应该会选一个AI智算题材。数字化时代,“人类命运共同体”这一重大命题愈发有价值。
建设有可信技术内涵、
借助AI提升创造力的增量型下一代智算中心
2024年11月,2024大湾区网络安全大会在广州举行,中国工程院院士、“可信计算之父”沈昌祥指出,ChatGPT开创了智能化应用新局面,但大模型继承深度学习模型的“黑盒子”特性叠加,加上高达百亿或千亿的复杂参数与神经网络结构,导致决策、推理过程难以被解释,由此埋下风险隐患,对人类社会带来不利影响。沈昌祥院士强调,中央“市场准入十条”(《关于完善市场准入制度的意见》)中的“自主可信计算”不是泛指可信计算技术,而是指源自中国、完全自主的可信计算技术。“完备的可信计算3.0产品链,将形成巨大的新型产业空间,”沈昌祥认为,服务器无处不在,无所不起作用,形成了巨大产业空间。
以国家电网调度系统安全防护建设为例,电力可信计算密码平台已在34个省级以上调度控制中心使用,覆盖上千套地级以上电网调度控制系统,涉及十几万个节点,约四万座变电站和一万座发电厂,有效抵御各种网络恶意攻击,确保电力调度系统安全运行。安全可信保障是发展人工智能的前提,需要构建主动免疫的人工智能安全产业空间,而这正是中国特色智算中心产业的精髓之所在。
著名区块链专家、赛迪研究院副总工程师、俄罗斯自然科学院外籍院士刘权也指出,数据要素价值化可递进为数据资源化、数据资产化、数据资本化三个层次,新型智算中心可以做活数据文章。在此,我们可以提出一个大胆设想,建设一个智算“淘宝”(实为“智算云中心”),把全国所有智算中心的资源在逻辑上集中起来,利用“弹性+可计量+可信”,向市场提供不同服务等级、不同安全等级、不同数据内涵的智算服务。这个设想如能做成,必将助力“加快形成全国一体化算力体系”。
中国工程院院士倪光南在2024年9月的一场公开活动中对智算也有过生动讲解:智算集群是一个复杂工程系统,而不是简单的软硬件的堆砌,它要求“3+1”算力体系,即算、存、运和服务的紧密协同。在更早之前的2018年,由云宏公司主办的“安全可靠的云计算关键技术产业发展研讨会”在广州南沙举行,笔者向倪光南院士请教AI能否完全取代人类的问题,他告诉笔者:“要区分普通人与天才,计算机通过数据积累、算力优势等,也许可以接近或超过普通人的智慧水准,但是能否超过天才,还不好说。类似爱因斯坦的天才,不要说机器,就是再多的普通人加在一起都很难超越。而且人类不只一个天才,在各个时期、各个领域都有。”
我们回望爱因斯坦(Albert Einstein)成长故事,他在16岁的时候就在思考,“一个人在封闭空间光速移动,他能在镜子里看到自己吗”,并以这个奇思怪想轰开了相对论的大门。而这个“光速移动”很显然是短时内基于过往资料的AI大模型所不能想象的,这正是人类智慧区别于当下人工智能的一大关键点。
AI时代,大量的重复性工作、信息聚合工作都会被机器取代,而创新性人才是永远不会被取代的。国家教育部部长怀进鹏在2024世界数字教育大会上介绍,我们将实施人工智能赋能行动,促进智能技术与教育教学(AI for Education)、科学研究(AI for Science)、社会(AI for Society)的深度融合,为学习型社会、智能教育和数字技术发展提供有效的行动支撑。我们要让AI帮助我们提升创造力,而不是让它来消磨我们的创造力,更不是简单地替代我们的体力劳动。的确,从现在开始,我们的校园教育、家庭教育,必须以“创新”为灵魂,我们必须以时不我待的紧迫感明白“创新”教育及氛围熏陶对我们教育体制、打造科技强国的重要性。世界潮流,浩浩荡荡,AI时代一些东西将被淘汰,一些新东西也将到来。尊重科技发展规律,矢志不渝地推进国家民族科技事业,坚守科技向善初心,我们势必能以昂扬、奋进的姿态屹立在世界东方。
显然,一个适度超前、挤掉过多泡沫,绿色低碳、高性能、安全可控,增量型、有可信技术等新内涵,瞄准低空经济等未来产业、生态伙伴互利互惠,融合“看得见的手”“看不见的手”力量的下一代全国智能计算中心集群及一体化算力体系,有助于这一宏伟目标的实现。
深圳比亚迪的电动汽车已经对欧美的燃油车进行了一次卓越的“弯道超车”,那么中国的智算中心能不能也来一次全球示范?
AI时代,
中国企业的突围与领跑机会
当下,我们深挖数据中心、智算中心的建设标准和流程,会有点懊恼地发现,底层逻辑是欧美人设立的。更不用说ChatGPT是一个不折不扣的英文名,每一次笔者向退休在老家的老父亲讲解这个东西时都不是太顺口。深入剖析近年来全球科技发展轨迹,发现美国大约每隔15年就会产生一项重要的划时代发明,引领全球产业变革,一般认为这是美国综合科技实力、人才优势、金融体制的集中体现。以下以最近30年为例:
——1993年9月,时任美国总统克林顿(Bill Clinton)提出了“信息高速公路计划”。次年即1994年4月,中国全功能接入国际互联网。这代表了PC互联网时代的到来。
——2007年1月,美国苹果公司发布首款iPhone。由此掀开了移动互联网的大幕。
——2022年11月,美国OpenAI公司推出聊天机器人程序ChatGPT。不少学者认为这代表了第四次工业革命的开启,AI一举登堂入室,成了与蒸汽机、电力、原子能技术和电子计算机等相提并论的重要发明。这个时间周期还穿插了马斯克(Elon Musk)SpaceX星舰四次试飞、2009年初比特币出世等重大科技创新事件。
“李约瑟之问”至今仍让我们振耳发聩,新时期我们可以思考,前三次工业革命主要起源于英国、欧美、美国,正在进行中的第四次工业革命美国还是策源地,第五次、第六次工业革命又会以哪里为中心呢?面对当下美国科技领跑优势,我们应该怎么办?
对于这个问题,有一段时间,笔者有些茫然。但冷静下来后经过反复思考,笔者发现了“3+12时间周期规律”。在2024年3月于深圳市一家国家级高端智库举行的研讨会上,笔者介绍了这一规律,并提出原创“LY-AI发展曲线”,引起了与会人员的强烈反响。在15年时间周期内,前面三年美国企业有先发、光环效应,优势明显;但在后面的12年时间,中国企业可以充分发挥工业产业门类齐全、用户数量巨大、执行力强等优势,将应用端文章做好做漂亮。以移动互联网领域为例,美国企业有先发优势,但中国华为公司积极参与全球3G、4G、5G技术标准制定,TikTok也已成为美国移动用户热门应用。多项技术参数表明,中国多个大模型的核心参数接近或局部超过ChatGPT、SORA。需要说明的是,美国各项重大科技发明,是全球各国各地区人才的共同智慧结晶,有公开资料表明,ChatGPT主创人员超过1 /10为华人;英伟达创始人黄仁勋为中国台湾籍,九岁时赴美。不少美国企业素有开源的传统,在尊重知识产权的前提下,全球企业可以共享科技成果。
中国的科研人员、企业家能否主导下一个周期的全球科技创新?有这个可能,而且趋势越来越明显。笔者认为,下一个15年周期估计在2039年前后,预计与量子信息、可控核聚变有关;再下一个15年周期估计在2053年前后,预计与人类移民星球、生物基因技术有关。在这些领域的多个环节,我国有不输于其他任何国家的尖端实力。而2053年时间周期与我国第二个百年计划时间重叠,我们认为,中国人原创的重大科技发明,将大大助力中华民族伟大复兴。
中央领导高度重视科技高端人才的重要性,强调“加快建设世界重要人才中心和创新高地”。这是抓住了科技发展的牛鼻子,表面上AI的关键是算力、数据、算法,内核其实是人才。
2023年12月,我国外交部发言人面对外国记者的提问,回应了一句得体且富有东方智慧的话语,请允许笔者借用这句话,作为本文的结束语——不合作是最大的风险,不发展是最大的不安全。
[本文作者蓝云为云宏研究院执行院长、教授、中国体改会互联网与新经济专委会特约研究员;耿燕为广东省科技合作研究促进中心资源平台部部长、副研究员;罗培培、彭都对本文亦有贡献]
·对于来源于《环球财经》杂志的内容,《环球财经》杂志社保留对相关内容的全部权利。
·对标明来源的其他媒体信息,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。其他媒体、网站或个人转载使用时必须保留本站注明的文章来源,并自负法律责任。