在幅员辽阔的华夏大地上,中国人一直执着于各种“网络”的建设。
到二十一世纪的今天,中国已建成全球规模最大的高速公路网、全球最发达的高铁网、全球规模最大的电力网、全球规模最大的通信网……这些纵横交错的网络推动着资源和要素在国内高效流通,也为建设全国统一大市场打下坚实基础。
随着中国迈入数字经济时代,数据成为新的生产资料,算力成为新的生产力。伴随而来的,人工智能计算中心、超算中心、一体化大数据中心算力枢纽等算力设施如雨后春笋般涌现。
但与此同时,国内也存在着算力资源配置不均、数据流通效率有待提升、单点算力存在极限等问题。如何更好地汇聚和共享算力、数据、算法资源?建设全国统一的算力网络和算力大市场成为大势所趋。
今年6月中国算力网——智算网络一期已正式开始落地,至今已有10余个城市节点相继接入中国算力网。而在数字经济的浪潮下,中国这个算力大国如何才能建设好、使用好、发展好算力网络?
华为公司副总裁、计算产品线总裁邓泰华在2022中国算力大会上提出了四个关键要素:一要算力为本,AI先行;二要应用驱动,大模型使能;三要自主创新,持续突破基础软硬件;四要生态协同,产业共建。
AI算力成为未来算力的主要增量
“算力为本,AI先行”。算力作为人工智能的三要素之一,已成为人工智能产业化进一步发展的关键。
中国信通院数据显示,2016年-2020年,中国智能算力占比由3%提升至41%,预计到2023年,新增算力中AI算力将达到70-80%,成为未来算力的主要增量。华为也曾在《智能世界2030》报告中指出,未来10年,通用算力增长10倍,而人工智能算力将增长500倍。
AI复杂模型、复杂场景的计算需求进一步催生了面向AI的算力基础设施的需求,以计算中心为代表的人工智能算力基础设施发展迅猛,数据中心智能化升级步伐不断提速,计算智能化升级已是大势所趋。
2020年10月,科技部中信所发布《人工智能计算中心发展白皮书》,创新性提出“一中心、四平台”的指导思想:以人工智能计算中心为主体,提供公共算力服务平台、应用创新孵化平台、产业聚合发展平台和科研创新人才培养平台。
在此契机下,过去一年多,采用昇腾AI基础软硬件平台的人工智能计算中心,在全国二十多个城市陆续建设,旨在让AI算力像水和电一样成为城市公共基础资源。已上线投运的人工智能计算中心,全部实现上线即饱和运营。
随着各地人工智能计算中心陆续建成,搭建一张人工智能算力网络也成为必然。
武汉人工智能计算中心
2021年9月,中国科学技术信息研究所、新一代人工智能产业技术创新战略联盟、鹏城实验室,联合发布《人工智能计算中心发展白皮书2.0——从人工智能计算中心走向人工智能算力网络》。通过算力网络将各地的人工智能计算中心连接成网,以“一网络”实现算力汇聚、数据汇聚、生态汇聚。
“像建设电网一样建设国家算力网,像运营互联网一样运营算力网,让用户像用电一样使用算力服务。”今年5月底,鹏城实验室的“中国算力网(China Computing NET,C²NET)”计划首次公开。
到了6月,全球首创的中国算力网—智算网络一期正式上线。智算网络就是把当前各地独立建设人工智能计算中心,通过连成一张网,实现最大化数据流通共享,再基于各个地方共享的算力资源,提供更高效的算力开发方案。
按照规划,未来各地人工智能计算中心、超算中心、“东数西算”枢纽节点等,都可以并入中国算力网,形成支撑数字经济发展的统一算力大市场。
随着济南、青岛、武汉三大节点近日正式接入中国算力网,全国算力一张网的整体布局正在加快发展,迈入新阶段。
中国算力网新增济南、青岛、武汉三大节点
从科研创新到产业落地,大模型使能作用日益凸显
“应用驱动,大模型使能”。
在推动人工智能产业化的进程中,建设人工智能计算中心只是第一步,还需要进一步通过应用落地,驱动与创造产业价值。而这其中,大模型的使能角色尤为关键。
在当前的人工智能领域,大模型的泛化能力强、模型效果更优等特征助力其成为AI开发新范式,也是现阶段AI市场发展的必然趋势。而算力网络汇聚了大算力和大数据,对大模型训练来说是天然有利的条件,也为孵化新应用带来了新机遇。
目前,大力投入大模型研发和落地的厂商以大型云服务商为主。
例如,百度智能云“文心大模型”,包括了NLP大模型、CV大模型以及跨模态大模型,其特色在于注重跨模态技术研发,融入海量知识进行知识增强,应用场景广泛且落地实践丰富。
在大模型领域,华为强调强泛化能力、模型精度的提升以及研发成本的降低。为了更好使能大模型发展,华为推出从规划、开发到产业化的大模型全流程使能体系。该体系包括:建立大模型沙盘,规划并牵引产业界真正需要的大模型;推出大模型开发使能平台,让开发者能够快速完成大模型开发;在大模型训练出来后,携手业界伙伴共建大模型产业联盟,让更多伙伴基于大模型进行场景化方案联创,实现产业化推广。
过去一年,产业界基于昇腾AI先后推出一系列有影响力的大模型,如华为云盘古系列大模型,NLP领域的鹏程.盘古、生物制药领域的鹏程.神农和多模态领域紫东.太初等大模型。
对于大模型来说,最关键的无疑还是产业化落地。去年底,基于全球首个智能遥感框架武汉.Luojia和全球首个三模态大模型紫东.太初,华为携手伙伴成立了智能遥感开源生态联盟和多模态人工智能产业联盟,陆续孵化了多个行业解决方案。
更重要的是,在大模型产业化落地过程中,产生的更丰富的数据和参数和应用场景,可以反哺大模型基础能力,让大模型更智能、场景适用性更好,进而对行业应用提供更大的支持,形成大模型创新到应用再到持续创新的产业正循环。
万物根生,创新是持续突破之本
从人工智能计算中心到算力网络,再到最终的应用落地,无疑都离不开底层技术的支撑。
有研究表明,技术发展有着与生命演化类似的特征。在地球适宜的环境下,生命进化是一个多样分化过程,每种生物在“生命之树”上繁盛演变。
技术也是如此,每一个产业领域,都对应着一个或多个“技术树”。整个人类社会就是建筑于巨大的、持续扩展的“技术森林”之中。
“向上捅破天,向下扎到根”,是华为创始人任正非对员工的要求。他曾形象地说道:“根不强是不行的,根扎不深,树是不稳的,万一刮台风呢?”凸显出他对根技术的看重。
所谓根技术,是那些能够衍生出并支撑着一个或多个技术簇的技术。根技术是技术树之根,持续为整个技术树提供着滋养,在很大程度上决定着技术树的荣枯。
历史和现实都告诉人们,如果不能拥有足够数量的根技术和根干产业,一个国家的经济发展和科技创新必然会遭遇“天花板”,被人“卡脖子”“卡脑子”。
华为持续聚焦计算根技术创新,已推出鲲鹏、昇腾、欧拉操作系统、openGauss数据库、昇思MindSpore AI框架等一系列软硬件,并打造面向通用计算的鲲鹏计算产业和面向AI计算的昇腾计算产业,为算力网络构建了坚实根基。
目前,鲲鹏、昇腾计算产业已经有超过4700家伙伴,推出超过12000个行业解决方案,在行业核心场景规模应用。在通用计算领域,鲲鹏行业技术生态满足度持续提升,今年预计将达到65%,主流场景都已经支持,软件生态兼容性的瓶颈已经消除。在人工智能领域,昇腾的行业典型应用场景适配率超过50%,已经成为大模型开发的首选平台。
在操作系统领域,欧拉开源操作系统项目已经于去年底正式捐赠给开放原子开源基金会。欧拉正在成为多样性计算首选的开源操作系统。截至今年6月,整个欧拉系的装机量累计超过170万套,新增市场份额达到19%,预计今年底将达到25%,明年将成为中国新增市场份额第一。
在数据库领域,已有130多家企业和机构加入openGauss开源社区,3500多名开发者参与社区贡献,openGauss社区版本下载量达到80多万次,已经在金融、政府、电信、能源、制造、交通等行业核心业务中规模商用。
2020年3月,昇思MindSpore AI框架开源,并逐渐发展为国内最活跃的AI开源社区。目前已经吸引5500多名社区贡献者,版本下载量超过200万。
算力时代,生态协同,产业共建是关键
在国家政策的引领以及行业数字化转型的内生动力推动下,新计算时代正悄然来临。
据中国信息通信研究院测算,截至2021年底,我国算力核心产业规模已超过1.5万亿元,关联产业规模超过8万亿元。
“一花独放不是春,百花齐放春满园”。算力发展,生态协同、产业共建无疑是关键。
面向数万家合作伙伴,华为先后推出鲲鹏展翅伙伴计划、昇腾万里伙伴计划、欧拉扬帆伙伴计划,通过整合华为的技术、品牌资源,为合作伙伴共享商机和利益,助力合作伙伴与华为联合打造解决方案,促进商业成功。
在技术开发方面,已经有鲲鹏、昇腾基础软硬件平台等由中国企业主导的算力基础设施底座,也不乏昇思MindSpore、百度飞桨(PaddlePaddle)、清华计图(Jittor)等AI深度学习框架,而最紧缺的恰恰是AI开发者生态。
面向开发者,华为通过鲲鹏、昇腾“众智计划”、应用创新大赛、开发者创享日等系列活动,为开发者提供交流、实践、创新的平台,与开发者共创计算产业的未来,共享非凡成长。
今年的鲲鹏、昇腾众智计划将新增3.6亿元激励基金,发布4000多个相关课题,汇聚开发者智慧,引领产业创新。
人工智能和算力网络的发展,离不开开发者队伍的壮大,更离不开人才的培养。就像国家多项政策中所提到的,要做到科技自主,人才是重中之重。
人社部2020年4月发布的报告显示,中美AI人才数量差距悬殊,我国AI人才缺口超过500万,国内供求比例为1:10,供需比例严重失衡。如果不加强人才培养,采取“规模化生产”的人才模式,到2025年人才缺口将会突破1000万。
加强计算产业人才培养,补齐人才短板,显然已成为中国的当务之急。
昇腾支持BPAA第二届应用算法实践典范大赛
面向高校人才,华为持续强化教育部-华为共同发起的“智能基座”产教融合协同育人基地项目,助力高校开展教学改革,从建设新课程、落实新实践以及探索教学新模式等方面,培养计算产业的创新人才。
未来三年,华为还计划发展万家合作伙伴,600万开发者,300万高校人才,与生态伙伴和开发者共同努力,推进鲲鹏、昇腾计算产业的高质量发展。