明代画家邹之麟,曾于黄公望创作的《富春山居图》上题跋:“置之枕籍,以卧以起;陈之座右,以食以饮;倦为之爽,闷为之欢,醉为之醒。”
其大概的释义,为藏主将《富春山居图》盯得太紧,以至于要将其放在座榻和枕边,每天在其陪伴下寝食,连精神也变得清爽、愉悦起来。后代画家对这幅旷世奇作的推崇,由此可见一斑。
不幸的是,清顺治七年,画卷遭火焚后分为两段,前半卷被另行装裱,重新定名为《富春山居图·剩山图》,现藏浙江省博物馆;后段世称《富春山居图·无用师卷》,现藏台北故宫博物院。
浙江博物馆馆藏《富春山居图·剩山图》局部(左),台北故宫博物院馆藏《富春山居图·无用师卷》局部(右)
历史上,这两个部分只在2011年合璧过一次,对诸多久闻《富春山居图》雅名的人来说,要想见到完整的山川景色,可谓比登天还难。
也正因此,7月21日的2022百度世界大会上,基于AI补全的《富春山居图》在现场展出后,如一颗彩蛋空降,顿时攫获了场内外振奋的视线。
AI修复,这个词在外人听来,或许有些费劲,然而与其相关的成果,早已渗透到当下文娱生活的内壁。
AI无缝补全《富春山居图》
刚在7月初刷屏的Beyond高清修复演唱会,和此前张国荣《热·情》演唱会的修复,都拜AI算法所赐;去年,央视动漫携手上海美术电影制片厂,修复了《哪吒传奇》《葫芦兄弟》《黑猫警长》等多部经典动画,使其清晰度跃升到4K水平;在国外,好莱坞名导彼得·杰克逊也曾应用顶尖修复、上色及3D 技术,还原一战老兵们在炼狱挣扎的苦难和风采。
需要指出的是,AI模型的训练和完善并非小工程。通常情况下,原片的年代间隔越久,缺损越多,修复也就越富于挑战性。
此外,理想的修复效果,绝不是一味追求 “高清”抑或“饱和度”,还应秉承“修旧如旧”的原则,才能忠于作品的本来样貌,好让修补的痕迹与周围衔接自然,以求“天然去雕饰”。
在这点上,通过AI技术手段补全的《富春山居图》是如何做到的?
01
指尖轻绘,连接山河
专业的观画,必要先从作者生活的地域、环境说起。距今六百多年前,元代画坛宗师、“元四家”之首黄公望踏遍杭州富春江沿岸,以其传神的水墨技法,倾注毕生心血,创作了日后被誉为 “中国十大传世名画”之一的《富春山居图》。
彼时,山水画开始走出宫廷,追求意象上的自由灵动。除了形式创新外,无数和黄公望类似的文人、士大夫,由于仕途黯淡,衔冤入狱,潦倒大半生仍一无所获,唯有寄情于山水,来抒发诗意栖居的愿望,进而让绘画多了几分辽阔的风骨和境界。
百度这次AI补全的初衷,正是为了让《富春山居图》的两个部分,间隔多年后再次“合璧”,焕活凝结在其间的古朴雅趣,定格住令无数国人魂牵梦绕的江南。
放眼当下的文物修复界,AI科技的介入谈不上多新鲜。光是近年来,类似的报道和样本每隔上阵子,就会摆到人们眼前。然而同样的整容术,却在还原后的《富春山居图》全卷中收获了崭新定义,缘何?
首先在于补笔的难度上,众所周知,像《富春山居图》这等“国宝级”地位的名画,由于作家风格印记之突出,质地、色泽和纹路之精细,若要提升临摹的准确性和平衡感,得耗费大量心血。
另一重限制,在于《富春山居图》为孤本,“如何通过一幅图去学习80多岁的黄公望做中国名画,他的笔触,如何去处理山水建筑的关系,其实对模型的挑战非常大。”参与此次AI修复工作的百度技术人员介绍说。
百度技术人员开发过程
技术团队的解决方案,是对整幅图进行深度“扫描”,将其尽可能切割成更多的小单元,接着把每个单元都当成一册样本书,给到预先训练好的AI模型,让后者去研究其中蕴藏的海量细节,以确保最终的呈现尽可能接近原作。
事实证明,如此用心的校准和调试并没有白费。从蜿蜒的林峦,到浩渺的水波,补全后的《富春山居图》,成色几可媲美人工精修,并且实现了高清的输出,和以往清晰度欠奉的修复画作比起来,就算投影到会场的大屏上,也丝毫不露怯。
对于重获新生的残卷,黄公望纪念馆的负责人毛传镔评价道:“与现存真迹风格一致,使两岸画卷走出博物馆实现了合璧,光线风格统一,山水脉络和谐,不仅符合原画审美特点,视觉上还同样具有观赏价值。”
而这,还不是整个修复过程最大的亮点。
过往的书画文物修复,多要假匠人抑或高科技之手,大众则被挡在艺术的殿宇外。针对《富春山居图》缺失的部分,为增强用户体验感,百度特别上线了“虚拟修复”的板块,只要通过H5在画卷留白处勾勒几笔,系统便能在不到1秒内,结合用户的线条轨迹,和黄公望先生的笔法,自动“补全”画卷。
只需轻轻勾勒几笔,AI自动“补全”画卷。
如此一来,不论绘画“老手”还是“小白”,都能零门槛助力《富春山居图》合璧。这种沉浸、共建式参与所承载的,既是每个人对名画的珍视,对富春富阳之美由衷的欣赏,还有对祖国早日统一、两岸团圆的美好祈愿。
于指尖处,谱写山河风韵,见证数百年传奇的归位。
02
文心匠意,生而不同
如前文所说,名画修复质量的提升,离不开AI技术的高速发展。在目睹《富春山居图》中灵秀的山水,以罕见的缜密度被连接起来的同时,人们也注意到了背后的连接器——由百度倾力打造的飞桨文心大模型。
在了解这项突破性的成果前,有必要先回溯下“大模型”成为AI行业新高地的背景。过去十年,随着AlphaGo与人类的世纪大战、面部解锁功能普及等热点频出,如何将AI技术推向高度工业化、标准化,成了万千从业者思考的重点。
以此为驱动,着眼于应对各行业复杂、多变的现实境况,和进一步拓展AI落地潜能的需求,具有“巨量数据、巨量算力、巨量算法”特性的AI大模型应运而生。
文心大模型全景图:由模型层、工具与平台层和大模型创意与探索社区构成
AI大模型,指的其实是预训练大模型,打个形象的比喻,就像电脑里的CPU,抑或控制人体活动的大脑神经元,依靠数据作为养料,来发出准确的操作指令,从而提高AI的业务适配能力。
换言之,要想让AI打破专业壁垒,助力每一个企业、每一个组织、每一个普通人“脱非入欧”,共享技术的便捷和红利,大模型乃必要的战略基础设施。
有了这样的前提,便不难理解百度为何要持续加码AI大模型。身为中国AI的领头雁,早从2010年开始,百度便大举发力AI,研发投入呈现逐年递增趋势,2020年百度研发投入强度位列民营企业500强第一,由此带来了丰厚的技术沉淀。其中,飞桨作为我国首个自主研发、功能丰富、开源开放的深度学习平台,为大模型搭建提供了支撑的底座。
抛开外部环境的影响,从企业自身的研发侧重点来看,百度又有着迥异于同行的追求。
传统的AI大模型竞赛,更多聚焦在参数规模的量级上,通过给模型投喂海量大数据,加深其对文本规律的掌握。然而将目光拉得长远些,这种填鸭式的输入习惯,对大模型理解力和创造、发散性思维的锻炼,并无多少促进作用。
反观百度的做法,则是避开参数“内卷”的漩涡,转而集中练好“内功”。具体来说,即为融合通用数据和行业特有知识,提升大模型在行业任务上的应用效果,实现从“信息获取”到“知识增强”的进化。
百度AI数字人希加加在百度世界大会现场作画
在这一理念路径的指导下,百度自2011年开始研发知识图谱技术;于2019年加入了深耕预训练模型研发的队列,并在该年3月率先发布中国首个正式开放的预训练模型ERNIE1.0;又在去年12月联合鹏城实验室,发布了基于飞桨深度学习框架训练出来的知识增强千亿大模型“鹏城-百度·文心”。
其中,“文心”二字,取自南朝文学家刘勰的《文心雕龙·序志》,扣准了与行业其他大模型相比,飞桨文心大模型在语义理解、与产业场景深度结合上的核心技术优势。
作为一项浩大的系统工程,此番创举撑开的蓝图是明确的:通过文心(ERNIE)的持续学习,为计算机带来认知智能领域的巨大跨越,全面释放大模型的效能。譬如支持全民参与的《富春山居图》补全,便是基于视觉大模型对艺术语料的转化来完成的。
纵观AI大模型的应用和落地现状,这还只是个极小的剖面。
03
AI开发,踏上新征程
今年5月的WAVE SUMMIT深度学习开发者峰会上,百度提出了支撑大模型产业落地的三个关键路径:建设更适配场景需求的大模型体系,提供全流程支持应用落地的工具、平台和方法,建设激发创新的开放生态。
就执行效果而言,三者内在遵循的逻辑是相通的,也即让各行各业都能汲取现存的AI研发经验,用来拉动生产,正如百度创始人、董事长兼CEO李彦宏去年在百度Create大会上所讲:“未来十年,AI会成为改变世界的有力工具,千行百业被重构,人们的生存空间将大大拓展,技术的价值将被充分开发。”
如果将AI理解成一片亟待开垦的沃土,知识增强大模型的诞生,则像是这片土地上最新的硕果。而其与真实场景的匹配,也让所谓的“AI产业化”,不再仅是句空泛的口号。
与之呼应的,是2022百度世界大会的主题“AI深耕,万物生长”。寥寥几个字,浓缩了技术“由虚向实”的演变,和从PGC、UGC到AIGC(AI Generated Content,人工智能自主生产内容)的生产方式进阶。
不可否认,对多数普通人而言,AIGC在发展的初期,势必伴随着一系列问号,譬如“强人工智能”到来,是否意味着部分岗位被取代、失业率上涨等等。
但在百度看来,所谓的AI和人才之争,绝不该交由简单的二元论裁定。而科技从不意味着冷冰冰的代码和链接,也可以是有温度、活色生香的,能为人们构筑起舒适的工作环境。文心大模型的出现,正是为了开掘类似的可能性。
目前,除了扎根“AI作画”领域,文心大模型已大规模应用于搜索、信息流、智能音箱等互联网产品,嵌入到工业、能源、金融、通信、媒体、教育等各行各业。伴随先进的生产要素不断汇聚,和“行业大模型”、AI商业化相关的讨论日益火热。在2022世界大会上,百度还发布了全球首个航天大模型,攻下了大模型领域一块重要的阵地。
文心大模型为《富春山居图》题诗
在用户端,与“《富春山居图》补全”共创开放精神相呼应的是,百度前段时间还推出了基于文心大模型的创意社区——文心·旸谷社区,只要搜索“文心大模型”,即可进入官网,透过AI生成歌词等玩法,零距离感受到文心大模型的魅力和应用创新潜力。
而不论对各个头部行业的扶持,还是和用户的平等对话,其最终指向的目标,都是降低AI应用门槛,让飞桨、文心大模型生态的繁荣惠泽全民。
将这些光环与百度的发展相对应,可以发现,正是成长性的思维作风,在围绕AI大模型的竞争,日渐被功利化观念所熏染时,保持着冷静而谦卑的态度,为百度照亮了一方广阔天地,使其总能率先吹响技术升级的号角,让开发者们不再“望大模型而兴叹”。
怀抱着“用科技让复杂的世界更简单”的价值主张,百度在AI这条路上的探索永不会停歇,就像人们对“智能生活”热情的描绘,也才刚刚开了个头。
如侵删。