“大模型时代会带来三大产业机会:新型云计算、行业模型精调、应用开发。客户和伙伴无论希望在哪个方向加大投入,百度智能云都能提供所需的可靠服务,包括有文心千帆大模型服务平台、 百度AI大底座等。”5月18日,百度集团副总裁袁佛玉在“2023百度智能云合作伙伴大会”上表示,“企业会发现,基于百度智能云去开发AI的应用和能力,效率更高、性能更好、更方便、价格成本还更低”
袁佛玉进一步解释道,“百度是全球唯一在芯片、框架、模型和应用这四层进行全栈布局的人工智能公司。四层架构都有的优势是可以对每一层都进行优化,层和层之间还可以相互优化,这使得我们可以获得的效率提升和成本下降的空间是独一无二的。如果你只能够优化其中的一层,那你获得的优化空间是有限的。但如果四层都可以端到端优化,这个效率的提升会大得多。
正是基于这四层架构,百度智能云成为国内第一个训练出生成式大语言模型的云。而且,文心一言在过去的一段时间里进化和迭代速度非常快。据介绍,3月启动内测以来不到2个月,文心一言已完成4次技术版本升级,大模型推理成本降为原来的十分之一。
“所以,百度智能云有信心在大模型时代为我们的客户和伙伴提供更有竞争力,更有吸引力的服务。”袁佛玉说。
文心千帆是全球首个一站式的企业级大模型生产平台,主要提供两种服务:第一以文心一言为核心提供大模型服务,帮助客户改造产品和生产流程。第二,企业可以在文心千帆上基于任何开源或闭源的大模型,开发自己的专属大模型。文心千帆还提供大模型开发和应用的整套工具链。简单来说,企业想使用大模型,在文心千帆大模型平台可以一站解决。
百度AI大底座是基于四层框架优势打造的国内首个全栈自研的AI基础设施,面向企业AI开发提供端到端的解决方案,可以帮助企业构建更高效的模型,持续调优性能,并显著降低成本。数据显示千卡加速比达到90%,资源利用率达到70%,开发效率提升100%。
袁佛玉强调,百度是国内唯一将大模型在实际应用中大规模落地的企业。“很多大模型还停留在理论阶段,还停留在传播阶段时候,百度已经拥有很多真实的落地经验。未来在客户实际应用落地的过程中,它是非常有价值的。”
“在过去的两个月,已经有超过300家的产业生态伙伴和百度智能云一起在超过400个真实的产业场景里面进行研发测试,这些场景包括智能客服、办公提效、数字人、知识管理、图文创作、图象识别、程序生成和分析等等。”袁佛玉说,“我们欢迎更多的产业伙伴加入,成为百度智能云文心千帆的伙伴,和我们一起推动大模型在产业的落地生根。”
以下为袁佛玉演讲实录:
百度最亲爱的、最尊贵的伙伴和客户,我们现场所有的朋友和嘉宾,大家下午好!热烈地欢迎大家来到合作伙伴大会的现场。我们正在一起经历可能是有史以来最大的一次创新的机会,平台级的机会,也就是生成式AI的机会。
因为大模型和生成式AI技术的突破,全球人工智能进入了产业落地的爆发期。我们看到这次所有的企业、行业的行动都非常快,大家很快地进入了技术落地的交流和碰撞。百度作为技术产品的提供方,将和来自各行各业,来自政府,产业、企业界的朋友一起去探索全新的技术怎么样在产业落地,实现价值。今天我分享的主题是《云智一体新生态,共创大模型生态》。
2019年百度智能云在业内第一个提出了“云智一体”。今天,百度“云智一体”的架构已经迭代到了3.0版本,从行业的核心应用切入,打造行业里的标杆应用,通过不断把标杆应用里的能力沉淀到AI大底座的AI PaaS和AI IaaS层,更强的底座再向上进一步优化已有的应用,孵化新应用,使得“云智一体”架构形成不断的螺旋上升,良性循环进化的效果。
今年,我们非常高兴地看到头部的厂商也在推行“云智一体”的理念,说明大家进一步认可了这个判断,形成了共识。事实上,当下我们非常关注的大模型的突破,也进一步加速了“云智一体”产业智能化落地的进程。
百度在人工智能领域已经投入超过13年,研发投入超过1000亿。正因为百度一直身处人工智能技术的最前沿,人工智能技术浪潮的最深处,所以可以贴身感受到这个行业发展的趋势。
我们认为大模型和生成式AI的突破,全球性的“AI再造”已经拉开了序幕,而且在一开局就进入到了白热化的阶段,各行各业都在争先恐后地推动落地。它事实上给企业带来两方面很重要的价值,一方面是生产经营效率的提升,另一方面是用户体验效果的提升。
我们先来讲生产经营效率。过去很多技术革命更多是在体力劳动上帮助了我们,但这一次的技术革命是在知识层面,是在脑力劳动层面,所以相对过去的技术革命它是升维的,知识是最重要的生产力。知识的边际效应在降低,帮助企业大幅提升生产效率。
第二个是用户体验效果的提升。不同于过去很多复杂的交互,自然语言交互几乎可以影响到所有的用户,当我们获得了更好的用户体验,就能够获得更多的用户。所以在全球范围内微软、百度等具有代表性的企业都在基于AI全面再造自己的业务。
对于百度来说,文心一言大语言模型具有非常强的通用性,与各个产品的结合是很自然的,它可以非常好地提升百度搜索、百度地图、网盘、Apollo等产品的用户体验。根据这个逻辑大家也能理解,改造百度自身的产品是一方面,但是更大的机会是通过百度智能云去服务客户,让所有的客户和伙伴的产品体验都能得到更大的提升,所以文心一言更大的故事在云计算。
李彦宏先生认为,大模型是game changer,文心一言将根本性改变云计算市场游戏规则。过去,云计算主要看算力、看存储。今天和未来,客户在购买云服务,会非常关注你的模型好不好?基于你的模型去打造我的业务应用好不好用?未来我是不是可以持续获得最先进的能力、最高的效率、最高的性价比和便利性?所以这必然会带来云计算市场的重新洗牌。
这是百度非常强调的人工智能时代的四层技术栈,今天的IT技术栈已经演变成了更适配人工智能研发和发展的四层架构。未来,企业主要会基于大模型来开发应用,而不是像过去一样基于存储、算力来开发应用,云计算的主流商业模式会从IaaS转变为IaaS+MaaS,或者以MaaS为主,也就是模型即服务。百度在人工智能方面的投入时间非常长,我们不是因为看到了大模型才开始投入的。
百度是全球唯一一家这四层架构的每一层都有领先产品的公司。在芯片层,百度有昆仑芯片,今天百度的搜索全部是跑在自己的芯片上面的,而且在这个场景上,我们的性能是全球最优的。在框架层有百度飞桨,并且凝聚了超过500万的开发者。在模型层拥有文心大模型,再到上层有百度与伙伴联合开发的大量应用。
四层架构都有的优势使得我们可以对每一层都进行优化,层和层之间还可以相互优化,这使得我们可以获得的效率提升和成本下降的空间是独一无二的。如果你只能够优化其中的一层,那你获得的优化空间是有限的;但如果四层都可以端到端优化,这个效率的提升会大得多。
百度智能云的核心理念正是基于这四层架构。这使得百度智能云成为国内第一个训练出生成式大语言模型的云,这个大模型就是文心一言。百度的大语言模型在过去的一段时间里进化、迭代的速度非常快。未来,企业基于大模型开发应用,会发现基于百度智能云去开发AI的应用和能力效率更高、性能更好、更方便、价格成本还更低。所以,百度智能云有信心在大模型时代为我们的客户和伙伴提供更有竞争力,更有吸引力的服务。
我这里放了几个非常重要的性能数据来帮助大家理解百度四层架构端到端布局,软硬逐层优化带来的提升具有不可复制性。我们把四层架构下面的三层,整合推出了“百度AI大底座”方案。百度AI大底座的特点是全栈自研,可以将千卡并行加速比提升至90%以上,训练场景的资源利用率到70%以上,模型开发迭代的效率提升100%以上。这些都是非常关键的指标、非常难做到的指标,得到了非常显著的性能提升。
下面介绍百度文心千帆大模型平台,它是全球首个一站式的企业级大模型平台。文心一言是我们的C端产品,文心千帆是面对企业客户提供的平台。企业想要试用任何文心大模型相关的服务,来文心千帆就可以了。文心千帆提供了包括大模型开发、托管和在线推理等服务,进而接入客户的业务系统,支持丰富的应用场景。
文心千帆有非常多领先的功能,这里面我介绍客户最关心的其中6个性能:更易用、更全面、更安全、更高效、更开放和更扩展。
•第一个是更易用,文心千帆拥有图形化的操作界面,客户在这个平台上只需要关注自己的数据,最核心的场景就可以了。
•第二个是更全面,整个平台覆盖了模型全生命周期各种需求,包括了数据的反馈和标注、多种模型训练方式、模型评估和压缩、推理服务管理和应用集成。
•第三个也非常重要,就是更安全,百度拥有多年的互联网和搜索业务的经验,基于这些业务,我们发展出来很多核心的安全的相关技术,都会全部应用到文心千帆的平台上。另外,百度文心一言大模型是知识增强和搜索增强的大语言模型,所以我们给出来的答案里面包括实时搜索获得的信息,包含了知识图谱的信息,从而使得答案更准确、更客观,也更加安全。
•第四个是更高效,不管是在训练还是推理方面,基于百度四层架构端到端的优势可以实现更强的性能和效果的优化。在著名的MLPerf榜单上,百度的飞桨加上大底座,在多机多卡的训练上相比友商能够更快达到收敛的状态。大模型的训练光说快是没用的,要既快又能收敛才能起到效果。
•第五个是更开放,百度的文心千帆平台不仅包含百度文心一言,也支持第三方大模型,可以让客户根据自己的需要去选择。
•第六是更扩展,除了内化到模型里面的各种能力之外,我们的平台支持通过插件机制,通过外挂应用的方式去扩展大模型的能力,进而可以有更广泛的应用,然后获得更多的反馈,使得能力更强。
同时在部署方式上,我们重视和尊重客户多种类型的部署需求,文心千帆支持了业内最多、最灵活的部署方式。公有云是一种很高效的方式,同时我们也支持私有化部署,包括软件授权、租赁服务和软硬一体的方案,其中软硬一体的方案还支持市场上多种类型的芯片,满足客户灵活的需求。
我们特别强调说百度是国内唯一将大模型在实际应用中大规模落地的企业,我们和很多外部的客户有合作应用。很多大模型还停留在理论阶段,还停留在传播阶段时候,百度已经拥有很多真实的落地经验,未来我们客户实际应用落地的过程中它是非常有价值的。在百度内部产品比如搜索、视频、地图、小度、如流(百度内部办公平台),这些产品上都获得了很好的大模型应用效果。
除了内部的产品,百度和不同行业的多个客户,也有大模型的应用实践。百度智能云和百图生科联合构建了异构生物超算平台,可以支持动态获取高达数万个GPU,百图生科在百度智能云上训练了千亿级参数跨模态大模型,这个模型承载了百图生科创新药物研发,助力全新蛋白设计。
百度和长安汽车的合作,百度智能云帮助长安汽车构建了人工智能基础设施平台和数字人平台,双方正在基于文心大模型去开发创新的人工智能产品。我们相信在赋能长安汽车的量产汽车之后,将会带来行业领先的用户体验,大大提升产品的竞争力。
百度智能云和地平线开展了全面的技术合作,在地平线的模型训练方面提供智算支持、在高性能数据存储、在线/离线数据上云、专属云适配,以及智能驾驶解决方案全生命周期开发等方面展开了全面的技术合作。
百度的文心一言和金山办公已经在包括意图理解、PPT大纲生成、范文书写、待办列表生成、文生图等多模态生成等具体场景上正在进行联合测试,将来会有更多的产品层面的合作。
模型即服务将撬动的不止是万亿级市场,大模型还会带来三大产业机会。
•第一类是新型云计算的机会。如果客户希望训练的自己的大模型,我们可以提供百度AI大底座、文心千帆大模型平台。这层更多的是大型科技公司的机会,需要的投入非常多,也需要长期持续的技术积累。
•第二层是行业模型精调的机会。最终通用大模型应用于千行百业,它还需要很多行业的中间层,比如说工业、金融、交通、能源、媒体等等的行业,在这些行业里面拥有独特的知识,独特的能力经验的企业会非常有优势。百度也需要与这样的伙伴进行合作,让大模型真正落地在多个行业。
•第三类机会是最上层的应用开发。移动互联网时代有很多头部应用,包括微信、淘宝、百度APP,这些应用都有非常好的商业模式,有很大的影响力。但是在大模型时代,因为用户门槛的进一步下降,用户体验的进一步上升,我们认为大模型时代的头部应用会比移动互联网时代的影响力还要更大,用户体量、用户群还要更大。而且在当下这个刚刚开始落地的过程中,每一家企业这一层都有机会,正是因为这些应用会不断繁荣和爆发,才会使得大模型的生态和应用更高效。
百度智能云的客户、伙伴无论希望在这三层的哪一层做投入,百度都可以提供最可靠的服务方案。
在过去两个月时间里面,已经有超过300家的产业生态伙伴和百度智能云一起在超过400个真实的产业场景里面进行研发测试,这些场景包括大家非常关注的智能客服、办公提效、数字人、知识管理、图文创作、图象识别、程序生成和分析等等。我们欢迎更多的产业伙伴加入,成为百度智能云文心千帆的伙伴,跟我们一起推动大模型在产业的落地生根。
百度的使命是用科技让复杂的世界更简单。百度一直定义我们是一家技术公司,我们以技术为本,在任何时候我们对技术的投入都不会动摇。
百度智能云大模型平台文心千帆就是在大模型时代服务我们的客户、伙伴的最好的创新平台。我们对此非常兴奋,也充满信心,因为中国市场拥有全球最大规模的用户量,最丰富的产业链,一定会产生大量真实的行业需求和行业反馈,进而驱动我们的大模型更高速地进化和成长。在整个新技术的落地过程中,技术和场景的互动是必不可少的,这是一个互相推拉的过程。
未来我们希望与合作伙伴保持更多、更紧密的交流,一起把中国的产业智能化推向更深、更远。谢谢大家!