撰文 | 李信马
题图 | 百 度
3月16号,文心一言正式内测时,展示中,这款国内首个大语言模型,表现得像是个精巧的玩具——有趣、智能,又显得独立于我们熟悉的旧的世界。
是的,旧的世界。那时候很多人已经意识到,大模型,或者说生成式人工智能,不同于以往的人工智能概念,将是改变世界的力量,只是我们还不太清楚,它将怎样去改变世界,还有改变我们。
我们感受到最直观的变化,是人类可以通过大语言模型和机器对话了,用人类的自然语言而非编程语言。《人类简史》中认为,我们的祖先智人,能够走出非洲征服世界,认知革命功不可没。或者简单的说:智人会说话,所以能进行更高效的合作。
当我们与机器也能像和人一样交流时,那就意味着,人机交互的方式改变或者说进化了,我们能更高效地和机器合作——这就是一个革命性的改变。
在文心一言内测不久后,百度内部升级了智能工作平台“如流”。以往人类才是专家,机器只是被动的接受命令,而在演示中,内测小助手“千帆Help”可以帮助工程师了解如何使用文心千帆大模型平台,根据指令直接返回代码,解答各类专业技术问题。除此之外,如流还能根据输入的提示词,生成大纲、招聘 JD、宣传文案、邮件、调研报告,根据输入的文字生成图片,还可以推荐和生成代码。
这看起来,似乎显得有点“低门槛”,就像有的程序员不好意思承认自己经常“Ctrl C+V”一样。但从人类需要适配机器,到机器开始适配人,绝对是生产力的巨大进步,即使是“旧时代”最优秀的工程师,也不能否认这一点。
5月26日,百度创始人、董事长兼CEO李彦宏,也是一位顶级的技术专家,在2023中关村论坛的演讲中回忆,他在读大学读研究生的时候,主要的工作界面是命令行,那时他觉得效率很高,但是大多数人不会这种操作。后来人机交互方式进化出图形用户界面(GUI),用鼠标一层一层点击菜单,起码很多人能看懂。
但用自然语言跟电脑进行交互,可能几秒钟,就能获取之前人力需要一天才能完成的工作成果,比如如流现在的平均响应时间为5秒,未来还可能继续缩短。
大模型就像是火种,即使目前的算力成本还较高,凭借高效和“低门槛”这两点优势,星星之火也可以燎原。所以我们可以看到,先行者百度,几乎每过一个月,就会有新的进展公布:
3月27日,百度智能云(文心千帆)大模型平台面向首批企业客户启动内测
4月25日,百度智能云举行闭门技术交流会,六大智能产品系列将基于文心一言升级
5月9日,百度智能云在北京总部举行文心大模型技术交流会,介绍文心大模型在产品技术、场景研发、生态建设三个领域的最新进展
和百度的频繁发布相对应的,则是业界的热烈响应,据了解,目前已有超过300家生态伙伴参与内测,在400多个企业内部场景取得测试成效。显然,未来越来越多的应用会基于大模型来实现,对程序员来说,写代码可能被写提示词而取代。许多人类工作的内涵会发生剧变,甚至消失,但也会有新的工作需求出现。
但这只是大模型改变世界的表层。
李彦宏将过去的人工智能称之为“辨别式”人工智能,像是搜索引擎,或者识别车牌号,语音转文字等,往往更关注应用层,对底层IT技术栈的改变并不深刻,但是大模型带来的市场需求和生产方式的改变,可能会让IT技术栈发生根本性变化。
以往,IT技术栈由下往上包括三层:芯片层、操作系统层、应用层。而在未来,可能将变成四层:底层仍然是芯片层,但主流芯片从CPU变成GPU;芯片之上是框架层,就是深度学习框架,比如百度的飞桨、meta的PyTorch、谷歌的TensorFlow;框架之上是模型层,如ChatGPT、文心一言;最上面是应用层,而且会有大量的AI原生应用。
不难看出,这一体系是基于大模型的另起炉灶。AI原生应用的概念,类似于前几年就火爆的云原生,而且是更进一步。李彦宏认为,这也将推动云计算领域新的革命:主流商业模式将从IaaS变为MaaS,企业选择云厂商,从更多看算力、存储等基础云服务,转向更多会看框架、模型,以及模型、框架、芯片、应用这四层之间的协同。
云厂商们刚刚完成了全面上云,还有全面云原生,下一步要做的,就是全面智能化和AI原生化,然后再将这一模式赋能给更多的企业,未来每个行业都会有大模型,大模型也将像今天的云一样,无处不在。
最先宣布要进行重构的,就是百度自己。
“百度正在用AI原生思维重构所有的产品、服务和工作流程。百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构。”李彦宏说。
在刚刚过去的一季度,百度智能云实现了盈利(non-GAAP),收入同比增长8%至42亿元,3月份,销售线索同比增长超过400%。在云计算市场增长放缓的当下,这显然是个好信号。每当足以改变世界的技术出现时,都会有那个时代的领头羊,就像操作系统和微软,数据库和甲骨文,云计算和亚马逊,在大模型即将改变世界的节点,百度会是新的领头羊吗?
在演讲的后半段,李彦宏给出了“Yes”的理由:
“一是技术上长期投入和积累。
二是拥有独特优势。我们的四层架构,在实际应用中,的确大幅提升了效率。比如我们通过智能调整红绿灯的时间,可以让城市交通效率提升15%到30%。五一长假之前最后一个工作日,北京大堵车,从二环堵到六环一片红,唯一绿的是亦庄,因为亦庄300多个路口全部部署了百度AI信控系统。
三是自主可控。文心一言做到了数据可控、框架可控、模型可控,能够体现在国际竞争当中高水平的科技自立自强。它可以赋能千行百业,助力中国经济开创下一个黄金30年。”
以下是演讲实录:
尊敬的各位领导、各位嘉宾,大家好!
很高兴参加2023中关村论坛。中关村论坛是全球科技创新交流合作的国家级平台,我今天分享的话题也聚焦创新,主题是《大模型改变世界》。
最近一段时间,人工智能再次成为人类创新的焦点,越来越多的人认可第四次产业革命正在到来,而这次革命是以人工智能为标志的。
之所以成为焦点,是因为大模型,大模型成功地压缩了人类对于整个世界的认知,让我们看到了实现通用人工智能的路径。
当下,我们正处在全新起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型将改变世界。
为什么说大模型改变人工智能?
因为大算力、大模型、大数据,导致了“智能涌现”。什么叫智能涌现?过去的人工智能是,我想让机器学会什么技能,就教它什么技能。教过的有可能会,没教过的就不会。大模型出现“智能涌现”之后,以前没教过的技能,它也会了。
与此同时,人工智能发展方向从辨别式走向生成式。什么叫辨别式?搜索引擎就是典型的辨别式。什么叫生成式?用AI进行文学创作,写报告、绘制海报等等,这些都是生成式。
生成式AI,会让工作效率大幅度提升。有研究机构认为,在未来10年,知识工作者的效率可以提高4倍。
那么大模型怎么重新定义人工智能?
一是,大模型重新定义了人机交互。过去几十年,人机交互方式发生了三次变化:
比如,命令行是我读大学读研究生的时候,主要的工作界面。我输入一个命令,它给我想要的反应。我当时觉得效率很高,但是大多数人不会这种操作。
更简单的人机交互方式是什么?是图形用户界面(GUI)。
就是用鼠标一层一层点击菜单。这种方式比第一个要更友好,起码很多人能看懂,但它仍然不是最自然的交互方式。
人工智能的诞生,让我们可以用自然语言跟电脑进行交互。
比如说,我想查一下“4月份,我的公司有哪些产品的毛利率,超过了疫情前的水平?”这个事,在过去很可能需要我的助理花半天一天时间才能获得。今天,如果计算机懂你的自然语言,一秒钟之内就可以给你一个表格。
自然语言人机交互会带来提示词革命。也就是说,未来的应用,是通过自然语言的提示词来调动原生AI 应用实现的。这意味着,未来你的薪酬水平,将取决于你的提示词写得好不好,而不是取决于你的代码写得好不好。
我做过一个预测,10年后,全世界有50%的工作会是提示词工程。提出问题比解决问题更重要。我们的教育要教孩子提出问题,而不仅仅是解决问题。
第二,大模型会重新定义营销和客服。
谁拥有最佳的跟客户沟通的方式,谁就会拥有这个客户。这个道理在大模型出现之前就成立,但有了大模型,即使你有70亿个客户,每一个客户也都可以有一个专属的7×24小时的、什么都知道的助理去服务他。
第三,大模型会催生AI原生应用。
AI时代的原生应用,到底长啥样?比如,DoNotPay,是一个用AI帮人打官司、写法律文书的应用,AI帮你把不该付的钱要回来。Jasper是一个通过AI帮助企业和个人写营销推广文案的应用。Speak是韩国一个学外语的应用。大模型成为一对一的教师,为每一个孩子提供个性化教育。
百度也在用AI原生思维重构我们所有的产品、服务和工作流程。比如我们的如流智能工作平台,让每一位员工都有一个具有丰富专业知识、实时响应的工作助理。通过对话理解能力,实现聊天记录的智能总结。我的同事评价说,“整个惊呆了”,“这个当时确实秀到我了”。
业界有一种说法,大模型时代来了,每一个产品都值得重做一遍。但谁真正重新做了一遍呢?百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构!
3月16号,文心一言发布,百度成为全球科技大厂中,第一个发布GPT大模型产品的公司。能这么快发布,是因为长期的积累和投入。早在2019年,我们就发布了文心大模型1.0,此后不断迭代到2.0,3.0,很快,我们还会推出文心大模型3.5版本。
目前市场需求非常旺盛,中国人拥抱新技术的热情前所未有。文心一言也在飞速进步,比如,QPS 每秒查询推理响应速度,提升10倍,这代表着推理成本已经降低为原来的十分之一。
未来,所有的应用都将基于大模型来开发,每一个行业都应该有属于自己的大模型,大模型会深度融合到实体经济当中去。
云计算的游戏规则彻底被改变,客户选择云厂商,主要会看你的模型好不好,框架好不好,而不是算力、存储这些传统能力。
大模型改变人工智能的背后,IT技术栈也发生了非常根本的变化。过去,无论是PC还是移动时代, IT技术栈都是三层,芯片层、操作系统层、应用层。
人工智能时代,IT技术栈变成了四层:底层仍然是芯片层,但主流芯片从CPU变成了GPU。百度在芯片层的布局是昆仑芯,已经量产几万片。昆仑芯第三代,预计2024年初量产。
芯片上面叫做框架层,就是深度学习框架。百度的飞桨,meta的PyTorch,谷歌的TensorFlow都是在框架层。百度的飞桨,在中国的市场份额排第一。
框架上面是模型层,ChatGPT、文心一言都是属于模型层。百度在模型层的布局,除了文心一言,还有交通大模型、能源大模型等行业大模型。
最上面才是应用层,就是我们前面提到的这些AI原生应用。
百度在这四层,都有全栈自研的产品,层层领先,可以实现端到端优化,大幅提升效率。
最后,我想讲一下百度为什么能做到:
一是技术上长期投入和积累。
二是拥有独特优势。我们的四层架构,在实际应用中,的确大幅提升了效率。比如我们通过智能调整红绿灯的时间,可以让城市交通效率提升15%到30%。五一长假之前最后一个工作日,北京大堵车,从二环堵到六环一片红,唯一绿的是亦庄,因为亦庄300多个路口全部部署了百度AI信控系统。
三是自主可控。文心一言做到了数据可控、框架可控、模型可控,能够体现在国际竞争当中高水平的科技自立自强。它可以赋能千行百业,助力中国经济开创下一个黄金30年。
今天,全球都在关注通用人工智能(AGI)的发展,也引发了一些争议。
大家担心机器会不会取代人?我认为把机器变成人,不应该是努力的方向。机器很多方面会比人强,但机器变不成人,也没必要变成人。机器会越来越聪明,能够干的事越来越多,效率会越来越高,我们需要与机器共生,而不是二元对立。
那么,如何防止失控?人工智能技术飞速发展过程中,确实有可能出现对人类不利的方向。防止失控,需要拥有先进AI技术的国家通力协作,从人类命运共同体的高度来制定规则。
要参与规则的制定,就要先上牌桌,才能拥有话语权,才有全球竞赛的入场券。
谢谢大家,预祝论坛圆满成功。