时至5月,大模型的热度仍在持续。上周科大讯飞刚刚发布大模型产品,这周小红书又传出成立大模型团队的消息。目前已经有数十家公司推出大模型,被外界戏称为“诸神之战”。
一众互联网企业中,百度是国内最早推出大模型产品内测的公司。目前有15万家企业申请接入百度的大模型产品文心一言,合作的外部公司数量也最多。文心一言的演进过程,可以看作国内大模型行业一个缩影。
3月16日,百度文心一言公开邀测,现在已有近2个月时间。这段时间,百度的大模型有哪些改变,做了哪些落地?与其他大模型有哪些不同进展?5月9日,经济观察网记者就此采访了百度集团副总裁侯震宇。
成本大规模下降
提到大模型,很多人第一反应是贵,比如投身大模型赛道的创业者王慧文等人,需要自带5000万美元入局。外部流传的数据是,大模型训练一次需要花3个月时间,需要花近1000万美元。
不过侯震宇告诉记者,大模型真不像很多人想象的那么贵。“做大模型有点贵,用大模型没那么贵,”尤其是使用大模型的企业,做再训练或是微调,所处理的数据、算力规模,与从零开始训练千亿大模型的规模,完全不在一个量级。
当下推出大模型的公司数十家,谁能成为最终胜利者?侯震宇认为,效果和成本,将是决定大模型能不能成的关键因素。
3月16日以来,百度文心一言已内测近两个月,完成了4次技术版本升级。推理成本降到了十分之一,推理性能提升近10倍。
“当别人刚刚思考如何进行训练的时候,我们已经在推理上冲出了很远。”5月4日,李彦宏在百度内部大会上这样说。
侯震宇告诉记者,接下来,文心一言还会有大规模成本下降。包括模型微调、模型再训练、模型使用等,“价格不会成为大家使用或者拥抱大模型的瓶颈。”
当前,国外大模型公司亏损正在增加中。近期国外媒体The Information报道称,大模型鼻祖去年OpenAI亏损额翻倍,达到5.4亿美元。侯震宇提到,百度不会这样,因为百度一开始就非常注重在成本和性能上的优化。“大模型对于百度来说,是一定要做的。而且我们也可以让成本更低。”
对比国外,国内大模型公司的成本会较低。“我们的电更便宜,云服务也更便宜。微软云的毛利大概有60%,国内没有几家云厂商能有这样的利润。”侯震宇认为,OpenAI的亏损,是国外特定场景,也是先驱者的探路成本,国内大模型平台不会一样。
当然,国内大模型产品目前都没有公开测试,这也是成本相对可控的原因之一。
从科幻落地现实
对于百度,文心一言内测前后是一个分水岭。用侯震宇的话说,内测前也有客户找上门,当时他们聊的,就像是科幻片里的题材。
3月份来到百度的客户,主要由各个公司一把手、CEO带队。他们都很兴奋,觉得大模型什么都能做,想法天马行空。但现在看,大模型并不是万能的,它需要几个要素:接收到更多的知识,并且真正在实际场景落地。
3月份文心一言刚内测时,人们流行问它一些刁难古怪的问题,或是让它写一篇小作文,考几道数学题。现在不一样了,侯震宇前几天见了一个机器人公司,他们考虑的是,怎样通过文心一言,让自己的机器人变得更智能。
最近找到文心一言的人,职级比三月份有所降低,不再是公司一把手,而是各个公司业务或技术负责人。但侯震宇很高兴,因为这说明文心一言已经开始真正落地了。
有一个客服公司,接入文心一言后,同样产出文字回复的成本,每万字从100元降低到1元。这家公司成本因为使用大模型而降低,是他们愿意尝试这个新鲜事物的原因。
金山办公近期也在与文心一言联合测试。金山办公助理总裁田然称,百度大模型的迭代速度很快,并在多个方面取得了优势。目前在意图理解、PPT大纲生成、范文书写、待办列表生成、文生图等多模态生成方面,金山办公与文心一言正联合测试。
近两个月内,文心一言在生物医药、汽车、芯片等领域也有落地。和百图生科联合构建了生物超算平台,训练超千亿级的多模态大模型,进行创新药物的研发。和长安汽车构建了人工智能基础设施平台,双方基于文心一言联合研发了一款新的人工智能产品。
侯震宇承认,这项新技术距离大规模落地还有很远的距离,但相比3月份,现在已经变得更实际了。
文心一言诞生后,对于百度还产生另一个好处,就是AI业务变得简单了。此前,百度一直主打AI,想把AI与各行各业结合,但实际做起来很难。
比如之前有个客户,要做AI业务,百度工作人员需要拿着各种各样的数据,去为客户单独训练一个AI模型出来。现在在一个已经训练好的预训练大模型基础上,可以用比较低的门槛做出细分模型。作为AI从业者,侯震宇认为,这是一个很大的福音。