一周人物热点
进入2024年,大模型仍然是创投界热度不减的重点赛道。
2月16日,OpenAI发布的文生视频大模型Sora成为焦点的同时,OpenAI新一轮的融资和800亿美元的估值也让业界震惊。
在国内,本周这一领域的热点人物为杨植麟——月之暗面创始人。
他是一名90后,之前曾在人工智能to B领域创业,但这一次他将方向调整为to C,并希望自己很团队能做出下一代Super APP(超级应用)。
跟王小川、李开复等明星创业者相比,杨植麟作为一位“素人”创业者,此前的公众知名度不高,但其最近高达10亿美元的融资、25亿美元的公司估值,却让他跃升为大模型创业的第一梯队。而他本人,更是以自己丰富的理论背景和实践经历,被媒体冠上中国大模型90后第一人的名号。
因此,我们将他选为本周一周人物。
01
一周人物
杨植麟
继大语言模型后,多模态大模型的资本大战,再度打响。
2月19日,有媒体报道,国内大模型创业公司月之暗面(Moonshot AI)在近期完成超10亿美元的融资,本轮投资方包括红杉中国、小红书、美团、阿里,其他老股东也有跟投。据悉,月之暗面本轮融资由阿里领投,其中阿里单独的投资金额为8亿美元,投后估值约25亿美元(约180亿元)。
这意味着,作为一家成立不到一年的公司,月之暗面已进入国内大模型创业公司第一梯队,成为智谱AI、MiniMax、百川智能、零一万物之外的又一独角兽。
作为公司创始人的杨植麟,是一位90后。
虽然不过30岁出头,但在国内,他在AI大模型领域称得上资深人士:他曾参与研发过Google Bard,以及国内的盘古NLP、悟道等大模型。有媒体更是直接给杨植麟冠以“中国大模型90后第一人”的名号。
这不是杨植麟第一次创业。2016年,他曾与陈麒聪、揭发和张宇韬共同创立了循环智能,主要业务方向是运用NLP、语音、多模态、大模型等AI技术打造“销售科技”方案。据报道,循环智能共融资六轮,投资方包括红杉中国、金沙江创投、真格基金等。
在ChatGPT爆火后,意识到大模型创业机会到来的杨植麟,决定再次创业。2023年3月,杨植麟与周昕宇、张宇韬等人共同成立了月之暗面。成立初期,公司就迅速拿到来自红杉中国、今日资本、励思资本等知名机构超2亿美元的投资。
与第一次创业时选择to B赛道不同,月之暗面的目标是要打造一个超级APP,“通过AI给个人提供更便捷、更强大、更个性化的普惠产品”。
“天才”团队
月之暗面的创始团队有5人,其中4人来自清华大学。有媒体报道称,深入接触过杨植麟的人都曾表示,“他是一个天才。”
杨植麟是广东汕头人,曾就读于金山中学。这是一所百年学校,前身系创建于1877年金山书院。
小时候,他曾梦想成为摇滚明星,或者流浪诗人。高中时期,他被选拔进信息学奥林匹克竞赛培训班,最终通过竞赛保送清华大学(非计算机系)。大二时,他发觉自己对计算机更感兴趣,于是转入计算机系,师从清华教授、知名AI学者唐杰。
2015年,杨植麟前往卡内基梅隆大学语言技术研究所攻读博士学位,只用4年时间就完成了一般6年才能完成的博士课程。
读博期间,杨植麟作为第一作者发表了两项深度学习领域的关键研究成果——Transformer-XL和XLNet,这两篇论文在学术界产生了重要影响。而杨植麟本人的学术引用量自2019年起到现在,已超2万次。
一位国内大模型赛道的创业者表示,他曾多次阅读杨植麟对于大模型架构和技术的判断,“看完后非常受用”。
联合创始人周昕宇是清华大学2011级的本科生,毕业后加入旷视科技,专注于算法量产。他与旷视研究院基础科研负责人张祥雨共同撰写了ShuffleNet论文,该论文对移动设备上的人脸识别技术产生了影响。
值得一提的是,在清华时,杨植麟还曾和周昕宇共同组建了乐队。“他很喜欢摇滚乐,我感觉他有点后摇(后现代摇滚的简称,将电子音乐加入旧式摇滚,形成新的、更为轻松自由的音乐表达风格)。”有接近杨植麟的人表示。
之所以把公司命名为月之暗面,也跟杨植麟对摇滚乐的爱好直接相关。《月之暗面》是杨植麟最喜欢的摇滚乐队平克·弗洛伊德乐队(Pink Floyd)的一张专辑名字。这张专辑探讨了死亡、物质快感和短暂的爱情等主题,被视为摇滚乐历史上的一个重要里程碑。月之暗面正式成立的2023年,正好是这张专辑发行50周年。
联合创始人吴育昕同样毕业于清华大学和卡内基梅隆大学,后在meta的人工智能研究院工作。期间,他还创建了Detectron2,这是meta最受欢迎的AI项目之一。吴育昕在AI领域论文曾获得过2018年欧洲计算机视觉会议(ECCV)最佳论文提名。
联合创始人兼CTO张宇韬,同时也是循环智能的联合创始人,也毕业于清华大学计算机系,跟杨植麟一样师从唐杰教授。张宇韬的研究方向包括异构数据融合和知识图谱构建,在计算机顶级会议上发表过多篇文章。
尽管在大模型领域,杨植麟既有丰富的理论基础,又有充足的实战经验,但他曾在接受媒体采访时表示,此前一直觉得亚洲不存在做大模型公司的机会。
转折发生在2022年年底。ChatGPT爆发后,杨植麟去海外考察。在海外呆了两个月后,美国对于AGI的“狂热”让他坚定地意识到:机会来了。
决定再次创业后,杨植麟加速了融资和招人的节奏,并在一个月内敲定了首轮融资,拿到了来自红杉等知名机构6000万美元的启动资金。
公司成立不到三个月,就组建起了40人左右、极高人才密度的技术研发团队,并将公司的方向确定为专注to C领域。2023年10月9日,月之暗面推出了面向C端的产品——智能助手Kimi Chat,其支持输入20万汉字的上下文。
2023年6月,科技媒体《The Information》盘点了中国AI初创企业Top5,分别为MiniMax、澜舟科技、智谱AI、光年之外(已被美团收购)以及杨植麟——杨植麟是唯一一位以个人名字入榜的参与者。
人才与资本的双线竞赛
月之暗面的融资消息爆出后,据内部人士透露,目前团队在加紧时间研发产品和技术,相关产品有望在今年上半年推出。
这并非月之暗面一家公司的动作,不少文生视频或多模态模型公司都进入了“紧急加班”状态,希望抓住Sora还没有正式对外开放的窗口期,追赶一下“进度”。
有投资人预测,Sora的技术路线虽然不一定赢到最后,但多模态的大趋势是确定的。从目前各家公司的动作来看,2024有望成为多模态元年。
杨植麟在接受媒体采访时曾表示,预期多模态的时间点会在2024年。同时,他认为基于自研模型而产生的产品,有望发展为下一个头部超级应用。他也希望自己能在to C领域的头部超级应用里占一个比较好的位置。
除了创业公司,科技巨头也面临着巨大的行业压力。
在OpenAI发布Sora前,谷歌就已经推出下一代人工智能模型Gemini 1.5,最亮眼的是它在跨模态超长文本理解能力上取得大幅突破。Gemini 1.5能够稳定处理的信息量高达100万个字符,这相当于1小时的视频、11小时的音频、超过3万行代码或70万个单词。
但不过十几个小时,形势就发生逆转:OpenAI在2月16日凌晨发布了Sora,它能够根据文本指令或静态图像生成长达1分钟的视频,且生成效果令人惊艳。随后,微软方面也表示,他们将把Sora与微软的人工智能聊天机器人Copilot进行集成,但需要一些时间。
而在这个时间窗口期内,其他公司是继续追赶还是另辟蹊径,面临的困难都和去年大语言模型暴发时类似。杨植麟在接受媒体采访时曾表示,大模型研发的难度主要有三个方面:一是算法创新,这需要大量的研发投入;二是算法微调,在不需要创新算法的情况下,如何调整才能让它有效工作;三是工程实现,如果路径不正确或者bug过多,最终可能失败。
这些挑战最后都受一个核心指标影响,也就是人才密度。人才密度决定了这三个问题的解决程度。
有身在美国的投资人表示,美国这波AI创业公司,除了OpenAI,其他实力都不够强,原因就在于人才。“美国的科学家和工程师根本不认除了OpenAI以外的创业公司股票价值,觉得都是纸面财富。这个显著的差异很快会形成人才团队的巨大差距。”
而从一开始创业,杨植麟最先解决的就是人才和团队组建问题,这件事的优先级甚至高于融资。
近期,TikTok也宣布,谷歌内部对标Sora的产品负责人蒋路加盟TikTok,一定程度上补上了字节在AI之战中的人才短板。
除了人才,资本扮演的角色也至关重要。中国互联网大厂对于头部大模型公司的投资也将加剧行业分化,阿里、美团、腾讯、小米都对头部大模型创业公司下了“重注”,这些公司的估值都已经超过10亿美元。有投资人透露,智谱AI跟百川智能都按30~40亿美元的估值在融资,MiniMax也将完成一轮差不多估值体量的融资。
杨植麟也曾在采访中提到,严格的AGI需要百亿美元级别的投入,但百亿美元不是一步到位,需要业务跑起来后逐步到位。业务推进在带来相应资源的同时,也会进一步优化成本。
虽然月之暗面将国内大模型投融资规模拉到了10亿美元的量级,但杨植麟的天才团队仍不能放松。有投资人认为,和大模型所需要的巨大投入相比,前景依然十分困难,“钱远远不够”。