AGI创投周报是阿尔法公社推出的聚焦于以大语言模型和生成式AI为代表的人工智能新浪潮的资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。
为此,我们与大家分享我们欣赏的AlphaFounders所领导的公司在产品,技术和融资方面的新动向和新突破。
本周,我们观察到以下新动向和新趋势:
1.OpenAI和Cohere等提供基础大模型能力的公司获得新融资。
2.手机也能跑大模型,使用大模型能力的算力门槛降低。
3.无需RLHF,大模型就能对齐人类,基于排序的人类偏好对齐的方法出现。
4.科大讯飞,第四范式推出大模型新产品,国内大模型产品潮继续涌现。
5.Runway推出移动App,Stability AI发布新的绘画模型,AI的视觉类创作能力持续进化。
我们欣赏的AlphaFounders
所领导公司的新融资
1.估值超270亿美元,OpenAI完成超3亿美元新融资
近日,OpenAI获得金额超3亿美元的新融资,投后估值达到270亿至290亿美元,融资过后,外部投资者目前共持有OpenAI超过30%的股份。参与OpenAI本轮融资的机构包括Tiger Global、红杉资本、a16z、Thrive和K2 Global等。今年稍早,微软对OpenAI的投资大约100亿美元,根据TechCrunch报道,本次投资与此前微软入股属于同一轮。
2.Transformer论文作者创立的Cohere获得2.5亿美元新融资
官方网站:https://cohere.com/
自然语言处理平台Cohere最近获得Salesforce领投的2.5亿美元融资,参与本轮投资的还有NVIDIA、Inovia Capital和Index Ventures,这使得它的估值达到20亿美元。
Cohere专注于构建NLP模型平台,并采用API技术来编写和理解自然语言。产品方面,Cohere主要提供搜索文本、分类文本和生成文本三大类产品。搜索文本主要包括多语言嵌入、神经搜索、搜索排名。它的产品主要面对企业用户和开发者。
Cohere由Aidan Gomez、Nick Frosst和Ivan Zhang创立,Aidan Gomez是Transformer那篇著名论文《Attention Is All You Need》的主要作者之一,其他两位联合创始人也具有学术背景,且三位创始人均是多伦多大学校友。
Cohere成立于2019年,在2021年9月获得4000万美元A轮融资,2022年2月获得1.59亿美元B轮融资。投资者包括Index、Tiger Global以及图灵奖获得者Geoffrey Hinton、知名人工智能研究员李飞飞和Pieter Abbeel等。
3.视频领域AI初创公司Runway获1亿美元D轮融资
官方网站:https://runwayml.com/
AI初创公司Runway是一家利用大模型能力生成视频的公司,它为设计师、艺术家和开发人员提供一系列的工具和平台,帮助他们利用人工智能技术创建视觉作品,有史以来获奖最多的电影《瞬息全宇宙》便在制作过程中采用了该公司的技术。
2018年底,Runway由Cristóbal Valenzuela等几位创始人共同创立,他们均有纽约大学的研究背景。
2021年,Runway与德国慕尼黑大学的CompVis团队合作,构建了第一个版本的Stable Diffusion。
最近,它推出了自己的首款移动App,这款App可以让用户更方便的使用其视频生成AI模型Gen-1,帮助用户方便的生成视频特效,而最新版本的模型Gen-2将很快与Runway的其他AI工具(例如图像到图像生成器)一起提供。
近日,Runway从一家云服务提供商那里获得1亿美元的D轮融资,估值达到15亿美元,这也是Runway上一轮融资后估值的三倍,当时它在2022年12月从Felicis领投的C轮融资中获得了5000万美元的投资,彼时该公司估值为5亿美元。
4.机器学习验证平台Openlayer获480万美元种子轮融资
官方网站:www.openlayer.com/
Openlayer是机器学习验证和测试平台,使团队能够检测、诊断和纠正模型故障,该解决方案通过验证训练和验证数据集的完整性、发现培训、评估和生产数据之间有意义的差异等方式帮助团队系统地改进他们的模型和数据集。
Openlayer由前苹果机器学习工程师Gabriel Bayomi、Rishab Ramanathan共同创建。Gabriel Bayomi和Rishab Ramanathan此前还共同创立了创业公司Unbox,几位创始人也具有CMU和耶鲁的名校背景。
近日,Openlayer获得480万美元种子轮融资,本轮融资由Quiet Capital 领投,Picus Capital、YCombinator、Hack VC、Liquid2 Ventures、Mantis VC和包括Instagram联合创始人Mike Krieger、Instacart联合创始人Max Mullen等在内的众多天使投资人跟投。
5.利用AI帮客户分析广告创意元素的Alison获得a16z的510万美元种子融资
官方网站:www.alison.ai/
Alison是一家以色列创业公司,它利用AI能力分析数据,帮助企业预测哪些创意元素能够带来更好的传播效果。
它通过使用10多种人工智能模型(包括文本识别、声音识别、视觉识别、情感识别等)来分析广告创意元素,以识别创意的各个元素。借助AI的力量,他们可以高精度地预测哪些创意元素最适合用户的广告,或者“注册”按钮上的哪种颜色将为客户的特定受众带来最佳效果。
Alison由Asaf Yanai和Koby Berkovich联合创立,他们在此次创业前,都各自具有丰富的行业经验和创业经历。
Alison已经获得包括a16z、yellowHEAD和Crescendo Venture Partners投资的510万美元的种子轮融资。
Alison目前支持YouTube、AdWords、AdMob、Facebook、Instagram、Snapchat和TikTok等多个平台。
6.利用大模型能力为客户赋能的AirOps获得700万美元种子轮融资
官方网站:www.airops.com/
AirOps是一家为客户提供大模型能力,并帮助客户定制AI应用程序的创业公司。
AirOps目前正在帮助客户在GPT-4、GPT-3和Claude这三个大模型上构建应用程序。它的想法是帮助用户自动化流程、从数据中提取洞察、生成个性化内容以及执行自然语言处理技术等操作。
AirOps还将推出AirOps App Builder工具,客户能够构建自己的AirOps应用程序,这些应用程序结合了大模型、逻辑推理和数据检索,并且可以轻松集成到客户的工作流程中。
AirOps由Alex Halliday,Berna Gonzalez,Matt Hammel共同创立,三位创始人在此前均有深厚的行业积累,也有共同的职业经历,属于老同事“组团”创业。
AirOps最近获得由Wing VC领投的700万美元种子轮投资,其它投资者还包括XFund、Village Global、Apollo Projects和Lachy Groom等。
7.自动驾驶技术服务商Foretellix获4300万美元C轮融资
官方网站:www.foretellix.com/
Foretellix是一家以色列初创公司,它提供工具帮助客户验证从L2到L4级别的自动驾驶汽车技术,以便他们能够足够安全,进行商用。
Foretellix的两大核心技术是:场景生成和大数据分析。它拥有庞大的场景库,能为自动驾驶公司模拟各种各样的场景,以寻找自动紧急制动等边缘案例。同时在客户测试了场景后,无论是虚拟测试还是真实道路测试,Foretellix帮助他们分析结果。
近日, Foretellix获得由83North领投的4300万美元C轮融资,参与投资的还包括丰田增长基金Woven Capital与NVIDIA和Artofin VC。
Foretellix由两位资深的连续创业者联合创立,联合创始人兼CEO Ziv Binyamini和CTO Yoav Hollander均在Cadence(EDA巨头)有过10年以上的职业生涯,而且在进入Cadence之前,曾经联合创立了Verisity。
8.改变企业获取和转移技术诀窍的方式,DeepHow获1400 万美元A轮融资
官方网站:www.deephow.com/
DeepHow是一家将技术诀窍转化为智能操作方法培训视频的人工智能公司,它利用生成式AI的力量来加速SOP视频创建、多模态工作流生成、AI 聊天辅助和战略知识映射。
制造和服务行业的科技含量在提高,工厂车间中使用的先进技术的快速演进、与工业4.0相关的制造数字化、全球供应链的重组以及人们偏好学习方式的范式转变。捕捉高级经验工作者的技能和专业知识,然后通过引人入胜和高效的培训在入职和再培训项目中传递这些知识从未如此重要。
DeepHow为客户提供AI驱动培训平台来简化技术技能和专业知识的捕捉和传递,能帮助客户将项目时间缩短10倍,提高工人绩效25%,并大幅降低培训和发展成本。
DeepHow由Sam Zheng(CEO)和Wei-Liang Kao(CTO)等创始人联合创立,其中Sam Zheng在北京师范大学完成本科和硕士教育,在伊利诺伊大学香槟分校获得博士学位。两位创始人均有学校研究经历,DeepHow的团队则在全球分布,主要集中在制造业发达的区域。
DeepHow完成Owl Ventures领投的1400 万美元的 A 轮融资,其他参与本轮的机构包括LG Technology Ventures 、Sierra Ventures、Qualcomm Ventures、Osage Venture Partners等。
我们欣赏的AlphaFounders所领导公司的新突破
1.微软Bing全面开放插件系统,文生图原生支持中文
微软全面开放了搭载GPT-4的全新Bing聊天机器人,注册无需再等待。目前它的主要功能包括:1. 文生图功能支持上百种语言2. 从纯文本搜索转为多模态聊天3. 与Edge完美融合,可查询历史聊天4. 开放平台,支持开发者第三方插件。
这次更新的最大亮点是对插件系统的支持,微软表示,在未来会给开发者们创建一个平台,能让更多的开发者参与到插件建设中,更多功能将在本月的Microsoft Build(5月23/24日)中发布。
2.Nuance推出基于大模型能力的全自动临床文档应用程序
近日,此前被微软收购的医疗领域AI公司Nuance推出了基于大模型能力的一款工作流程集成的全自动临床文档应用程序,DAX Express 。它将经过验证的对话和环境AI与GPT-4相结合。旨在减轻行政负担并使临床医生能够花更多时间照顾患者,减少文书工作时间。
DAX Express 使用对话式、环境和生成式 AI 的独特组合,在几秒钟内自动安全地创建临床笔记草稿,以便在每次患者访问检查室或通过远程医疗患者对话后立即进行和完成临床审查。
3.Stable Diffusion团队放大招,新绘画模型直出AI海报
打造出Stable Diffusion模型的创业公司Stability AI发布全新开源模型DeepFloyd IF,获星2千+,并登上GitHub热门榜。DeepFloyd IF不光图像质量是照片级的,还解决了文生图的两大难题:准确绘制文字,以及准确理解空间关系。
使用DeepFloyd IF,可以把指定文字巧妙放置在画面中任何地方。例如,霓虹灯招牌、街头涂鸦、服饰、手绘插画,文字会以合适的字体、风格、排版出现在合理的地方。这意味着,AI直出商品渲染图、海报等实用工作流程又打通一环。
在技术上,DeepFloyd IF仍然基于扩散模型,但与之前的Stable Diffusion相比有两大不同。负责理解文字的部分从OpenAI的CLIP换成了谷歌T5-XXL,结合超分辨率模块中额外的注意力层,获得更准确的文本理解。负责生成图像的部分从潜扩散模型换成了像素级扩散模型。也就是扩散过程不再作用于表示图像编码的潜空间,而是直接作用于像素。
4.DeepMind为何缺席GPT盛宴?原来在教小机器人踢足球
近日,DeepMind的新论文探讨了利用深度强化学习为双足机器人学习敏捷的足球技巧。他们考虑了整个足球问题的一个子集,训练了一个具有20个可控关节的低成本微型类人机器人来玩1v1足球比赛,并观察本体感觉和比赛状态特征。
他们在模拟中训练智能体并将它们迁移到物理机器人中,证明了即使对于低成本机器人而言,模拟到真实的迁移也是可能的。
在数据上,经过这种模拟到真实的迁移,机器人的行走速度提升了156%,起身的时间减少了63%,踢球的速度也比基线提升了24%。
5.科大讯飞星火认知大模型发布,具备思维链逻辑推理,多模态输入和表达能力
今天下午。科大讯飞在发布会上推出了星火认知大模型,并公开进行了展示。
星火大模型拥有多种能力,包括多风格多任务长文本生成生成能力、语言理解能力、泛领域开放式知识问答、情境式思维链逻辑推理、多题型可解析数学能力、多功能多语言代码能力、以及多模态输入和表达能力等。
星火认知大模型在研发中的版本还能直接生成虚拟人来进行展示,在发布会的现场展示上,星火认知大模型完成了一整套创作链条:散文创作—生动朗读—生成虚拟人朗读。
6.放弃反向传播后,Geoffrey Hinton参与的前向梯度学习重磅研究发布
曾被冠以「反向传播之父」的 Geoffrey Hinton,近年来却经常表示自己在构思下一代神经网络,自2017年起,Hinton就已开始寻找新的方向,例如在前向 - 前向网络方面的思考。近日,它在这个方向又有了新的重要进展,由Hinton参与的论文被人工智能顶会ICLR 2023接收。
前向梯度学习通常用于计算含有噪声的方向梯度,是一种符合生物学机制、可替代反向传播的深度神经网络学习方法。然而,当要学习的参数量很大时,标准的前向梯度算法会出现较大的方差。
基于此,图灵奖得主Geoffrey Hinton等研究者提出了一系列新架构和算法改进,使得前向梯度学习对标准深度学习基准测试任务具有实用性。该研究表明,通过将扰动(perturbation)应用于激活而不是权重,可以显著减少前向梯度估计器的方差。
7.陈天奇等人新作引爆AI界:手机原生跑大模型,算力不是问题了
最近一个叫MLC LLM的项目提供了一项“颠覆性”的能力,它可以让用户在个人设备上本地开发、优化和部署AI模型,而无需服务器支持,并通过手机和笔记本电脑上的消费级GPU进行加速。例如,用户可以在iPhone上运行聊天机器人。此外,MLC LLM还提供了一个高效的框架,供使用者根据需求进一步优化模型性能。
该项目是由CMU助理教授,OctoML CTO陈天奇等多位研究者共同开发的,参与者来自CMU、华盛顿大学、上海交通大学、OctoML等院校机构,同时也获得了开源社区的支持。
8.几行代码,GPT-3变ChatGPT,Lamini引擎引领LLM定制化生态
快速定制模型的LLM引擎Lamini来了,它可以让任何开发人员,而不仅是机器学习专家,都能在大型数据集中,把高性能的LLM训练得像ChatGPT一样好。
Lamini的开发团队表示,开发人员只需要用几行代码,就可以用托管数据生成器训练自己的LLM,包括权重和其他所有的内容。此外,用户也可以使用开源的LLM,用Lamini库对生成的数据进行微调,以及访问完整的LLM训练模块,使用从LoRa等速度优化,到虚拟私有云 (VPC) 部署等企业功能,而且它可以商用。
对此,英伟达科学家Jim Fan表示, LLaMa+自定义数据正在成为新的范式,而Lamini的推出也带了一种全新的模式——FaaS,微调即服务。OpenAI科学家,前特斯拉人工智能总监Andrej Karpathy也表示,LLM定制化的生态正在愈发火爆。
9.无需RLHF就能对齐人类,性能比肩ChatGPT,华人团队推出新的对齐方法
最近,来自阿里达摩院和清华大学的研究人员提出了一种名为RRHF的对齐方法,无需强化学习即可用于训练语言模型,效果比肩RLHF。
ChatGPT能够理解人类指令,归功于RLHF(通过强化学习对齐人类反馈),目前,RLHF的研究工作主要使用PPO算法对语言模型进行优化。然而,PPO算法包含许多超参数,并且在算法迭代过程中需要多个独立模型相互配合,因此错误的实现细节可能会导致训练结果不佳。
阿里巴巴达摩院和清华大学的作者们提出了一种名为基于排序的人类偏好对齐的方法——RRHF。RRHF不需要强化学习,可以利用不同语言模型生成的回复,包括ChatGPT、GPT-4或当前的训练模型。RRHF通过对回复进行评分,并通过排名损失来使回复与人类偏好对齐。与PPO不同,RRHF的训练过程可以利用人类专家或GPT-4的输出作为对比。训练好的RRHF模型可以同时用作生成语言模型和奖励模型。
10.思维链加持,第四范式「式说」大模型改造软件来了
近日,AI创业公司第四范式展示了大模型产品「式说」3.0 版,并提出 AIGS 战略(AI-Generated Software):以生成式 AI 重构企业软件。
「式说」将定位为基于多模态大模型的新型开发平台,提升企业软件的体验和开发效率,实现「AIGS」。第四范式展示了式说的思维链CoT能力:AI 自己能找到解决问题的方法,一步一步地执行。
例如,在装集装箱的示例中,式说首先列举了装箱的思路,人们可以任意修改堆叠物体的长宽高,AI 很快就能自动计算出堆叠的最优结果,并用图形的方式展示出来,还会显示推理的过程。