可能你还没啥感觉,但最近有一个玩意,让头部企业和大佬们都抢疯了。
从抢光了谷歌风头的 NewBing 炸裂登场,再到让英伟达黄仁勋都成忠实迷弟的 Perplexity ,随随便便就是 5 亿估值。
甚至最近,连老大哥 OpenAI 也被传在偷偷下场。
总而言之,就是很卷,很火,很抢手。
有些敏锐的差友应该已经猜到了,它就是 AI 搜索。
哎,这就让差评君好奇了,海外一片火热,那国内是谁最先想到要搞 AI 搜索的呢?
于是,就随手在 Perplexity 和谷歌的 Gemini 上搜了下:中国第一个AI 搜索产品是什么?
结果让人有些意外,出来的居然不是那些老牌的熟面孔,而是昆仑万维在 2023 年 8 月发布的天工 AI 搜索。Perplexity
谷歌 Gemini
有点不相信的差评君,又试了国内好几家 AI 搜索产品。
结果,这些同行们异口同声报出的答案,还是它。。。抖音豆包
文心一言
差评君去翻了翻资料,发现就在前两天 QuestMobile 发布的 AI 报告里,天工默默干到了国内 AI 独立应用月活前三,坐拥八百多万的月活。
其实天工 AI 能有这么多用户,差评君并不惊讶。
就拿差评君来说吧,以前一个选题总要在搜索软件里泡上一两天,才能动笔,还得时刻提防那些隐藏的广告。
被传统搜索折磨惨了的我们,早就是人手几个 AI 搜索了。
每篇稿件都有一份整理的资料文档
真正让差评君惊讶的就是,天工 AI 是怎么从众多同行里脱颖而出,成了圈子里的头牌的。
其实天工 AI 是咱们的老朋友了,早在去年 8 月份首发的时候,差评君就上手过了。
以差评君的使用次数,那绝对可以说是看着天工 AI 长大的。不过才短短半年时间,他们就又铆足了劲交了个天工大模型 3.0 的全新版本出来。
在差评君抢先体验后觉得,这次更新可谓是脱胎换骨,甚至值得咱们再拿出来细细咂摸一番。
因为在很多中文场景下,它表现得比 Perplexity 还要不俗,更适合中国宝宝体质。
就这个话题热搜,就太对胃口
我们简单试试,就能明白差评君在说什么了。
差评君就问了一个看似简单的问题:OpenAI 要做AI 搜索的信息源头是什么?
传统搜索这边,跳出来一堆文章不算,我翻遍了前两篇,也没找到 OpenAI 是哪家媒体先爆料的。
但对天工 AI 来说,这题简单得够呛。不仅直接点出是 The Information 最先报道,还拓展补充了很多相关信息。
天工AI
让我有些意外的是,把同样的问题丢给 Perplexity 。它却明显理解错了我的语义,把报道信息源理解成了 OpenAI 搜索技术提供的源头是什么。
Perplexity
后面差评君又追问了一道比较难的题目,让它们试着给我推荐餐厅。
以前试过 NewBing 的人,肯定知道这种实时的问题,向来是 AI 搜索的软肋。还有什么天气情况、路线规划等等。
但对于现在的天工 AI 来说,真的就是切瓜砍菜。
它抓取信息非常精准,甚至会帮你从视频里扒答案,就比如找到抖音上的美食推荐。
相对来说, Perplexity 的表现肉眼可见的略逊一筹。给我“ 贴心 ”地推荐了in77 地下车库,还祝我用餐愉快。
到这里,你就能感觉到在中文和国内的实时信息上,天工 AI 要强出一截。
如果你觉得这样还不满意,别急,天工还上新了增强模式。开启之后,会大大提高回复质量。即便一次性甩过去好几个问题,它也能逐一拆分出来。
甚至会对一些模糊的问题,做进一步的提问引导。
尤其适合解决一些复杂问题,像之前差评君做过一期 B 站视频,讲古代人是怎么测绘地图的。
这个题,我们前前后后大概花了一周的时间。但甩给天工 AI,它可以瞬间帮你总结出起码 4 个大类的信息。
如果你还不满意,我们还可以进一步追问,直到把问题梳理清楚。
除了把基础实力打磨得更扎实,在国产厂商们擅长的用户体验上,天工 AI 也花了不少心思。
差评君用下来觉得很舒服,像很多问题大模型给一堆文字,不如一张图片来得清晰明了。
所以,除了文本回答之外,天工 AI 的回答还会附带图片、甚至是视频。
如果是一些涉及对比的问题,比如两款手机对比、旅游城市对比,天工 AI 可以自动做出一张对比表格,好坏优劣一目了然。
之后,还会新增搜图片、搜视频、搜音频的垂直能力,以及更多具有实用性的展现形式。
差评君这里就不一一展示了,留给大家自己去上手。研究模式和思维导图输出
看到这,很多差友可能会好奇。士别才三日,怎么就得刮目相看了?
自己还停留在 NewBing 时代呢,这才半年时间,天工 AI 就把水准往上拔了大一截了?
不仅检索精准度变高了,连视频都能扒了,也不像曾经大部分 AI 那样一本正经胡说八道了。
其实秘密就藏在昆仑万维这次新上的两个狠货里,也是两个目前圈子里大热的前沿技术架构,一个是 MoE,一个是 RAG。
你不要一听到专业术语就慌,差评君一分钟就能给你讲明白咯。
首先是这个 MoE ,也叫混合专家模型。顾名思义,就是内置了数个专家模型的大模型。
举个例子吧,比如我们输入:金毛火锅今年 7 岁了,未来五年内会不会得糖尿病?
这一个小问题,其实涉及了性别、年龄、品种、糖尿病的成因等各种方面。
天工 AI 就会把它拆分成一个一个小任务,再由一个专门负责分配的模型,把任务下发给手下最擅长的专家模型。比如有的研究性别,有的研究品种。
这跟咱们写文章很像,像小发擅长写游戏,世超挖掘好用的软件更有一套。把专业的事交给专业的人办,才能把效率和效果都拉满。
而且,那些用不着的模型还能中途偷个懒,把算力节省下来。
这边有专业团队负责输出内容,那边昆仑万维又准备了 RAG 技术,来负责把控大模型的知识库。
这个 RAG 技术理解起来其实更简单,就是检索 + 文字生成。
以前我们提出一个问题,大模型会直接拿着这个问题去茫茫大海中打捞信息,然后直接输出结果。
但 RAG 在交给大模型生成答案之前,还多了一步单独的检索步骤。
先拆解我们的问题,然后找到大量相关的信息和内容,比如金毛的体质、糖尿病的生成原因等等。
再从这些内容里,检索出和关键词最相关的信息。
把这些信息和我们的问题,一起整理出一份新的、更专业的 prompt ,最后才会喂给大模型去输出内容。
这多出的整理步骤,不仅提高了信息查找的效率,也让每一个回答,也都有可以追溯的源头,减少大模型出现幻觉的概率。
这个技术,早已经在慢慢取代那些简单的问答 bot 机器。
也正是装上了这两个最前沿的技术,使得天工 AI 和传统搜索,甚至是初代 AI 搜索的差距越拉越大。
在 MEET 智能大会上,昆仑万维董事长兼 CEO 方汉曾经分享过一组对比数据。
传统搜索的时代,我们输入一个问题,然后再去阅读大量网页,最后分析总结出结果,这个过程一般耗时 3-10 分钟。
任何人都很难再缩短这个时间。
但在大模型时代,每次获取结果的时间,可以被压缩到 5-10 秒。
在这样的高效率面前,传统搜索们给AI 搜索让路,是一个必然的结果了。
虽然现在取代传统搜索还为时尚早。但由奢入俭难,用过了这种高效的 AI 搜索模式,就很难再换回去。
搜索引擎的下半场,注定要进入高效的 AI 时代。以天工 AI 为代表的生成式搜索模式,将会后来居上。虽然说不好谁能笑到最后,但谁先入场,站稳脚跟,也就赢了一半了。
平静了 30 年多年的搜索引擎市场,恐怕要迎来一场变革。