大模型降温? AI小虎讲新故事: 抢做能用好用的Agent

  • 2025-08-03 04:04:48
  • 353

8月1日凌晨,Manus首席科学家Peak季逸超公开表示,Manus发布新功能WideResearch,该功能目前仅对Pro用户开放,未来会陆续向Basic和Plus用户开放。Peak上次为产品录制视频还是今年3月Manus引发关注、引起Agent热潮时。随后的一段时间内,Manus经历了裁员风波、与阿里在中国的合作搁置等事件。

在Manus传来最新消息的同时,国内的Agent(智能体)厂商也探索出了一套新的玩法。今年的世界人工智能大会(WAIC)上,阶跃星辰、月之暗面、MinMax、智谱这四家“AI大模型小虎”齐聚现场,都讲出了新的故事。

大模型降温?Agent登场

根据官方数据,今年WAIC吸引了800余家企业特别是国内数十家AI龙头链主企业参展,共有40余款大模型集中亮相。根据公开报道,2024年WAIC的大模型数量有近百款。与参展模型数量相对应的是核心厂商的减少——今年WAIC“AI大模型六小虎”中的百川智能与零一万物都缺席了。

仍在参展的“小虎”找到了新范式——Agent。

阶跃星辰在WAIC正式开始前发布了其新一代基础大模型Step3。在展位前,阶跃联合吉利推出的AI智能座舱吉利银河M9让现场想体验的观众排起了长龙。据现场工作人员介绍,搭载了阶跃星辰多模态大模型的AI智能座舱在行业内首次实现了端到端语音大模型的量产上车。南都N视频记者还了解到,目前在手机方面阶跃星辰已覆盖国内超过一半头部国产手机厂商,深度合作打造手机Agent体验。

月之暗面的今年的展台则颇为简朴。不过就在WAIC前两周,月之暗面正式发布并开源了万亿参数的KimiK2大模型,同样强调模型的据通用Agent任务能力。

智谱在WAIC最后一日(7月29日)发布了新模型GLM-4.5和GLM-4.5-Air,介绍性能时表示,在涵盖智能体(3项)、推理(7项)和编程(2项)的12个基准测试上,将GLM-4.5与来自OpenAI、Anthropic、GoogleDeepMind、xAI、阿里巴巴、月之暗面和深度求索的各种模型进行了比较,测评结果显示智谱模型能力目前在国内排名第一。

更早前的6月,另一家大模型小虎Minimax开启了连续5天的新品发布,其中重点发布了目前行业最高难度运动场景的新视频生成模型Hailuo02和MiniMaxAgent、视频Agent等产品。

“为什么2023年大家不怎么谈Agent,到了2025年才说是Agent元年?今年大模型能力已经到这个水平了,它能支撑真正的Agent。”商汤科技联合创始人、执行董事、首席科学家林达华在WAIC上提到,Agent是大模型能力落地真实世界的重要技术载体,依赖非常强的推理、反思、规划、决策能力,这些能力都依托于大模型来产生。

Agent从通用走向垂类场景

自今年3月Manus刮起Agent大风后,多个Agent随之出现,让用户等待许久、花费了诸多算力,但跑出来的成品根本不能用。当AI故事从大模型转向Agent,除了抛概念、追风口,大家更关注的是能不能创造价值。

“Agent最后要走通的,一是需要基础模型有比较强的制定跟随、意图反思、编程、推理等能力;二是一定要围绕打穿场景去迭代,否则这个Agent的价值是不落地的。对于真实的场景来说,最重要的是Agent的成功率。最怕的就是它半天给你做了一大堆的事,最后不能解决你的问题、你还得重做一遍。”林达华提到,尽管目前通用Agent产品在刷测评榜单时看上去分数都很高,但商汤内部在用这些产品时会看到它们并不落地。

打造场景化、垂类Agent产品,正在成为一大行业趋势。

7月27日,在WAIC上,腾讯集中展示了12个垂直智能体(Agent)应用,覆盖企业服务、生活服务与办公效率三大核心场景。以共富AI智能体为案例,腾讯SSV为村共富乡村负责人陈晶晶现场介绍,当下广阔乡村恰恰急缺专业的经营性人才,导致大量的优质“土特产”和农文旅产品难以高效衔接市场,共富AI智能体首版产品主要针对微信生态的“土特产”小店与农文旅营销两大核心场景,通过一次流程即可生成“土特产”电商素材和农文旅营销全案内容。

金山办公则在最新推出的WPSAI3.0版本——WPS灵犀中搭载了Agent能力,专攻打工人的办公场景。南都记者在现场看到,在实机演示中,AIPPT将一篇演讲稿润色、在规定时间内分成了适配讲解速度的页数,还能实现挑选模板后一键生成,文字格式做到整齐、自主排版,可达到交付的效果。

参观者在WAIC展览现场体验使用WPSAI办公操作系统。

“通用智能体非常强大,但企业不可能将数据传送到云端数据库,私有化部署很重要,在与客户对接的过程中,我们发现用户的需求都极其个性化,目前我们采取的模式是端到端的项目制交付的方式。”极光集团副总裁殷浩向南都N视频记者介绍,极光旗下GPTBots.ai在本次WAIC面向企业端上新全新Multi-Agent平台,该平台内置多种开箱即用的AIAgent,提供涵盖开发、产品、测试、算法、数据、营销等多个领域的AIAgent角色,已布局了售前咨询、售后客服、数据分析和撰写专业报告等场景,目前90%以上的业务都布局在海外。

谈及Agent在C端和B端的商业化情况,殷浩认为C端未必一定走不通。“我们没有做C端产品,并不是认为C端走不通。当B端用户需求共性足够多时,也许可以将这些共性提炼成一个C端的产品。我们做海外市场是需要和各国进行交流,在交流过程中会发现翻译就是Agent的一个很好的场景,目前我们还在验证这个产品的过程中。C端并不一定就不能盈利,考验的是极致的产品能力”。

作为专注金融服务领域的自研大语言模型,“恒纪元”由恒生活数科技术团队于2023年11月7日重磅发布。在本届展会上,依托“恒纪元”打造的六大智能应用矩阵也悉数登场:“智能对话机器人”、“智能文本机器人”、“AI资产分析师”、“AI资产管理系统”、“AI法律服务平台”以及“恒纪元AI智能体开发工厂”。据悉这些应用以场景化落地为核心,通过算法迭代与行业知识深度融合,加速推动金融服务模式转型升级。