今天,笔者受邀来到了百度科技园,参加百度 AI 开放日活动——
这次主角是“秒哒”。
Manus 一码难求和复现热潮还没过,没想到,百度秒哒来踢馆了!而且宣布,这次是正式全量上线。
去年 11 月在百度世界大会上,秒哒首次亮相就爆火,今天终于等到了全量上线。
有意思的是,在大会现场,我进来第一眼就注意到了前排座位上竟然有位保安大爷?这是摸鱼还是 NPC 啊...
而且我发现,这次大会现场的排布比较奇特,是由一个个“圆桌”组成的大会现场。而且每个圆桌上,都有一台 Mac 电脑。
我先抢了个 C 位。
发布会开始不一会儿,我发现文章开头提到的“神秘保安大爷”的谜底也揭晓了——
好家伙,果然是个 NPC。
这位百度科技园的修车大爷都用秒哒搞了个修车预约小程序。
看完这个视频,我觉得 o3 不一定能砸碎程序员的饭碗,但秒哒开始展现出这个潜力了。
再来看一段视频,用百度秒哒“开发”的一个博客网站——
先划重点——
全程无代码:没有技术背景的普通用户也可以变身程序员了 多智能体协作:产品经理、UI 设计师、架构师、程序员齐活协作 LGUI 新范式:UI 组件拖拽 + 用嘴开发可同时进行 应用全生命周期覆盖:应用开发完成后,可绑定域名直接发布,甚至完成运维监控等
从视频看,这个网站的完成度属实有点高了,跟我用国外大模型 +Artifacts 范式出来的玩具级网站已经不在一个次元了。
虽然现在大模型编程能力越来越强,市面上的 AI 编程工具/智能 IDE 也越来很多,但这些更多是给程序员打辅助的,非专业人群依然很难借助这些工具,将自己的应用创意转化成立即可用的网站/应用,如果未来秒哒真能打磨到高可用落地水平,那么无论是 C 端还是 B 端,都是一个极具颠覆性的事情。
看到这儿,你可能会问,市面上类似秒哒的“文生应用”的产品也不少了,秒哒有什么特殊的地方吗?
多智能体协作
我觉得秒哒里面,最有意思的就是它搞了个“智能体协作矩阵”。
在秒哒里,内置了十余个智能体,包括:
需求收集阶段:需求澄清智能体、需求推荐智能体、需求改写智能体 应用生成阶段:架构师智能体、程序员智能体、设计师智能体、质检员智能体 内容生成阶段:数据生成智能体、图片生成智能体、文案生成智能体
根据用户的任务需求,秒哒自动、灵活地调用不同技能的智能体,这些智能体通过协同工作,最终能形成一个端到端的应用开发解决方案,覆盖从需求分析到最终交付的全流程。
需要强调的是,这些智能体可不是通过 system prompt 简单搞出来的“角色扮演型”娱乐级智能体,每一个智能体的背后,都是经过了大量专业知识训练和相关的任务策略迭代。
并且,智能体的背后,都内置了“数据飞轮”,可通过历史任务数据来总结、反思,不断进化,持续完善自己的专业能力。
而做过多智能体协作系统的小伙伴都知道,这种系统,要做出实用价值,背后还离不开大量的“协作策略”的优化。否则,多个智能体之间的工作非常容易产生冲突(出错)或无效的重复工作(费钱)。
为此,秒哒为这套复杂的多智能体协作系统,设计了专用的通信协议和任务分配机制,确保各个智能体能够无缝配合。
这一套业界首创的“多智能体协作范式”,也是秒哒背后的效果保障以及能持续打破效果天花板的范式保障。
多工具调用
如果你用过大模型 +Artifacts 来开发网站轻应用,你肯定还会熟知一个“文生应用”的痛点——
AI 开发的应用,普遍是纯前端应用,像打电话、收发验证码、地图调用等后端 API 操作,是做不到的。
为此,秒哒团队基于百度自身的生态优势,打造了一套多工具调用体系——
秒哒这里的多工具调用,让网站具备了后端集成能力,甚至打通了百度智能云的 API 体系,验证码、百度地图,把开发复杂网站应用所需要的 API 能力都被集成进来了。
这个 feature,使得 AI 所能开发的应用类型边界被大大的拓宽了。
比如,我要组织大家去颐和园赏花,让它开发一个「报名表单收集」的应用工具——
可以调用百度地图,给出活动地址; 应用发布后就会生成一个二维码,只需要把二维码发群里,让大家扫码填写; 最重要的是,还有后台管理功能,我能看到详细的报名信息。
这就是多工具调用的能力。
但是,将众多的 API 完全开放给 AI 去调用的话,又会引入复杂的访问权限和安全问题。像 Claude 生态的 MCP 协议生态,也同样饱受这个问题的困扰。
而秒哒,则是巧妙的建立了一个 API 中心 + 分工明确的多智能体协作系统。在 API 中心,可以实现对每个工具的调用做细粒度的权限控制,确保只有授权的智能体才能调用特定工具。此外,API 中心还支持了智能体之间的工具共享与复用,进一步提升工具的利用率。
软件开发最后一公里:LGUI 双模交互
用户只需要动动嘴说话就能开发网站,如果“用嘴开发”出来的网站,需要调整 UI 细节、排版,用鼠标拖拉拽的方式无疑是比文字表达更高效的。
因此,秒哒在“文生应用”的基础上,将 GUI 元素拖拽修改的能力也集成进来了——
通过 UI 元素拖拉拽,可以高效解决 UI 细节调整问题,可以说是软件开发的最后一公里。
这种结合了自然语言开发(LUI)和传统图形化 UI 开发(GUI)的新范式,被秒哒称为“LGUI 双模交互”。
搞钱神器?
实话说,我看完发布会后,脑子里出现的第一个词儿就是——
搞钱神器。
要知道,在软件外包市场,开发交付一个小程序或简单的网站,最少也要几千块钱。稍微有点难度的,就要数以万计了。
而对于秒哒来说,不止是邀请函、海报等纯前端的 H5/网站,像营销落地页、电商站点、餐饮订餐等需要后端能力的高商业价值应用,同样有“直出”的能力。
这意味着,以往需要专业的软件开发团队研发数日才能交付的“轻应用”,通过秒哒可能几分钟就调的差不多了。
对于能 touch 到客户资源的用户/企业来说,秒哒可能会成为一个实实在在的搞钱神器。
正如秒哒的产品初衷——让人人都能成为开发者,未来,应用开发的边界可能会真的因此而变得不同。
最后,附上秒哒传送门:
https://miaoda.baidu.com