大模型的未来,是 Agent 还是 App?
✨ 「导读」:OpenAI 和 Anthropic 最新的进展引发了关于未来计算形态的广泛讨论:是 Agent 还是 App 将主导这个新世界?让我们一起探讨这个充满变革的时代吧!
模型即产品:从 Deep Research 到 Claude 3.7 💡
OpenAI 的 Deep Research 🌟
最近,OpenAI 推出了全新的 「Deep Research」,它可不是简单的 O3(OpenAI 的大型语言模型)的增强版哦!Deep Research 经过专门训练,能够在内部执行复杂的搜索任务,完全不需要依赖外部调用或提示。通过强化学习,它掌握了核心浏览能力(如搜索、点击、滚动和解析文件),并能综合大量网站信息生成结构连贯的长篇报告。
这种新型“研究语言模型”与传统 LLM 和聊天机器人有着本质区别。比如,Google 的 Gemini 和 Perplexity 的聊天助手虽然也提供深度研究功能,但它们并未公开具体的优化细节或进行实质性评估。这表明,真正的创新在于重新设计模型本身,而不是简单的工作流调整。
Anthropic 的 Agent 观念 📚
Anthropic 对 Agent 的定义更为严格:Agent 必须在内部执行目标任务,而不是依赖预定义的工作流。这意味着 Agent 能够动态指导自己的过程和工具使用,自主控制任务完成方式。当前大多数所谓的 Agent 实际上只是工作流系统,通过固定代码路径编排 LLM 和工具。
Claude 3.7 的发布进一步验证了这一观点。该模型专注于处理复杂代码用例,并在软件工程基准测试中表现出色。这不仅展示了重新设计模型的巨大潜力,还预示着未来 Agent 将逐步取代现有工作流系统。
应用公司的未来:挑战与机遇 💼
如果大模型能够实现端到端的任务处理,那么传统的应用公司将面临巨大挑战。以 RAG(Retrieval-Augmented Generation)为例,当前系统由多个脆弱的工作流组成,涉及路由、分块、重排序等多个环节。随着训练技术的进步,这些流程有望整合为两个独立但相互关联的模型:一个用于数据准备,另一个用于搜索/检索/报告生成。
这种转变意味着复杂性从部署转移到训练阶段,使得最终用户受益于更简单易用的系统。然而,这也带来了新的问题:大部分价值将由模型训练者创造并获取。对于应用公司来说,如何在这种新形势下找到新的增长点将是关键。
结论 🎯
大模型的未来究竟会是 Agent 还是 App?答案可能介于两者之间。一方面,Agent 的出现确实动摇了传统应用的基础;另一方面,某些特定领域的工作流仍然具有不可替代的价值。无论如何,可以肯定的是,未来的计算形态将更加智能化和自主化,而这背后的核心驱动力正是不断进化的模型设计与训练方法。
希望这篇文章能让你感受到大模型带来的无限可能!❤️ 如果你觉得有帮助,记得点赞哦!🌟
评论区