大模型的未来，是 Agent 还是 App？

✨ 「导读」：OpenAI 和 Anthropic 最新的进展引发了关于未来计算形态的广泛讨论：是 Agent 还是 App 将主导这个新世界？让我们一起探讨这个充满变革的时代吧！

模型即产品：从 Deep Research 到 Claude 3.7 💡

OpenAI 的 Deep Research 🌟

最近，OpenAI 推出了全新的 「Deep Research」，它可不是简单的 O3（OpenAI 的大型语言模型）的增强版哦！Deep Research 经过专门训练，能够在内部执行复杂的搜索任务，完全不需要依赖外部调用或提示。通过强化学习，它掌握了核心浏览能力（如搜索、点击、滚动和解析文件），并能综合大量网站信息生成结构连贯的长篇报告。

这种新型“研究语言模型”与传统 LLM 和聊天机器人有着本质区别。比如，Google 的 Gemini 和 Perplexity 的聊天助手虽然也提供深度研究功能，但它们并未公开具体的优化细节或进行实质性评估。这表明，真正的创新在于重新设计模型本身，而不是简单的工作流调整。

Anthropic 的 Agent 观念 📚

Anthropic 对 Agent 的定义更为严格：Agent 必须在内部执行目标任务，而不是依赖预定义的工作流。这意味着 Agent 能够动态指导自己的过程和工具使用，自主控制任务完成方式。当前大多数所谓的 Agent 实际上只是工作流系统，通过固定代码路径编排 LLM 和工具。

Claude 3.7 的发布进一步验证了这一观点。该模型专注于处理复杂代码用例，并在软件工程基准测试中表现出色。这不仅展示了重新设计模型的巨大潜力，还预示着未来 Agent 将逐步取代现有工作流系统。

应用公司的未来：挑战与机遇 💼

如果大模型能够实现端到端的任务处理，那么传统的应用公司将面临巨大挑战。以 RAG（Retrieval-Augmented Generation）为例，当前系统由多个脆弱的工作流组成，涉及路由、分块、重排序等多个环节。随着训练技术的进步，这些流程有望整合为两个独立但相互关联的模型：一个用于数据准备，另一个用于搜索/检索/报告生成。

这种转变意味着复杂性从部署转移到训练阶段，使得最终用户受益于更简单易用的系统。然而，这也带来了新的问题：大部分价值将由模型训练者创造并获取。对于应用公司来说，如何在这种新形势下找到新的增长点将是关键。

结论 🎯

大模型的未来究竟会是 Agent 还是 App？答案可能介于两者之间。一方面，Agent 的出现确实动摇了传统应用的基础；另一方面，某些特定领域的工作流仍然具有不可替代的价值。无论如何，可以肯定的是，未来的计算形态将更加智能化和自主化，而这背后的核心驱动力正是不断进化的模型设计与训练方法。

希望这篇文章能让你感受到大模型带来的无限可能！❤️ 如果你觉得有帮助，记得点赞哦！🌟

目录CONTENT

大模型的未来，是 Agent 还是 App