OpenClaw 创始人：为什么 80% 的应用将消失

cover

摘要

Peter Steinberger，OpenClaw 的创造者，分享了他打造这个开源个人 AI 代理 (Open-Source Personal AI Agent) 的历程。OpenClaw 在 GitHub 上短时间内突破 16 万星标，社区围绕它构建了 Maltbook（AI 代理互相交流的社交网络）等项目，甚至出现了代理雇佣真人执行现实世界任务的场景。Peter 从奥地利走出"退休"状态，凭借对 AI 的痴迷打造了 OpenClaw，其核心理念是"运行在你的电脑上"——这意味着代理可以做任何事情：控制恒温床、连接特斯拉、搜索整台电脑里的文件。他反对当前主流的云端 AI 助手模式，认为本地运行才是正确方向。Peter 还分享了他的反常规开发哲学：不用 Git Worktree 而用多份仓库副本、不实现 MCP 支持而用 CLI 转换工具、以及 80% 的应用将被 AI 取代的预测。他提出的"灵魂文件" (soul.md) 概念——为代理定义核心价值观和交互方式——也引发了关于人机关系的深层思考。

正文

从退休到 AI 狂热

Peter Steinberger 曾是 iOS 开发领域的知名开发者，创建了 PSPDFKit 等成功产品。他坦言自己已经"退休"，但 AI 让他重新上瘾。在经历了 Wipe Tunnel 等项目的探索后，他在 2024 年 11 月重新被一个核心需求驱动：希望只需打字就能让电脑做事。

最初的原型仅用了一小时就搭建完成——只是 WhatsApp 和 Claude Code 之间的一个简单粘合层。但当他去马拉喀什参加生日派对时，发现 WhatsApp 机器人能在网络不佳的环境下稳定工作——翻译菜单、识别图片、处理语音消息。有一天他步行时发送了一条语音消息，突然看到打字指示器闪烁，十秒后代理回复了他。"我当时想，这怎么可能？我没写这个功能啊！"原来代理自己搞定了语音转文本的流程。这就是他的"顿悟时刻" (Aha Moment)。

为什么运行在本地是关键

Peter 认为 OpenClaw 与其他 AI 助手的根本差异在于：它运行在你的电脑上。云端的 AI 只能做有限的事情，而本地代理可以做"任何该死的事情"——连接烤箱、特斯拉、灯光、Sonos 音箱，甚至控制床的温度。"ChatGPT 做不到这些。"

他分享了一个朋友的故事：朋友安装 OpenClaw 后，让它"浏览我的电脑，为我过去一年写一个叙事"。OpenClaw 找到了朋友每周日录制的音频文件——那些连朋友自己都忘记了一年的录音——并据此构建了一份令人惊叹的年度叙事。仅仅因为能够搜索整台电脑，代理就能给你带来惊喜。

从人机交互到机机交互

对话进一步探讨了代理间交互的演进。Peter 认为自然的发展路径是：你的机器人联系餐厅的机器人完成预订协商。如果那是一家不欢迎机器人的老式餐厅，你的机器人就需要雇佣真人打电话——甚至让真人走去排队。

他设想未来每个人可能拥有多个专属代理：一个负责私生活，一个负责工作，还有一个"关系代理"处理两者之间的一切。我们仍处于极早期阶段，很多东西尚未验证，但"我们已经在这条时间线上了"。

群体智能 vs 中央神灵

Peter 提出了一个深刻的问题：一个人类能制造 iPhone 吗？能上太空吗？单独一个人可能连食物都找不到。但作为群体，我们通过专业化 (Specialization) 实现了远超个人的成就。那么，将这个洞见应用到 AI 会怎样？

当前的 AI 已经在某些方面展现了专业化趋势——即使是通用智能 (Generalized Intelligence)，也可能同时是专业化智能 (Specialized Intelligence)。这与人们追逐"集中式神灵智能" (Centralized God Intelligence) 的趋势形成对比，而 OpenClaw 社区所展现的更像是一种群体智能 (Swarm Intelligence)。

80% 的应用将消失

Peter 做出了一个大胆预测：80% 的应用将消失。MyFitnessPal 这类应用、各种待办事项应用——当你的个人代理可以随时查询营养信息、管理任务时，为什么还需要单独的应用？代理可以直接调用 API 或 CLI 工具完成这些工作，无需通过一个精心设计的 UI。

他用一个生动的例子说明：Claude Code 在处理视频转录时，最初选择了 Whisper V1——一个数年前的旧模型，API 几乎已被弃用，处理一小时视频需要一小时实时时间。而 Groq（带 Q 的那个）要快 200 倍、便宜 10 倍。这说明代理在选择工具时仍有局限，但也意味着仍然有空间创造更好的工具。

反常规开发哲学

Peter 的开发方式极为独特：

不用 Git Worktree：他同时运行多达 10 个 Codex 实例，每个实例一份仓库副本，全部基于 main 分支。他不想处理分支命名冲突和 Worktree 的限制。在他脑中，main 始终是可发布的，多份副本就足够了。

不实现 MCP 支持：OpenClaw 没有原生 MCP 支持，而是通过 MakePorter（他开发的工具）将 MCP 转换为 CLI。这意味着你可以即时使用任何 MCP 而无需重启——不像 Claude Code 或 Codex 那样必须重启整个系统。"机器人真的很擅长 Unix，你想用多少 CLI 都行。"

不用 UI：他不需要看那么多代码，代码在屏幕上飞速掠过就够了。如果设计清晰、与代理充分讨论，大多数情况下无需逐行审查。"人类不会手动调用 MCP，人类想用的是 CLI。"

灵魂文件：soul.md

Peter 分享了他在与代理交互时的一个独特实践：模型在训练数据中隐藏了一些关于《尼科利宪法》(Nicolaity Constitution) 的文本——模型不记得自己学过它，但它已嵌入权重之中。Peter 觉得这极其迷人，于是与代理共同创建了一个"灵魂文件" (soul.md)，记录了关于人机交互的核心价值观：什么对他重要、什么对模型重要。

soul.md 的某些部分有些"似是而非"，但有些部分确实对模型如何回应文本、如何让交互感觉自然有真正的价值。这个文件不会开源——它是私密的，定义了代理的性格和交互方式。

孤胆创新者

Peter 来自奥地利，远离硅谷。他在无人关注时就开始了各种奇怪的项目（如 Vibe Tunnel），追逐着自己的直觉。主持人感慨道："当然，这一切必须由一个来自远离硅谷的小国的独行者带来。"Peter 的故事证明，在 AI 时代，地理位置不再是创新的障碍——你只需要一台电脑、一个代理和足够的痴迷。