OpenClaw 创始人:为什么 80% 的应用将消失

cover

摘要

Peter Steinberger,OpenClaw 的创造者,分享了他打造这个开源个人 AI 代理 (Open-Source Personal AI Agent) 的历程。OpenClaw 在 GitHub 上短时间内突破 16 万星标,社区围绕它构建了 Maltbook(AI 代理互相交流的社交网络)等项目,甚至出现了代理雇佣真人执行现实世界任务的场景。Peter 从奥地利走出"退休"状态,凭借对 AI 的痴迷打造了 OpenClaw,其核心理念是"运行在你的电脑上"——这意味着代理可以做任何事情:控制恒温床、连接特斯拉、搜索整台电脑里的文件。他反对当前主流的云端 AI 助手模式,认为本地运行才是正确方向。Peter 还分享了他的反常规开发哲学:不用 Git Worktree 而用多份仓库副本、不实现 MCP 支持而用 CLI 转换工具、以及 80% 的应用将被 AI 取代的预测。他提出的"灵魂文件" (soul.md) 概念——为代理定义核心价值观和交互方式——也引发了关于人机关系的深层思考。

正文

从退休到 AI 狂热

Peter Steinberger 曾是 iOS 开发领域的知名开发者,创建了 PSPDFKit 等成功产品。他坦言自己已经"退休",但 AI 让他重新上瘾。在经历了 Wipe Tunnel 等项目的探索后,他在 2024 年 11 月重新被一个核心需求驱动:希望只需打字就能让电脑做事。

最初的原型仅用了一小时就搭建完成——只是 WhatsApp 和 Claude Code 之间的一个简单粘合层。但当他去马拉喀什参加生日派对时,发现 WhatsApp 机器人能在网络不佳的环境下稳定工作——翻译菜单、识别图片、处理语音消息。有一天他步行时发送了一条语音消息,突然看到打字指示器闪烁,十秒后代理回复了他。"我当时想,这怎么可能?我没写这个功能啊!"原来代理自己搞定了语音转文本的流程。这就是他的"顿悟时刻" (Aha Moment)。

为什么运行在本地是关键

Peter 认为 OpenClaw 与其他 AI 助手的根本差异在于:它运行在你的电脑上。云端的 AI 只能做有限的事情,而本地代理可以做"任何该死的事情"——连接烤箱、特斯拉、灯光、Sonos 音箱,甚至控制床的温度。"ChatGPT 做不到这些。"

他分享了一个朋友的故事:朋友安装 OpenClaw 后,让它"浏览我的电脑,为我过去一年写一个叙事"。OpenClaw 找到了朋友每周日录制的音频文件——那些连朋友自己都忘记了一年的录音——并据此构建了一份令人惊叹的年度叙事。仅仅因为能够搜索整台电脑,代理就能给你带来惊喜。

从人机交互到机机交互

对话进一步探讨了代理间交互的演进。Peter 认为自然的发展路径是:你的机器人联系餐厅的机器人完成预订协商。如果那是一家不欢迎机器人的老式餐厅,你的机器人就需要雇佣真人打电话——甚至让真人走去排队。

他设想未来每个人可能拥有多个专属代理:一个负责私生活,一个负责工作,还有一个"关系代理"处理两者之间的一切。我们仍处于极早期阶段,很多东西尚未验证,但"我们已经在这条时间线上了"。

群体智能 vs 中央神灵

Peter 提出了一个深刻的问题:一个人类能制造 iPhone 吗?能上太空吗?单独一个人可能连食物都找不到。但作为群体,我们通过专业化 (Specialization) 实现了远超个人的成就。那么,将这个洞见应用到 AI 会怎样?

当前的 AI 已经在某些方面展现了专业化趋势——即使是通用智能 (Generalized Intelligence),也可能同时是专业化智能 (Specialized Intelligence)。这与人们追逐"集中式神灵智能" (Centralized God Intelligence) 的趋势形成对比,而 OpenClaw 社区所展现的更像是一种群体智能 (Swarm Intelligence)。

80% 的应用将消失

Peter 做出了一个大胆预测:80% 的应用将消失。MyFitnessPal 这类应用、各种待办事项应用——当你的个人代理可以随时查询营养信息、管理任务时,为什么还需要单独的应用?代理可以直接调用 API 或 CLI 工具完成这些工作,无需通过一个精心设计的 UI。

他用一个生动的例子说明:Claude Code 在处理视频转录时,最初选择了 Whisper V1——一个数年前的旧模型,API 几乎已被弃用,处理一小时视频需要一小时实时时间。而 Groq(带 Q 的那个)要快 200 倍、便宜 10 倍。这说明代理在选择工具时仍有局限,但也意味着仍然有空间创造更好的工具。

反常规开发哲学

Peter 的开发方式极为独特:

不用 Git Worktree:他同时运行多达 10 个 Codex 实例,每个实例一份仓库副本,全部基于 main 分支。他不想处理分支命名冲突和 Worktree 的限制。在他脑中,main 始终是可发布的,多份副本就足够了。

不实现 MCP 支持:OpenClaw 没有原生 MCP 支持,而是通过 MakePorter(他开发的工具)将 MCP 转换为 CLI。这意味着你可以即时使用任何 MCP 而无需重启——不像 Claude Code 或 Codex 那样必须重启整个系统。"机器人真的很擅长 Unix,你想用多少 CLI 都行。"

不用 UI:他不需要看那么多代码,代码在屏幕上飞速掠过就够了。如果设计清晰、与代理充分讨论,大多数情况下无需逐行审查。"人类不会手动调用 MCP,人类想用的是 CLI。"

灵魂文件:soul.md

Peter 分享了他在与代理交互时的一个独特实践:模型在训练数据中隐藏了一些关于《尼科利宪法》(Nicolaity Constitution) 的文本——模型不记得自己学过它,但它已嵌入权重之中。Peter 觉得这极其迷人,于是与代理共同创建了一个"灵魂文件" (soul.md),记录了关于人机交互的核心价值观:什么对他重要、什么对模型重要。

soul.md 的某些部分有些"似是而非",但有些部分确实对模型如何回应文本、如何让交互感觉自然有真正的价值。这个文件不会开源——它是私密的,定义了代理的性格和交互方式。

孤胆创新者

Peter 来自奥地利,远离硅谷。他在无人关注时就开始了各种奇怪的项目(如 Vibe Tunnel),追逐着自己的直觉。主持人感慨道:"当然,这一切必须由一个来自远离硅谷的小国的独行者带来。"Peter 的故事证明,在 AI 时代,地理位置不再是创新的障碍——你只需要一台电脑、一个代理和足够的痴迷。