40位AI创始人共话当前人工智能技术

cover

摘要

在人工智能技术狂飙突进的当下，40位前沿AI创始人齐聚一堂，以亲身实践者的视角，揭示了生成式AI令人始料未及的潜能与现实困境。他们坦言，AI早已渗透进生活的最细微处——从代写婚礼致辞、设置个性应答机，到将编程效率提升至前所未有的高度。然而，这项技术最反直觉的特性在于：它出人意料地擅长创意叙事，却难以分辨事实与虚构。创始人分享了各自领域的真实应用，包括语义搜索、时尚趋势洞察与自动生成软件界面；同时深入剖析了驾驭非确定性模型所必需的“提示工程”与持续迭代策略。访谈反复触及生成式AI的“双重面目”：一方面，它能创造出极其逼真却不存在的内容，形成所谓的“幻觉”；另一方面，为抑制幻觉而施加的约束，又可能让它对已知信息讳莫如深。因此，几乎所有创始人都强调，在关键决策环节中保留“人机回环”（Human-in-the-Loop）是当下不可逾越的安全底线。本文将这些珍贵洞见凝练为六大篇章，全景式展现生成式AI从编码辅助、商业落地到伦理反思的立体图景，并最终回归一个朴素的共识——技术的终极使命，仍然是服务并深化人与人的真实连接。

正文

第一章日常里的AI：从婚礼致辞到极速编码

访谈伊始，一个轻松的问题揭开了AI如何静默重塑个人生活。一位创始人分享了自己用AI撰写婚礼祝词的小故事，半开玩笑地犹豫是否应该说出来。另一些创始人则将语音应答机设置为克隆的嗓音，以一段慵懒的“嘿，怎么样？”问候来电者，甚至细致到模仿一句“我是强大的绝地学徒”（strong Padawan）。这些看似微小的趣味应用，折射出生成式AI对私人领域的渗透力。

然而，在严肃的工作场景中，AI所释放的能量远不止于此。多位技术创始人坦言，他们每天都会打开AI辅助工具来编写代码（helps us code）。“它极擅长编程（great at coding），让我以指数级的速度编码，”一位创始人感慨道。开发者只需用自然语言描述需求——例如“为我的界面构建暗黑模式”——AI便能自动遍历并修改全部代码，实现所需功能。这种变革将人类的身份从纯粹的“执行者”悄然转向“叙述者”（narrators）：人们负责描述愿景，模型则负责创造，甚至产出超越人类亲手操作水平的成果。尽管如此，创始人普遍认为，解决问题的基础能力（fundamental problem solving skills）依然是不可丢弃的核心素养，理解技术的边界并懂得如何驾驭它，正变得前所未有的关键。

第二章反直觉的才能：擅创造而不辨真伪

生成式AI带来了一个深具讽刺意味的认知颠覆：它极其擅长过去我们认定机器最不擅长的领域——创意（creativity）与故事叙述（storytelling）。一位创始人直言：“关于生成式AI工具最反直觉的一点是，它们正在创造性叙事工作上大放异彩，而我们曾以为这是它们最匮乏的能力。” 这个洞察驱动着众多创业公司追逐一个梦想——让每个人都能在自己卧室内制作出如《南方公园》（South Park）般的动画。还有人用模型生成极荒诞却逼真的照片：“我、埃里克（Eric）和蕾哈娜（Rihanna）在沙滩上打排球”，并从中津津有味地挑选最中意的一张。

但光芒的另一面是深刻的阴影。这些模型在区分事实与虚构（distinguishing fact from fiction）上依然表现得极为糟糕。它们能成为引人入胜的说书人，却惊人地无法辨别叙述中的真伪。如果将这种特性迁移至严肃场景，风险立即凸显：医生若查阅GPT（生成式预训练变换器）给出的诊断建议，可能需要耗费大量时间去核实，而任何差错都可能酿成大错。这一矛盾引发了一个灵魂拷问：“你会在哪个节点上，将信任交付给AI而非医生？”

第三章落地的艺术：从语义搜索到时尚微调

如何将模型的能力转化为真实价值？创始人们给出了多样化答案。对有些团队而言，AI最大的惊喜在于语义搜索（semantic search）——这项过去几乎无法实现的技术，如今只需一段随机文本，便能精准检索到相关信息。大型语言模型（LLMs）展现出强大的“阅读”能力，它们善于接收任意数据并回答围绕数据的提问，这为海量新型数据的应用打开了大门。

然而，落地过程远非一帆风顺。一家专注于时尚领域的公司分享了其面临的独特挑战：行业新术语层出不穷，流行趋势瞬息万变，比如这个月是“美人鱼风”（mermaid core），下个月可能就转为“芭蕾风”（ballet core）。为此，他们必须不断用新数据对模型进行微调（fine-tuning），以确保精准度。多数创始人认同一个观点：现有工具能够给出约85%到90%的解决方案，但真正交付可靠价值，往往需要在其上叠加大量补救性的微调或“黑客技巧”（hacks）。成功的关键在于为模型穿上结构的缰绳：清晰地设定任务格式，并将复杂问题拆解为一系列简单操作，一旦将某个单一任务清晰地交予模型，它便能完成得极为出色。

第四章驯服不确定性：迭代、调控与双刃剑

这种新范式令许多工程师既兴奋又警惕。一位创始人将当下面临的核心难题概括为“将确定性软件（deterministic software）与概率模型（probabilistic models）强行联姻”。旧时代的编程之美在于，给定相同的输入，计算机永远循规蹈矩地返回相同的结果；而现在，相同的输入可能产生微妙的变异。这种随机性（Randomness）并非全然坏事——若能妥善引入，模型便能在更广阔的空间探索，从不同选择中学习，进而变得更强。但对那些需要绝对可靠性的场景而言，这便是严峻的考验。

正如一位娱乐领域的创始人所言：“不可靠恰恰是我们所需要的，只要好笑就够了。但如果你是驾驶汽车，情况就复杂多了。” 因此，驾驭生成式AI被形容为一柄双刃剑。为了弥合差距，创始人强调必须极度注重迭代式调试（iterative process）。提示词需要像程序一样被精心设计、测试和优化。而且，这并非一劳永逸的工作——你的数据会变化，底层模型的质量也会悄然漂移，昨天的完美解决方案明天可能就失效了。唯有持续迭代，才能保持效力。

第五章幻觉与矫枉过正：真实性困境

所有AI创业者都无法绕过的最棘手问题，便是“幻觉”（hallucination）。一位创始人给出了精确定义：“幻觉就是AI生成了某些本不存在，但看上去似乎应该存在或可能存在的东西。” 当你要求它提供文献来源时，它可能凭空编造一篇有板有眼的文章。然而，行业近来为了遏制幻觉而施加的种种约束，却又引发了相反的问题：模型开始变得过度保守，时常声称未曾听闻某些它绝对应该知晓的信息，哪怕该信息明明白白地存在于训练数据中。在此种情况下，它甚至表现出类似人类的特质——就像我们阅读内化信息后，却记不清具体出处。

当模型与真实世界数据纠缠时，要区分什么是幻觉，什么是微妙而真实存在的细节，变得难上加难。试图让它稳定提供引文（citations）至今仍是一项挑战。信任大厦的基石因此并不稳固。“仅仅宣称准确率指标有所提升远远不够，”一位创始人警告说，“你必须理解，影响人类信任的因素要复杂得多。” 如果一项技术最终要为人所用，信任就是不可绕过的关键组件。

第六章人机回环与终极使命

面对概率模型的大量细微偏差，几乎所有创始人都不约而同地指向同一个解方：保留人机回环（Human-in-the-Loop）。这意味着在关键输出抵达用户之前，必须有负责监督的人进行初始评估，确保纠偏的准确性，并尤其要杜绝幻觉的流出。这既是对风险的管控，也是对AI进行持续“引导”（steer）的过程。所有YC（Y Combinator）创业营中的AI公司，所面对的共同挑战正是如何找到引导的恰当方式。

但回归本质，这些冰冷的权衡与修正并非终点。多位创始人表达了相似的深远思考：“我们获得了这项新工具，每个人都在试图摸索它的奥秘，但我从未忘记这样一个事实——归根结底，技术是服务于人的（technology in service of humans）。” 理想状态下，AI应当成为深化人际连接的催化剂，让我们有更多精力去与人互动，去洞察他人真正珍视什么。在这个意义上，技术的至高境界，恰恰是让我们的“人性”保有最终的话语权。

40位AI创始人共话当前人工智能技术

摘要

正文

第一章 日常里的AI：从婚礼致辞到极速编码

第二章 反直觉的才能：擅创造而不辨真伪

第三章 落地的艺术：从语义搜索到时尚微调

第四章 驯服不确定性：迭代、调控与双刃剑

第五章 幻觉与矫枉过正：真实性困境