40位AI创始人共话当前人工智能技术

摘要
在人工智能技术狂飙突进的当下,40位前沿AI创始人齐聚一堂,以亲身实践者的视角,揭示了生成式AI令人始料未及的潜能与现实困境。他们坦言,AI早已渗透进生活的最细微处——从代写婚礼致辞、设置个性应答机,到将编程效率提升至前所未有的高度。然而,这项技术最反直觉的特性在于:它出人意料地擅长创意叙事,却难以分辨事实与虚构。创始人分享了各自领域的真实应用,包括语义搜索、时尚趋势洞察与自动生成软件界面;同时深入剖析了驾驭非确定性模型所必需的“提示工程”与持续迭代策略。访谈反复触及生成式AI的“双重面目”:一方面,它能创造出极其逼真却不存在的内容,形成所谓的“幻觉”;另一方面,为抑制幻觉而施加的约束,又可能让它对已知信息讳莫如深。因此,几乎所有创始人都强调,在关键决策环节中保留“人机回环”(Human-in-the-Loop)是当下不可逾越的安全底线。本文将这些珍贵洞见凝练为六大篇章,全景式展现生成式AI从编码辅助、商业落地到伦理反思的立体图景,并最终回归一个朴素的共识——技术的终极使命,仍然是服务并深化人与人的真实连接。
正文
第一章 日常里的AI:从婚礼致辞到极速编码
访谈伊始,一个轻松的问题揭开了AI如何静默重塑个人生活。一位创始人分享了自己用AI撰写婚礼祝词的小故事,半开玩笑地犹豫是否应该说出来。另一些创始人则将语音应答机设置为克隆的嗓音,以一段慵懒的“嘿,怎么样?”问候来电者,甚至细致到模仿一句“我是强大的绝地学徒”(strong Padawan)。这些看似微小的趣味应用,折射出生成式AI对私人领域的渗透力。
然而,在严肃的工作场景中,AI所释放的能量远不止于此。多位技术创始人坦言,他们每天都会打开AI辅助工具来编写代码(helps us code)。“它极擅长编程(great at coding),让我以指数级的速度编码,”一位创始人感慨道。开发者只需用自然语言描述需求——例如“为我的界面构建暗黑模式”——AI便能自动遍历并修改全部代码,实现所需功能。这种变革将人类的身份从纯粹的“执行者”悄然转向“叙述者”(narrators):人们负责描述愿景,模型则负责创造,甚至产出超越人类亲手操作水平的成果。尽管如此,创始人普遍认为,解决问题的基础能力(fundamental problem solving skills)依然是不可丢弃的核心素养,理解技术的边界并懂得如何驾驭它,正变得前所未有的关键。
第二章 反直觉的才能:擅创造而不辨真伪
生成式AI带来了一个深具讽刺意味的认知颠覆:它极其擅长过去我们认定机器最不擅长的领域——创意(creativity)与故事叙述(storytelling)。一位创始人直言:“关于生成式AI工具最反直觉的一点是,它们正在创造性叙事工作上大放异彩,而我们曾以为这是它们最匮乏的能力。” 这个洞察驱动着众多创业公司追逐一个梦想——让每个人都能在自己卧室内制作出如《南方公园》(South Park)般的动画。还有人用模型生成极荒诞却逼真的照片:“我、埃里克(Eric)和蕾哈娜(Rihanna)在沙滩上打排球”,并从中津津有味地挑选最中意的一张。
但光芒的另一面是深刻的阴影。这些模型在区分事实与虚构(distinguishing fact from fiction)上依然表现得极为糟糕。它们能成为引人入胜的说书人,却惊人地无法辨别叙述中的真伪。如果将这种特性迁移至严肃场景,风险立即凸显:医生若查阅GPT(生成式预训练变换器)给出的诊断建议,可能需要耗费大量时间去核实,而任何差错都可能酿成大错。这一矛盾引发了一个灵魂拷问:“你会在哪个节点上,将信任交付给AI而非医生?”
第三章 落地的艺术:从语义搜索到时尚微调
如何将模型的能力转化为真实价值?创始人们给出了多样化答案。对有些团队而言,AI最大的惊喜在于语义搜索(semantic search)——这项过去几乎无法实现的技术,如今只需一段随机文本,便能精准检索到相关信息。大型语言模型(LLMs)展现出强大的“阅读”能力,它们善于接收任意数据并回答围绕数据的提问,这为海量新型数据的应用打开了大门。
然而,落地过程远非一帆风顺。一家专注于时尚领域的公司分享了其面临的独特挑战:行业新术语层出不穷,流行趋势瞬息万变,比如这个月是“美人鱼风”(mermaid core),下个月可能就转为“芭蕾风”(ballet core)。为此,他们必须不断用新数据对模型进行微调(fine-tuning),以确保精准度。多数创始人认同一个观点:现有工具能够给出约85%到90%的解决方案,但真正交付可靠价值,往往需要在其上叠加大量补救性的微调或“黑客技巧”(hacks)。成功的关键在于为模型穿上结构的缰绳:清晰地设定任务格式,并将复杂问题拆解为一系列简单操作,一旦将某个单一任务清晰地交予模型,它便能完成得极为出色。
第四章 驯服不确定性:迭代、调控与双刃剑
这种新范式令许多工程师既兴奋又警惕。一位创始人将当下面临的核心难题概括为“将确定性软件(deterministic software)与概率模型(probabilistic models)强行联姻”。旧时代的编程之美在于,给定相同的输入,计算机永远循规蹈矩地返回相同的结果;而现在,相同的输入可能产生微妙的变异。这种随机性(Randomness)并非全然坏事——若能妥善引入,模型便能在更广阔的空间探索,从不同选择中学习,进而变得更强。但对那些需要绝对可靠性的场景而言,这便是严峻的考验。
正如一位娱乐领域的创始人所言:“不可靠恰恰是我们所需要的,只要好笑就够了。但如果你是驾驶汽车,情况就复杂多了。” 因此,驾驭生成式AI被形容为一柄双刃剑。为了弥合差距,创始人强调必须极度注重迭代式调试(iterative process)。提示词需要像程序一样被精心设计、测试和优化。而且,这并非一劳永逸的工作——你的数据会变化,底层模型的质量也会悄然漂移,昨天的完美解决方案明天可能就失效了。唯有持续迭代,才能保持效力。
第五章 幻觉与矫枉过正:真实性困境
所有AI创业者都无法绕过的最棘手问题,便是“幻觉”(hallucination)。一位创始人给出了精确定义:“幻觉就是AI生成了某些本不存在,但看上去似乎应该存在或可能存在的东西。” 当你要求它提供文献来源时,它可能凭空编造一篇有板有眼的文章。然而,行业近来为了遏制幻觉而施加的种种约束,却又引发了相反的问题:模型开始变得过度保守,时常声称未曾听闻某些它绝对应该知晓的信息,哪怕该信息明明白白地存在于训练数据中。在此种情况下,它甚至表现出类似人类的特质——就像我们阅读内化信息后,却记不清具体出处。
当模型与真实世界数据纠缠时,要区分什么是幻觉,什么是微妙而真实存在的细节,变得难上加难。试图让它稳定提供引文(citations)至今仍是一项挑战。信任大厦的基石因此并不稳固。“仅仅宣称准确率指标有所提升远远不够,”一位创始人警告说,“你必须理解,影响人类信任的因素要复杂得多。” 如果一项技术最终要为人所用,信任就是不可绕过的关键组件。
第六章 人机回环与终极使命
面对概率模型的大量细微偏差,几乎所有创始人都不约而同地指向同一个解方:保留人机回环(Human-in-the-Loop)。这意味着在关键输出抵达用户之前,必须有负责监督的人进行初始评估,确保纠偏的准确性,并尤其要杜绝幻觉的流出。这既是对风险的管控,也是对AI进行持续“引导”(steer)的过程。所有YC(Y Combinator)创业营中的AI公司,所面对的共同挑战正是如何找到引导的恰当方式。
但回归本质,这些冰冷的权衡与修正并非终点。多位创始人表达了相似的深远思考:“我们获得了这项新工具,每个人都在试图摸索它的奥秘,但我从未忘记这样一个事实——归根结底,技术是服务于人的(technology in service of humans)。” 理想状态下,AI应当成为深化人际连接的催化剂,让我们有更多精力去与人互动,去洞察他人真正珍视什么。在这个意义上,技术的至高境界,恰恰是让我们的“人性”保有最终的话语权。