Jared 预测：2025 年我们将能与 AI 进行 Zoom 通话

cover

摘要

在这段简短的预测中，Jared 提出了他对 2025 年最期待的 AI 产品方向：实时视频通话中的 AI 交互。回顾 2024 年，语音 AI 取得了关键突破——延迟 (Latency) 终于降到了足够低，使人与 AI 的电话对话变得自然、真实。Jared 预测 2025 年这一体验将从语音跃升至视频层面：用户将能够与拥有面部表情和完整虚拟头像 (Virtual Avatar) 的 AI 进行实时 Zoom 式通话。目前市场上已有的类似产品仍受困于高延迟和唇形同步 (Lip Syncing) 不准等问题，体验尚未跨越恐怖谷 (Uncanny Valley)。Jared 认为 2025 年将迎来质变，AI 视频交互将如同通过一场 3D 图灵测试 (3D Turing Test)。他戏称未来或许能让 AI 代录节目，但随即澄清——本期仍由真人出镜。

正文

从语音通话到视频通话：AI 交互的下一跃

Jared 表示，他有一个关于 AI 的预测，也是他个人最期待看到和体验的产品方向。这个预测的核心是：2025 年，人们将能够与 AI 进行 Zoom 通话。

回顾 2024 年，AI 语音交互取得了里程碑式的进展——那一年，人们终于可以与 AI 进行电话通话，而延迟降到了足够低，使得对话感觉自然且真实。这标志着 AI 语音交互跨越了"可感知延迟"的门槛。

虚拟头像与实时交互

Jared 预测，2025 年我们将实现同样的跨越，但这一次是在视频层面。未来的体验将是一场类似 Zoom 的视频通话：屏幕上会出现一个拥有面部和完整虚拟头像 (Virtual Avatar) 的 AI 人物，你可以与之实时交互，就像在和一个真实的 AI 人对话。

跨越恐怖谷

目前市场上已经存在一些类似产品，但体验远未成熟：延迟过高、唇形同步 (Lip Syncing) 不准确，整体感受不佳。这些问题使当前的 AI 视频交互仍停留在恐怖谷 (Uncanny Valley) 的尴尬区间——看起来像人，但又不完全像，令人不安。

Jared 认为 2025 年这些技术瓶颈将被突破，AI 视频交互将通过某种意义上的 3D 图灵测试 (3D Turing Test)——即用户在三维视频交互中难以分辨对面是真人还是 AI。

他开玩笑说，也许未来可以让 AI 来替他们录制节目片段。但随即澄清：本期视频仍是真人出镜，绝非 AI 生成——"还是真的！"