Jared 预测:2025 年我们将能与 AI 进行 Zoom 通话

摘要
在这段简短的预测中,Jared 提出了他对 2025 年最期待的 AI 产品方向:实时视频通话中的 AI 交互。回顾 2024 年,语音 AI 取得了关键突破——延迟 (Latency) 终于降到了足够低,使人与 AI 的电话对话变得自然、真实。Jared 预测 2025 年这一体验将从语音跃升至视频层面:用户将能够与拥有面部表情和完整虚拟头像 (Virtual Avatar) 的 AI 进行实时 Zoom 式通话。目前市场上已有的类似产品仍受困于高延迟和唇形同步 (Lip Syncing) 不准等问题,体验尚未跨越恐怖谷 (Uncanny Valley)。Jared 认为 2025 年将迎来质变,AI 视频交互将如同通过一场 3D 图灵测试 (3D Turing Test)。他戏称未来或许能让 AI 代录节目,但随即澄清——本期仍由真人出镜。
正文
从语音通话到视频通话:AI 交互的下一跃
Jared 表示,他有一个关于 AI 的预测,也是他个人最期待看到和体验的产品方向。这个预测的核心是:2025 年,人们将能够与 AI 进行 Zoom 通话。
回顾 2024 年,AI 语音交互取得了里程碑式的进展——那一年,人们终于可以与 AI 进行电话通话,而延迟降到了足够低,使得对话感觉自然且真实。这标志着 AI 语音交互跨越了"可感知延迟"的门槛。
虚拟头像与实时交互
Jared 预测,2025 年我们将实现同样的跨越,但这一次是在视频层面。未来的体验将是一场类似 Zoom 的视频通话:屏幕上会出现一个拥有面部和完整虚拟头像 (Virtual Avatar) 的 AI 人物,你可以与之实时交互,就像在和一个真实的 AI 人对话。
跨越恐怖谷
目前市场上已经存在一些类似产品,但体验远未成熟:延迟过高、唇形同步 (Lip Syncing) 不准确,整体感受不佳。这些问题使当前的 AI 视频交互仍停留在恐怖谷 (Uncanny Valley) 的尴尬区间——看起来像人,但又不完全像,令人不安。
Jared 认为 2025 年这些技术瓶颈将被突破,AI 视频交互将通过某种意义上的 3D 图灵测试 (3D Turing Test)——即用户在三维视频交互中难以分辨对面是真人还是 AI。
他开玩笑说,也许未来可以让 AI 来替他们录制节目片段。但随即澄清:本期视频仍是真人出镜,绝非 AI 生成——"还是真的!"