两名IIT工程师为何拒绝55万美元高薪,选择创业

cover

摘要

本文是Y Combinator对Giga ML联合创始人Varun的深度访谈。Varun来自印度安得拉邦的一个小镇,父母均为政府教师。他凭借自身努力考入印度理工学院(IIT)克勒格布尔分校电气工程专业,在校期间深耕大语言模型(LLM)研究,曾在斯坦福大学从事Transformer模型相关工作。毕业之际,他获得了纽约顶级量化公司55万美元的年薪offer以及斯坦福大学博士录取,但ChatGPT的发布点燃了他的创业热情。他与大一结识的联合创始人一同申请Y Combinator,面试时被Harge告知"教育科技(EdTech)行不通,换个方向",这反而成为他们转型的契机。从开源微调模型登顶Hugging Face基准测试,到发现客户支持和编码才是真正的增长点,再到以8人团队击败400人竞争公司赢得DoorDash合同,Giga ML的经历证明:在AI时代,产品力远胜销售团队规模。Varun的核心信念是——只要有人愿意为你的解决方案付真金白银,就值得全力以赴。

正文

从安得拉邦到IIT:一个小镇青年的技术启蒙

Varun出生于印度安得拉邦的一个小镇,父母都是政府教师,理所当然地希望他成为工程师或医生。为了考入印度理工学院(IIT,Indian Institute of Technology),他付出了巨大的努力。最终他进入了IIT克勒格布尔分校(IIT Kharagpur)电气工程专业。

大学前两年正值新冠疫情(COVID-19)期间,他坦言那段时间"基本就是在玩,没怎么学习"。到了第三年,他开始在斯坦福大学从事大语言模型(LLM,Large Language Model)研究——那是一个"ChatGPT发布前"的时代,团队在研究Transformer模型和BERT等技术。

55万美元的抉择:当ChatGPT改变一切

在校期间,Varun获得了纽约一家顶级量化交易公司(Quant Firm)开出的55万美元年薪offer,同时拿到了斯坦福大学博士项目的录取。然而,ChatGPT在当年12月左右发布,一切发生了改变。

"ChatGPT能够写代码、做很多事情,我们超级兴奋。我们只想在上面构建些什么,然后试着申请Y Combinator。"

Varun一直在阅读Paul Graham(PG)的文章,尤其是2014年的YC创业学校(Startup School)那篇经典内容。他和联合创始人从大一就认识,两人想的是:"能出什么问题呢?申请一下,总可以试试。"

戏剧性的是,他们原定3天后就要去入职,而YC的录取通知恰好在那几天到了。

YC面试:当Harge说"换个方向"

申请YC时,他们试图用LLM做一个教育科技(EdTech,Educational Technology)产品。面试时,YC合伙人Harge直接告诉他:

"这是教育科技,行不通的。换个方向做吧。"

Varun回忆自己当时完全慌了——他为面试做了大量准备,和很多曾经的YC创始人交流,每个人都问他"你的想法是什么?你的TAM(Total Addressable Market,总可达市场)有多大?"但Harge根本没问这些。

"我真心觉得面试糟透了,我们肯定进不去了。"

然而,Harge实际上是想让他们加入YC。他告诉两人:"你们是非常优秀的工程师,换个方向做吧。"Varun感慨道:"如果没有Harge的这次押注,我们这家公司根本不会存在。"

Harge还安排了他们与Coursera首席运营官以及一些最成功的教育科技公司创始人对话,所有人都告诉他们做教育科技不是好主意。于是,在进入YC批次大约一个月后,他们决定转型(Pivot)。

黑客与书呆子的组合

Varun形容自己和联合创始人性格截然不同。他的联合创始人在整个IIT排名第三,整个职业生涯只拿过一个B——还是因为帮朋友代签到被扣了10分,否则本应是A(实际上是Ex,即优秀)。他是个典型的"教科书型"人物。

而Varun自己则坦言成绩不好,从未真正认真学习过。他把大量时间花在Kaggle竞赛上,原因很简单——赢了比赛可以赚钱。他参加了大量竞赛,赚了大约5万美元,正是这让他获得了高频交易公司(High-Frequency Trading)的工作机会。他甚至"把Kaggle系统玩得太过分,以至于被封号了"。

"我更像一个黑客(Hacker),他更像一个教科书型的人。但最终我们都变成了黑客类型的人。"

从微调模型到Hugging Face榜首

转型之后,两人的B1签证都被拒了——那恰好是YC首次从完全远程转为线下的时期。凭借在微调(Fine-tuning)方面的经验,Varun读了Databricks联合创始人的一篇关于LLM缓存(LLM Caching)以降低成本的研究论文。当时GPT-4非常昂贵,他们想到与其仅做缓存,不如用更小的模型进行微调可能效果更好。

于是他们开源了一系列微调模型,登上了Hugging Face基准测试的榜首,获得了大量关注和用户触达,并成功完成了400万美元的种子轮(Seed Round)融资。

发现真正的市场:客户支持与编码

然而,微调本身是一个相当糟糕的市场。Varun分析了原因:

  1. 唯一目的是降低成本和提升速度——如果没有这个需求,微调就没有意义
  2. 安全领域的销售是流程驱动而非工程驱动——向大型保险公司或医疗机构销售微调方案,本质上是一个销售过程(Sales Process),而非工程过程(Engineering Process),这让他们花了一年左右才意识到

关键发现来自他们的客户数据:Giga ML平台上增长最快的两个用例是客户支持(Customer Support)编码(Coding)。这不是他们凭空判断的,而是从客户实际使用中观察到的。

Zepto成为了他们客户支持方向的第一个客户。Varun主动联系了当时正在快速扩张的Zepto,对方试用了他们的产品,成为了首个客户。

以8人之力击败400人公司:赢得DoorDash

进入客户支持领域时,市场上已经存在资金充裕的竞争对手,如Sierra等。但Varun坦言,他们在签下Zepto时甚至不知道这些竞争对手的存在——某种程度上的"无知者无畏"。

真正考验来自DoorDash的竞标。当时他们只有8个人,竞争对手是一家400人且资金雄厚的公司。他们最终赢得了DoorDash的合同。Varun分析获胜原因:

  1. YC网络的信任优势:Gary(YC合伙人)将他介绍给了Tony(DoorDash创始人),DoorDash本身也是YC系公司,存在天然的信任基础
  2. 3个月试点零故障:他们在试点期间系统从未宕机,所有指标表现优秀
  3. DoorDash的精英体制文化:DoorDash是一家非常注重实力的公司,愿意选择真正优秀的产品而非只看公司规模

DoorDash这个标志性客户成为了他们的增长引擎——很多其他大公司现在选择Giga ML,正是因为DoorDash和其他大型上市公司都在使用他们的产品。

AI代理的核心逻辑:Markdown文件驱动KPI

随着业务扩展到全球最大加密货币交易所、财富500强企业等,Varun总结出AI代理公司(Agentic Company)的一个核心洞察:

"对于几乎任何代理型公司来说,一切都归结为两件事:策略文件(Policies)——也就是Markdown文件——以及如何迭代这个Markdown文件来影响业务KPI。"

对于客户支持而言,关键指标是解决率(Resolution Rate)。从30-40%的解决率起步,如何迭代到90%?同样的逻辑适用于合规(Compliance)、IT服务管理(ITSM/ITSD)等领域。他们看到一些美国最大的消费公司正在试用Giga ML做内部支持甚至合规工作。

下一代方向:AI前线部署工程师

Varun对公司未来方向非常自信。他认为当前企业AI部署的最大瓶颈是"前线部署工程师"(Forward Deployed Engineer)——需要大量工程师坐在客户身边做配置。Giga ML正在构建一个AI前线部署工程师:

"我们的AI前线部署工程师会加入客户的Slack,加入Google Meet,记录所有笔记,自动完成变更。当你想调整策略、想从40%提升到60%解决率时,它会自动处理。"

公司内部:自动化、自动化、自动化

Giga ML的一个核心价值观是"自动化、自动化、自动化"(Automate, Automate, Automate)。公司使命是自动化世界上所有的工作,正有意识地朝通用自动化构建者(Generic Automation Builder)的方向发展。

"不仅仅是成本的问题。减少了上下文切换(Context Switching),一个人可以拥有并构建整个项目,比很多人协作开发出货更快。上下文传递(Context Transfer)实际上会扼杀很多事情,拖慢速度。"

招聘理念:寻找"尖刺型"人才

Giga ML的面试流程独特而严苛:先让候选人用AI做Vibe Coding,然后移除AI工具,要求他们在没有AI的情况下修改代码——目的是确保人们真正理解代码如何运作。

他们寻找的是"尖刺型"(Spiky)人才——那0.1%在某方面有非凡能力的人。正如Varun获得了最高薪的offer,联合创始人在IIT排名第三,他们希望找到同样在某方面极为突出的人。

产品力胜过销售力

Varun坦承自己最初犯了一个大错——他认为销售是公司最重要的事情。后来他完全改变了看法:

"如果你看看所有成功的AI公司,都是产品驱动的。没有人因为最好的销售团队而使用Anthropic。Anthropic和OpenAI甚至不给销售人员发佣金——他们就是这么不在乎销售。在AI领域,产品是最重要的。你的产品能在多短时间内为客户交付多大价值?如果你能证明这一点,其他一切都会随之而来。"

给年轻人的建议:烧掉你的退路

当被问及对在场大学生和年轻创业者的建议时,Varun的回答掷地有声:

  1. 不要在无用想法上浪费时间:"就算你现在去问ChatGPT,它也能给你10个创业想法。问题从来不在于想法本身,而在于是否有人愿意为此付真金白银。"

  2. 及早收费:"如果问题足够重要,人们会用金钱或时间来支付。社交媒体用时间,但对于任何B2B公司,如果问题足够重要,人们应该愿意付钱。否则你只是在解决一个假问题。"

  3. 烧掉退路:"我和联合创始人知道,当公司运转不下去的时候,我们想的是'天哪,我们拒绝了所有那些工作offer,我们该怎么办?'这实际上逼迫你去创造。我觉得烧掉退路(Burn the Boats)是很有价值的。如果你有工作能力,你随时可以再找到工作,不会消失。但总体而言,全力以赴去做事情的价值要大得多。"

  4. AI时代构建成本极低:"现在构建东西的成本如此之低,人们应该直接去构建,尝试为很小的客户群体交付尽可能大的价值,看看他们是否愿意付钱。"

关于印度与旧金山的选择

对于正在构建AI公司的印度裔创始人,Varun的建议是:贴近客户所在的地方。但如果你做的事情与生成式AI(GenAI)和前沿研究相关,旧金山(San Francisco)是毫无疑问的首选,因为几乎所有GenAI领域的创新都源自湾区。如果你的客户主要在印度,那就待在印度。


本文基于Y Combinator 2026年访谈整理,受访者为Giga ML联合创始人Varun。