模型进化太快 -- 没有其他 UI 形态能跟上模型的迭代速度,终端的极简设计反而最灵活。
Claude Code 的诞生:从两个赞到改变世界
一个在终端里诞生的"小黑客项目",内部发布只获得两个点赞,却在一年内重新定义了整个软件工程行业。
Boris 其人:从 Cursor 到 Anthropic 的两周往返
Boris 曾短暂加入 Cursor(仅两周),因为被其产品吸引。但他很快意识到自己真正需要的是 Anthropic 的使命感 -- 安全地构建 AI 的未来。
"What I really missed about Anthropic was the mission... If you ask anyone in the hallway why they're here, the answer is always going to be safety." -- Boris Cherny
起源故事
原型阶段
Boris 加入 Anthropic 后,花一个月做各种原型,再花一个月研究 post-training 理解模型底层。最初叫 "Claude CLI",给模型一个 Bash 工具,它竟然自己写代码查询"我在听什么音乐"。
从冷启动到爆发
内部发布只获得2个赞。外部发布初期也不算爆款。真正的拐点在 Opus 4 发布(2025.05),之后增长曲线持续加速。到2026年,Claude Code 贡献 GitHub 4% 的公开提交量。
为什么是终端?
最初选择终端纯粹因为 Boris 一个人开发,终端是最简单的 UI。但后来发现这是一个正确的产品决策:
潜在需求(Latent Demand) -- 把工具放到工程师已经在的地方,让现有工作流变得更容易。
刻意资源不足 -- 一个人做迫使做出最简决策,这反而成了正确的产品策略。
"When I first started Claude Code, it was just going to be a little hack... I announced it internally and it got two likes." -- Boris Cherny
1. 一个人 + AI = 够了:Boris 一个人启动了价值数十亿的产品。资源不足不是劣势,反而迫使你做最简设计。
2. 两个赞不代表失败:内部冷启动是常态。关键是你自己觉得"on to something",然后持续拉用户反馈。
3. 先理解底层再做产品:Boris 花了一个月学 post-training,理解模型能力边界后才开始做产品。一人公司做 AI 产品也应该先深入理解模型。
编程已被解决:100% AI 编写代码的现实
Boris 自2025年11月起未手动编辑过一行代码,每天用 Claude Code 提交 10-30 个 PR。这不是未来,这是现在。
Semi Analysis 报告:Claude Code 已占 GitHub 公开提交的 4%,预计年底将达 20%。Anthropic 内部工程团队 4x 扩张的同时,人均生产力提升 200%。
Boris 的工作方式
100% 代码由 Claude Code 编写。依然会审查代码(尤其是将上线的代码)。Claude 也在做自动代码审查(100% PR 覆盖)。同时运行 5+ 个 Agent 并行工作。三分之一在终端、三分之一在桌面端、三分之一在 iOS 上操作。
"100% of my code is written by Claude Code. I have not edited a single line by hand since November. Every day I ship 10, 20, 30 pull requests." -- Boris Cherny
编程还值得学吗?
Boris 的判断:一两年内,学不学编程不再重要。编程的历史本身就是一部抽象层不断上升的历史:硬件 -> 打孔卡 -> 汇编 -> 高级语言 -> AI。现在的写代码,就像当年的"写汇编"一样,终将成为底层。
"Coding is largely solved. I imagine a world where everyone is able to program. Anyone can just build software anytime." -- Boris Cherny
Boris 的编程观:工具而非目的
Boris 自学编程是为了在 TI-83+ 计算器上作弊。他写过 TypeScript 的书,创办过世界最大的 TypeScript Meetup,但始终认为编程是手段不是目的。
不过他也尊重不同态度 -- 团队中有工程师周末仍然手写 C++,因为享受这种创作过程。
"There is a beauty to programming and especially to functional programming... but it's really not the end of it. Coding is very much a tool."
"新人比老人更 AGI-forward"
Boris 分享了一个故事:他在用传统方法调试内存泄漏(heap snapshot + 分析器),而团队里的新人直接让 Claude Code 处理 -- Claude 自己写了分析工具、找到问题、提了 PR,比 Boris 还快。
教训:不要被旧模型的能力印象困住,当前模型已经完全不同。
- 别再犹豫"AI 写的代码行不行"-- 行不行试过就知道,而且在高速迭代
- 保持代码审查习惯,但让 AI 做第一轮审查,人做第二轮
- 定期挑战自己"这件事能不能让 Claude 做"-- 答案越来越多是"能"
- 新手可能比老手更擅长用 AI,因为没有旧习惯的负担
1. 一人公司的工程产能已经可以对标小团队:Boris 一个人 10-30 PR/天,你用同样的工具也可以。
2. 不要纠结"学编程"vs"不学编程":理解编程概念有帮助(还能帮一两年),但把"精通某语言"当护城河已经没意义了。
3. 并行运行多个 Agent:Boris 同时跑 5 个 Agent。一人公司也可以:一个修 bug,一个写测试,一个部署。
下一站:当编码不再是瓶颈
如果编程已经被解决,那瓶颈转移到了哪里?Boris 的答案:AI 开始自己找活干,从"写代码"进化到"做事"。
Claude 开始"自己找活干"
Claude Code 已经在做的事:自动浏览 Slack 反馈频道、扫描 bug 报告和遥测数据、主动提出修复建议并提交 PR。这不再是"人给指令、AI 执行",而是AI 开始承担部分 PM 的工作。
"Claude is starting to come up with ideas. It's looking through feedback, looking at bug reports, looking at telemetry... a little more like a co-worker." -- Boris Cherny
从 Claude Code 到 Co-work:Agent 走出终端
Co-work 是 Claude 的桌面端 Agent,能操作浏览器、发 Slack、管理邮件、填表格。10 天内由 Claude Code 自己构建完成,发布后立即走红(比 Claude Code 初期快得多)。
付停车罚款
Boris 让 Co-work 帮他在线支付了一张交通罚单。
项目管理
每周一自动检查团队 spreadsheet,给没更新状态的工程师发 Slack 消息。
邮件处理
自动回复 top 3 邮件,或总结邮件后同步到 Slack / 表格。
编程之后是什么?
Boris 的进化路径:编码 -> 工具使用 -> 计算机使用。这也是 Anthropic 构建模型的核心路线图。Claude Code 解决了编码,Co-work 正在解决通用计算机操作,接下来将是更自主、更长时间运行的 Agent。
- 编码已不是瓶颈,开始思考"决定做什么"和"代码审查"如何让 AI 参与
- 尝试 Co-work 处理非编码的重复性工作(邮件、项目管理、表单填写)
- Agent 的能力边界正在快速扩展 -- 每月重新评估一次"哪些工作可以交给 Agent"
1. "决定做什么"才是你的核心竞争力:当执行成本趋零,选择做正确的事比做更多事重要得多。
2. Co-work 式自动化 = 虚拟助理:一人公司最缺的就是人手处理杂务。AI Agent 正在变成你的免费运营助理。
3. 10 天构建百万用户产品:Co-work 的开发速度说明,AI 原生的产品开发周期可以极短。MVP 48 小时不是口号。
AI 时代的工程管理哲学
Boris 管理 Claude Code 团队的核心原则:刻意资源不足、极致速度、给工程师无限 Token。
三大管理原则
刻意资源不足
一个项目只放一个工程师。资源不足迫使使用 AI,反而产出更高。有好 idea 就想尽办法快速实现。
今天能做就今天做
速度是唯一优势。早期 Claude Code 在拥挤的编码工具市场里,唯一的竞争力就是迭代速度。
无限 Token
不要在初期限制 Token 消耗。有工程师每月消耗数十万美金的 Token。先验证 idea,再优化成本。
Token 消耗 vs 工资
Lenny 问:Token 成本会超过工资吗?Boris 回答:Anthropic 内部已经开始出现。但重点是:
"At small scale, the token cost is still probably relatively low relative to salary. The point at which you want to optimize is when you've found something that works and it starts to scale up. Don't do that too early." -- Boris Cherny
关于代码审查的新范式
当 AI 生成 100% 代码时,代码审查成为新瓶颈。Anthropic 的做法:Claude 先审查所有 PR,然后人类再做第二层审查。对于纯原型代码,可以跳过人工审查。
- 给工程师(或你自己)无限 Token 预算,至少在探索阶段
- 一个人 + AI 做一个项目,比三个人不用 AI 做同样项目更高效
- 速度就是竞争力 -- 今天能发就今天发
- Token 成本优化是后期事,先验证产品是否有价值
1. 你天然就是"资源不足"的:这恰好是 AI 时代的优势。一个人被迫最大化利用 AI,而大团队反而有惰性。
2. 无限 Token 策略:Max Pro 订阅是最划算的投资。不要因为省钱而用弱模型 -- 弱模型需要更多 Token 和更多纠错。
3. "今天能做就今天做":一人公司最大的陷阱是无限计划、永不执行。学 Boris 团队的节奏。
产品直觉:潜在需求与 Facebook 的教训
Boris 在 Meta 的产品经历如何塑造了 Claude Code 的产品思维:看用户在"滥用"什么,就做什么。
什么是潜在需求(Latent Demand)
Boris 在 Meta 时参与了 Facebook Marketplace 和 Facebook Dating 的早期。两者的共同点:用户已经在用现有功能做这些事了。
Facebook Marketplace
用户早已在 Facebook Groups 里买卖东西。数十亿的交易在一个不是为此设计的功能里发生。专门做一个 Marketplace 是显而易见的。
Facebook Dating
60% 的个人主页浏览来自非好友的异性。人们已经在"偷偷看"了,做一个 dating 产品是顺势而为。
Claude Code 的潜在需求
同样的模式出现在 Claude Code 上:
有人用 Claude Code 种番茄(分析土壤数据)
有人用它分析基因组
有人用它从损坏硬盘恢复婚礼照片
有人用它分析 MRI 影像
数据科学家 Brendan 下载了 Node.js + Claude Code 在终端里做 SQL 分析
这些"滥用"直接催生了 Co-work -- 一个面向非技术人员的通用 Agent。
新维度:模型的潜在需求
Boris 提出了一个深刻的新视角:
"The modern framing is: look at what the model is trying to do and make that a little bit easier... In research, we call this being on distribution." -- Boris Cherny
传统产品设计是"看用户在做什么"。AI 产品设计增加了一层:看模型想做什么。不要把模型装进盒子里,而是给它工具让它自主探索。
1. 观察"滥用":你的产品被用户用在非预期场景?恭喜,这就是下一个产品机会。
2. 潜在需求 > 用户调研:不要只问用户"你想要什么"。看他们在"痛苦地用什么替代品"。
3. AI 产品的双层潜在需求:既要看用户行为,也要看模型的自然倾向(on distribution)。顺势而为远比强制规则有效。
构建 AI 产品的核心原则
Boris 分享的四条最重要的 AI 产品构建原则,每一条都来自 Claude Code 的实战验证。
原则一:不要把模型装进盒子
很多人构建 AI 产品时,会给模型设计严格的 workflow:"先做第一步,再做第二步,再做第三步"。但几乎每次,给模型工具 + 目标 + 自由度,效果都更好。
"Don't try to overcurate it. Don't try to put it into a box. Don't try to give it a bunch of context up front. Give it a tool so that it can get the context it needs. You're just going to get better results." -- Boris Cherny
原则二:The Bitter Lesson
Rich Sutton 十年前的经典博文。核心观点:更通用的模型总是会胜过更专用的模型。对 AI 产品的推论:
不要用小模型替代大模型来省钱
不要过度微调(fine-tune)
不要用 scaffold 替代模型能力
Scaffold 可能带来 10-20% 的性能提升,但下一代模型发布时这些增益就会被抹平。
原则三:为六个月后的模型而建
Claude Code 从一开始就下注"未来的模型"。早期产品体验不好(Sonnet 3.5 只能写 20% 的代码),但架构为更强模型准备好了。当 Opus 4 发布时,产品立刻爆发。
"Build for the model six months from now, not for the model of today. Your product-market fit won't be very good for the first 6 months, but when that model comes out, you're going to hit the ground running." -- Boris Cherny
六个月后模型会好在哪里?
Boris 给出的确定性方向:
- 工具使用和计算机操作会越来越好
- 长时间运行会越来越稳定(从 Sonnet 3.5 的 15-30 秒到 Opus 4.6 的 10-30 分钟无人值守)
- 模型可能连续运行数小时甚至数天、数周
原则四:创新来自空间和安全感
Claude Code 的诞生不是被规划出来的,而是在探索中发现的。Boris 的创新观:
"There's no road map for innovation. You just have to give people space... psychological safety that it's okay to fail. It's okay if 80% of the ideas are bad." -- Boris Cherny
- 不装盒 -- 给模型工具和目标,让它自己决定路径
- 押通用 -- 永远押注最强通用模型,不过度定制
- 建未来 -- 为六个月后的模型能力设计产品架构
- 给空间 -- 允许失败,快速止损,发现线索就死磕
1. 不要过度编排 AI 工作流:给 Claude 一个清晰目标 + 必要工具,比写 20 步 prompt chain 效果更好。
2. Bitter Lesson 的一人公司版:不要花时间微调、不要用小模型省钱(实际更贵)、不要自建 AI 基础设施。用最强模型,做最简产品。
3. 为未来而建:如果你的产品创意"现在模型差一点做不到",很可能六个月后就能做到。这是机会,不是障碍。
安全:Anthropic 的基因与三层防线
在极速发展和安全责任之间找平衡,是 Anthropic 存在的根本意义。Boris 深入解释了他们的三层安全体系。
三层安全体系
第一层:对齐与可解释性
在神经元级别理解模型。Chris Olah 团队发明的 Mechanistic Interpretability -- 可以追踪模型中与"欺骗"相关的神经元激活。模型神经元和生物神经元行为惊人相似。
第二层:评估(Evals)
实验室环境测试。把模型放在合成场景中观察行为:"在这种情况下你会怎么做?是否安全?是否对齐?"
第三层:真实世界行为
在实际用户环境中观察。Claude Code 内部测试了 4-5 个月才对外发布。Co-work 也经历了类似的内部验证 -> 受限发布 -> 公开的过程。
"Race to the Top"
Anthropic 开源了 Agent sandbox(可运行任何 Agent,不限于 Claude Code),目的是让整个行业都更安全,而不仅仅是自己的产品。这是他们所说的"向上竞赛"。
"We want to make sure this thing goes well. We publish very freely to talk about safety... to inspire other labs to do it in a way that's safe." -- Boris Cherny
关于模型是否"真的在思考"
Boris 提到一个重要进展:早期不确定模型是否只在预测下一个 token,但现在有强证据表明模型在做更深层的推理。在更大的模型中,单个神经元可能对应十几个概念(superposition),多个神经元组合才能表达复杂概念。
1. 安全不是大公司的专利:一人公司做 AI 产品也需要考虑安全 -- 至少使用 sandbox 运行 Agent,限制 Agent 的系统权限。
2. 渐进式发布:先自己用 -> 小范围测试 -> 公开发布。这是 Anthropic 的做法,也适合一人公司。
3. Anthropic 的开源安全工具可以直接用:sandbox 等安全基础设施不用自己造。
Claude Code 实战指南:Boris 的三个 Pro Tips
没有"唯一正确的使用方式",但这三个技巧几乎对所有人有效。
Tip 1:永远用最强模型
Boris 始终使用 Opus 4.6 + Maximum Effort。看似更贵的大模型,实际上因为更少的纠错和更快的完成速度,总 Token 消耗反而更低。
"Because it's less intelligent, it actually takes more tokens to do the same task. It's actually not obvious that it's cheaper if you use a less expensive model." -- Boris Cherny
Tip 2:先用 Plan Mode
Boris 80% 的任务从 Plan Mode 开始。Plan Mode 的本质极其简单 -- 只是在 prompt 里注入了一句"请先不要写代码"。
进入 Plan Mode(终端里 Shift+Tab 两次)
和模型讨论方案,来回迭代
方案满意后,开启自动接受编辑(Auto Accept)让模型执行
用 Opus 4.6 + 好的计划,几乎每次都能一次成功
Tip 3:探索不同界面
Claude Code 不只是终端:iOS/Android、Desktop App、Slack 集成、IDE 扩展、Web -- 同一个 Agent 引擎在所有平台运行。Boris 自己三分之一时间用终端、三分之一桌面端、三分之一 iOS。
关于竞争:Codex 和其他
Boris 坦诚没怎么用过 Codex,但觉得竞争是好事。他的团队不花太多时间看竞品 -- 专注于和用户对话、解决用户问题。
"We don't spend a lot of time looking at competing products... I just love talking to users. I love making the product better." -- Boris Cherny
- 用最强模型(Opus 4.6 + Max Effort)-- 实际更便宜
- 80% 任务从 Plan Mode 开始 -- 先讨论方案再执行
- 计划好后 Auto Accept -- Opus 4.6 几乎总能一次做对
- 手机上也能"写代码"-- 试试 iOS/Android 的 Claude Code
- 不纠结竞品,专注用户反馈
1. Plan Mode 就是你的"技术设计评审":一人公司没有同事帮你 review 方案,Plan Mode 让 AI 担任这个角色。
2. 移动端编程:通勤、等人时可以在手机上启动一个任务。Boris 三分之一的"编码"在 iPhone 上完成。
3. 用最强模型 = 投资未来:弱模型省下的钱会在纠错时加倍还回来。
味噌、科幻与常识:Boris 的个人哲学
从日本乡村的味噌发酵,到乌克兰敖德萨的祖父打孔卡,Boris 的人生故事充满了跨越时间尺度的智慧。
Post-AGI 计划:做味噌
加入 Anthropic 之前,Boris 住在日本农村,是镇上唯一的工程师。他从邻居那里学会了做味噌 -- 白味噌至少三个月,红味噌要 2-4 年。
"Miso teaches you to think on these long timescales. That's just very different than engineering... You just have to be very patient. You mix it up and then you just let it sit." -- Boris Cherny
这种"长时间尺度思维"恰好是 AI 时代最稀缺的能力 -- 当一切都在加速时,能慢下来思考方向的人最有价值。
从打孔卡到 AI:三代程序员
Boris 的外祖父是苏联最早的程序员之一,用打孔卡编程。他的母亲小时候用蜡笔在打孔卡上画画。Boris 在 TI-83+ 计算器上写出了人生第一个程序。三代人见证了编程的完整演化。
Lenny 和 Boris 在节目中意外发现他们都出生在乌克兰敖德萨 -- "To America!" 是两家人共同的敬酒词。
推荐书单
Functional Programming in Scala
"我读过最好的技术书。" 函数式编程和类型思维塑造了 Boris 的编程方式 -- 即使未来可能不再需要写代码。
Accelerando (Charles Stross)
节奏越来越快的科幻小说,从技术起飞写到集体龙虾意识环绕木星。"捕捉了我们这个时刻的本质。"
流浪地球 (刘慈欣)
三体作者的短篇集。"中国科幻有完全不同的视角。写得非常美。"
人生格言:用常识
"Use common sense. A lot of failures I see is people just failing to use common sense. They follow a process without thinking about it... The best results come from people thinking from first principles." -- Boris Cherny
关于 Twitter 和用户反馈
Boris 开始用 Twitter 纯粹因为"无聊了"(在欧洲旅行时跑完 coding idea 后)。他开始在 Twitter 上找 Claude Code 的 bug 报告,然后在几分钟内修复。用户对修复速度感到震惊 -- 这正是 AI 赋能的开发节奏。
1. 长时间尺度思维:味噌需要等 3 个月到 4 年。一人公司也需要耐心 -- AI 工具让执行变快了,但找到 PMF 依然需要时间。
2. 常识 > 框架:Boris 给同事最多的建议就是"use common sense"。不要被流程和框架绑架,回到第一性原理。
3. Twitter 是免费的用户反馈渠道:Boris 在 Twitter 上找到用户、修复 bug、建立关系。一人公司也可以用同样的方式做产品驱动的社交。
4. 科幻构建心智模型:Boris 读科幻是为了"预排练未来"。推荐《Accelerando》和《流浪地球》给所有在 AI 时代建设的人。