我为什么创建了 CyberWhisper
一个关于噪音、极限编程,以及 AI 时代输入革命的故事
——一个关于噪音、极限编程,以及 AI 时代输入革命的故事
在我职业生涯的很长一段时间里,有一条原则几乎是被反复强调、甚至有点刻进骨子里的:
说话不要乱说,说错了是要出事的。
这不是鸡汤,也不是抽象的职场建议,而是我在真实工作中一次次被验证过的经验。
远程工作,我第一次真正理解”噪音”的代价
在结束了我第一次创业之后,我进入了一个高度远程协作的团队。我的老板是一位以色列人,叫 Eiton。
他在会议中最常说的一句话是:
“Guys, this is background noise.”
一开始,我并没有完全理解这句话的重量。
后来我才慢慢意识到,在远程协作环境中,对需求的错误理解是灾难性的。因为缺乏即时、面对面的纠偏机制,一旦某个错误假设被默认接受,它就会像滚雪球一样,贯穿整个讨论、设计和实现过程。
所以 Eiton 会反复强调几件事:
- 哪些信息在当前阶段并不重要
- 哪些判断是明显错误的
- 哪些内容只是噪音,应该被明确忽略
那是我第一次清晰地意识到:
沟通的关键,不在于说得多,而在于识别什么不该被当真。
我的第一位经理,把我带进了 Extreme Programming 的世界
在我的职业早期,我遇到了我的第一位经理 Austin。正是他,把 Extreme Programming(XP) 的理念介绍给了我。
那对当时的我来说,是一次非常深刻、甚至可以说是”重塑认知”的经历。
测试优先(Test First)、快速反馈、持续集成、简单设计……XP 的方法论看起来并不复杂,但它背后解决的是一个当时最现实、也最残酷的问题:
人力的浪费太昂贵了。
在那个年代:
- 写错代码的成本极高
- 一次理解偏差,可能意味着几周甚至几个月的返工
- 需求一旦走偏,很难以低成本纠正
后来,我大量阅读了 Martin Fowler、Kent Beck 等人的书和文章。可以说,这些方法论在很长一段时间里,构成了我职业生涯的底层操作系统。
Web 2.0 时代:Always Beta 是成立的
这套思维,一路伴随了我很多年。
无论是独立开发、参与开源软件,还是再之后的创业,我始终对:
- 测试优先
- 快速迭代
- 清晰的边界
- 框架化的开发方式
保持着近乎执念的兴趣。
在我自己的创业项目 8box 中,我们是国内最早切换到 Ruby on Rails 的创业公司。并不是因为潮流,而是因为它所代表的一种工作节奏:
尽快跑起来,尽早验证,尽早纠错。
在那个阶段,这套逻辑是完全成立的。“Always Beta” 几乎是 Web 2.0 时代每一家公司的最酷理念——快速上线、持续迭代,在真实使用中不断修正方向。
那是一个默认”变化比稳定更重要”的年代。
当 AI 成为主要协作对象
真正的转折,发生在 AI 成为我日常工作的一部分之后。
我逐渐发现,自己花大量时间,并不是在”写代码”,而是在:
- 给 AI 补充上下文
- 纠正它对问题的误解
- 来回澄清我真正想解决的是什么
慢慢地,一个非常反直觉的事实浮现出来:
在和 AI 沟通时,说得太少,本身就是一种浪费。
当输入过少时,AI 往往会:
- 产生幻觉
- 给出模糊、泛化的答案
- 迫使你不断返工、反复纠正
- 打断原本连续的思考过程
这并不是模型不够聪明,而是输入方式的问题。
极限输入:一个时代变化下的结论
这让我第一次真正回头反思过去那些”正确的训练”。
它们没有错,只是适用条件已经发生了变化。
在人与人沟通的时代,谨言慎行是理性的选择。
但在人与机器沟通的时代:
- 带宽极高
- 容错极强
- 机器可以无限耐心
被过度压缩的输入,反而成了系统瓶颈。
正是在这种张力之下,我提出了 Extreme Input(极限输入) 这个概念。
它不是鼓励乱说话,而是主张:
把真实、未成型的思考完整输入,让系统承担去噪和重构的责任。
CyberWhisper 解决的不是语音,而是分工问题
这正是我创建 CyberWhisper 的原因。
CyberWhisper 并不是一个”更好的语音输入工具”,而是一次责任重新分配:
- 人,负责高速、真实、连续的输入
- 系统,负责场景感知、去噪、重构
- AI,才能稳定地进行推理和反馈
你不需要想清楚再说。你需要在思考形成的过程中,把它完整地交出来。
结语
我从来没有否定过过去的方法论。正是它们,让我一路走到了今天。
但也正因为走过那条路,我才更加确信:
每一个时代,都会重新定义什么是”浪费”。
在 AI 时代,最大的浪费,不再是说错话,而是没把真实的思考输入进去。
CyberWhisper,正是在这样的判断之下诞生的。
它不是一个功能集合。它是一种立场,凝结了我多年思考、构建与学习的过程。