我在 14 天内重建了整个 AI 播客应用。我很害怕。
我在 14 天内重建了我的播客应用——而它最初花了 6 个月。这个加速度让我害怕,也应该让你害怕。
如果你看过我之前的文章,你会知道我对 AI 生成内容一直心情复杂。我写过那种平淡、没有灵魂、像“谁都写得出来”的内容。我也一直坚持:AI 应该放大专业能力,而不是替代它。
那为什么我刚刚又花了两周,把 DIALØGUE——一个 AI 辅助播客生成器——彻底重做了一遍?
诚实答案是:我上瘾了。
在用 Claude Code 的 frontend-design 插件 3 天重做完个人网站之后,我脑子里一直在想:我还能再做什么?速度太上头,质量也比我单打独斗更好。我想继续推,看它到底能快到哪里、远到哪里。
这种好奇心最终变成了 119 次提交、一次完整后端重构,以及一个确实更好的产品。也让我开始对我十几岁女儿的未来产生一些不太舒服的思考。
不过先别跳太快。
这个时间线让我害怕
最让我挥之不去的是这张表:
| Project | Complexity | Time to Build |
|---------|------------|---------------|
| DIALØGUE v1 | MVP podcast generator | ~6 months |
| STRAŦUM | 9 AI agents, 11 frameworks, multi-tenant | 75 days |
| DIALØGUE v2 | Complete overhaul + major features | 14 days |
最初版 DIALØGUE,我用了大约 6 个月的夜晚和周末。学技术栈、犯错、凌晨 2 点排查线上问题。标准独立开发者轨迹。
后来我做 STRAŦUM——客观复杂度高 2-3 倍——用了 75 天,已经算很快。
但这次?14 天 119 commits。完整后端整合重构。很多单项功能过去都要按周算。并且我还有一份全职 VP 工作。
这本来不该可能。
我为什么要做(真实原因)
我先坦白:最初动机并不高尚。
我就是想玩更多 Claude Code 插件。
frontend-design 把我个人站改得很惊艳后,我开始好奇其他能力:/feature-dev、/code-simplifier、/code-explorer 等。我想看 “plan mode” 在架构决策里的表现,也想真正在项目里用上“并行 agents”。
所以我把 DIALØGUE 当成实验场。反正 UI 本来也该升级,是个很好的理由。
结果从“改几个页面”变成“后端架构其实不对”,再变成“那干脆把整个 AI 栈替换掉”。
两周后,我拿到了一个新产品。
The new DIALØGUE: completely redesigned from the ground up.
到底改了什么(以及这对你为什么重要)
更快、更稳定
后端我做了明显整合:原本十几个分散服务,收敛成更精简的一套系统。你在界面上看不出来,但会在体验上直接感到:错误更少、处理更快、结果更稳定。产品就是更“顺了”。
研究更聪明,而且有来源
旧版会帮你研究主题,但你只能“相信它可能是对的”。
新版里,每条关键信息都带来源。比如你做“remote work future”主题时,你能看到每条观点来自哪篇文章、哪份研究、哪个专家。你可以在进入播客前先验证。
我最满意的是:当你上传自己的研究资料(下面会讲)后,如果 AI 查到与网页最新信息冲突,它会直接告诉你:“你的 PDF 说 X,但最新公开资料是 Y。” 最后由你决定写哪一个。
不再是黑箱。你的播客,你的事实,你的控制权。
支持上传你自己的研究资料
你有白皮书、年报、研究报告,想变成播客讨论内容?
直接上传 PDF。DIALØGUE 会抽取关键洞察,并融合到播客脚本里,同时用实时网络结果交叉验证,避免信息过期。
这对顾问、分析师、研究人员特别有意义——你有专有知识,但没时间从零写脚本。
Upload your own research and DIALØGUE weaves it into your podcast.
30 种声音,可先听再选
旧版只有 6 个声音。现在是 30 个,从“informative and clear”到“excitable and engaging”再到“soft and gentle”。
每个声音都有自己的个性。Charon 信息表达很稳,适合 tech 主题;Fenrir 更热情温暖,适合访谈;Sulafat 柔和,适合 wellness 内容。你还可调节语速(慢到快)和语气(专业到轻松)。
更关键的是,你可以先试听“你的真实内容”。10 秒试听,不满意就换,满意再生成。
30 voices to choose from, each with its own personality.
真正可编辑脚本
旧流程是:批准 outline,等音频出来,听天由命。
现在中间有一个停顿点:AI 写完整脚本后,你可以在变音频前逐句看。某段不顺?改掉。想加自己的案例?加进去。AI 负责结构,你负责最终表达。
这就是我一直讲的 “human in the loop”。脚本最后是你的。
Review and edit every line before generating audio.
8 种播客风格,匹配你的表达方式
不是所有播客都该一个语气。现在你可以在 8 种风格中选择:从轻松聊天到结构化辩论,再到深度分析。
你可以按内容和受众选形式。
From casual conversation to structured debate—pick your format.
实时进度可视化
旧版是黑箱:点生成,然后盲等。
新版你会看到每一步:“正在研究主题……”“正在写第 3/5 段……”“正在生成音频……”。不再需要猜到底是崩了还是在跑。
可管理的播客库
终于有 search、filter、sort、delete。
内容越多,管理能力越关键。现在可按标题/主题搜索,按状态过滤,按时间排序,不满意的版本可直接删。
看似小功能,但日常体验提升很大。
Search, filter, and manage your growing podcast library.
可选两步验证(2FA)
如果你在这上面创作内容,你应该能保护账户。现在可接任意 authenticator app 开启 2FA。
不炫,但重要。
Claude Code 协作体验
这次高密度协作里,几个点让我意外:
并行 agents 真的能打
我会直接告诉 Claude Code:“合适时请用并行 agents。”
它会照做。一个 agent 先梳理代码库,一个设计实现方案,第三个在我审新功能时同步改旧代码。
体感像带一个团队。只是这个团队不睡觉,也不会抱怨。
Plan mode 改变了我思考方式
在动代码前,Claude Code 会先进入 “plan mode”:探索代码库、梳理依赖、提出架构方案。
很多方案比我自己想得更完整。边界条件考虑更全面,对既有模式兼容更稳。
我开始不把自己看作“首席架构师”,而更像 reviewer、decision-maker、taste-setter。
这次的数字
| Metric | Value |
|--------|-------|
| Total commits | 119 |
| Days elapsed | 14 |
| Files changed | 484 |
| Lines added/removed | 89,000+ |
| New voices | 6 → 30 |
| My code written | ~0 |
最后一行不是玩笑。我的手写代码接近 0 行。我主要做的是描述目标、审结果、做决策。实际实现由 Claude Code 完成。
真正让我睡不着的部分
下面这段是我最不舒服的地方。
我有个十几岁的女儿。聪明、好奇、努力。一个父母会希望孩子拥有的特质她都有。
但我不知道该怎么告诉她未来应该准备什么。
我 18 年广告职业里练出来的东西——策略思考、创意解题、理解人性——仍然有价值。但执行层技能呢?“把东西真正做出来”的部分,AI 现在能做,而且很多时候比我做得更快。并且还在每月变强。
我以前觉得“critical thinking”是答案:会思考,就不会被替代。
但现在问题是:AI 对任何问题都能先给你 50% 的 critical thinking,甚至 70%。门槛被整体抬高后,“我会思考”本身已经不再是过去那个差异化标签。
那还剩什么?品味?判断?知道什么是好?也许是。但我还没自信到能把我女儿的职业选择全部押在这上面。
不舒服的现实
我对这次结果是兴奋的。DIALØGUE v2 确实更好。用户会有更高控制权、更高灵活度,也更容易做出真正体现自己专业能力的播客。
但我也害怕。
不是怕技术本身,是怕速度。
14 天前我手上是一个“能用”的产品。今天它已经是一个底层逻辑都不同的产品。旧版回头看几乎像原始形态。再过 14 天呢?再过 6 个月呢?
社会整体还没为这种变化速度准备好。教育系统没准备好,就业结构没准备好,我们对“什么技能重要、什么职业稳定”的心理模型也没准备好。
我自己都没准备好。 而我还是在主动构建这些工具的人之一。
那为什么还要继续做
因为不做,结果可能更差。
如果 AI 工具一定会存在(而它们一定会存在),我宁可去构建“放大人类专业能力”的工具,而不是“直接替代人”的工具。
DIALØGUE 的目标不是替你生产内容,而是让你比单独工作时做出更好的内容。interactive outline editor、script revision pause point、source attribution——这些设计都是为了让人仍然握住控制权。
AI 负责繁琐部分,你负责关键判断。
这是我的方法论。它是否足够应对接下来发生的事?我坦白:不知道。
你可以自己试
如果你想直观看看 14 天构建能做出什么:
DIALØGUE 已经 live
本次更新包括:
- 30 个 AI 声音(从 6 扩展)+ 语速/语气自定义
- PDF 上传 + 来源标注
- 生成前声音试听
- 脚本内联编辑
- 8 种播客风格模板
- 实时进度追踪
- 播客库搜索/筛选/管理
- MFA/2FA 支持
- 完整重做的 mobile-first UI
Mobile-first design that works beautifully on any device.
新用户有 2 次免费播客额度。你可以做一条听起来真正像你的内容。
我还在思考的问题
我没有干净答案,但我现在在盯这四个问题:
-
5 年后真正值钱的技能是什么? 不只是“AI 现在还做不到什么”,而是当 AI“多数场景都做得够用”后,市场到底还会付费给什么。
-
下一代该怎么准备? 我女儿现在初中。她进入职场时会面对一个我无法准确预测的世界。她到底该学什么?
-
放大和替代的边界在哪里? 我相信 human-in-the-loop,但这个 loop 正在变小。它什么时候会消失?
-
更快构建真的等于更好构建吗? 我 14 天推了 119 commits。但这些真的是“最该做的”吗?速度如果没有方向,最终只是混乱。
这些问题我没有答案,也不确定有人有。
但我会继续构建、继续写、继续公开思考。就在这次重建两天后,我又在 48 小时内给 DIALØGUE 加了 5 种语言——基于同一套 Next.js + Supabase 新底座。
这是我现在唯一能确定会继续做的事。
---
Still building. Still scared. Still trying to figure out what to tell my daughter.
Update (Feb 2026): 我开始在不会 Swift 的情况下给 DIALØGUE 做原生 iOS app。这个过程让我对“女儿那个问题”的理解更具体了——答案可能是:“去学会成为那个会打开 Simulator 的人。”
---












