我在 14 天内重建了整个 AI 播客应用。我很害怕。

如果你看过我之前的文章，你会知道我对 AI 生成内容一直心情复杂。我写过那种平淡、没有灵魂、像“谁都写得出来”的内容。我也一直坚持：AI 应该放大专业能力，而不是替代它。

那为什么我刚刚又花了两周，把 DIALØGUE——一个 AI 辅助播客生成器——彻底重做了一遍？

诚实答案是：我上瘾了。

在用 Claude Code 的 frontend-design 插件 3 天重做完个人网站之后，我脑子里一直在想：我还能再做什么？速度太上头，质量也比我单打独斗更好。我想继续推，看它到底能快到哪里、远到哪里。

这种好奇心最终变成了 119 次提交、一次完整后端重构，以及一个确实更好的产品。也让我开始对我十几岁女儿的未来产生一些不太舒服的思考。

不过先别跳太快。

这个时间线让我害怕

最让我挥之不去的是这张表：

| Project | Complexity | Time to Build |

|---------|------------|---------------|

| DIALØGUE v1 | MVP podcast generator | ~6 months |

| STRAŦUM | 9 AI agents, 11 frameworks, multi-tenant | 75 days |

| DIALØGUE v2 | Complete overhaul + major features | 14 days |

最初版 DIALØGUE，我用了大约 6 个月的夜晚和周末。学技术栈、犯错、凌晨 2 点排查线上问题。标准独立开发者轨迹。

后来我做 STRAŦUM——客观复杂度高 2-3 倍——用了 75 天，已经算很快。

但这次？14 天 119 commits。完整后端整合重构。很多单项功能过去都要按周算。并且我还有一份全职 VP 工作。

这本来不该可能。

我为什么要做（真实原因）

我先坦白：最初动机并不高尚。

我就是想玩更多 Claude Code 插件。

frontend-design 把我个人站改得很惊艳后，我开始好奇其他能力：/feature-dev、/code-simplifier、/code-explorer 等。我想看 “plan mode” 在架构决策里的表现，也想真正在项目里用上“并行 agents”。

所以我把 DIALØGUE 当成实验场。反正 UI 本来也该升级，是个很好的理由。

结果从“改几个页面”变成“后端架构其实不对”，再变成“那干脆把整个 AI 栈替换掉”。

两周后，我拿到了一个新产品。

The new DIALØGUE: completely redesigned from the ground up.

到底改了什么（以及这对你为什么重要）

更快、更稳定

后端我做了明显整合：原本十几个分散服务，收敛成更精简的一套系统。你在界面上看不出来，但会在体验上直接感到：错误更少、处理更快、结果更稳定。产品就是更“顺了”。

研究更聪明，而且有来源

旧版会帮你研究主题，但你只能“相信它可能是对的”。

新版里，每条关键信息都带来源。比如你做“remote work future”主题时，你能看到每条观点来自哪篇文章、哪份研究、哪个专家。你可以在进入播客前先验证。

我最满意的是：当你上传自己的研究资料（下面会讲）后，如果 AI 查到与网页最新信息冲突，它会直接告诉你：“你的 PDF 说 X，但最新公开资料是 Y。” 最后由你决定写哪一个。

不再是黑箱。你的播客，你的事实，你的控制权。

支持上传你自己的研究资料

你有白皮书、年报、研究报告，想变成播客讨论内容？

直接上传 PDF。DIALØGUE 会抽取关键洞察，并融合到播客脚本里，同时用实时网络结果交叉验证，避免信息过期。

这对顾问、分析师、研究人员特别有意义——你有专有知识，但没时间从零写脚本。

Upload your own research and DIALØGUE weaves it into your podcast.

30 种声音，可先听再选

旧版只有 6 个声音。现在是 30 个，从“informative and clear”到“excitable and engaging”再到“soft and gentle”。

每个声音都有自己的个性。Charon 信息表达很稳，适合 tech 主题；Fenrir 更热情温暖，适合访谈；Sulafat 柔和，适合 wellness 内容。你还可调节语速（慢到快）和语气（专业到轻松）。

更关键的是，你可以先试听“你的真实内容”。10 秒试听，不满意就换，满意再生成。

30 voices to choose from, each with its own personality.

真正可编辑脚本

旧流程是：批准 outline，等音频出来，听天由命。

现在中间有一个停顿点：AI 写完整脚本后，你可以在变音频前逐句看。某段不顺？改掉。想加自己的案例？加进去。AI 负责结构，你负责最终表达。

这就是我一直讲的 “human in the loop”。脚本最后是你的。

Review and edit every line before generating audio.

8 种播客风格，匹配你的表达方式

不是所有播客都该一个语气。现在你可以在 8 种风格中选择：从轻松聊天到结构化辩论，再到深度分析。

你可以按内容和受众选形式。

From casual conversation to structured debate—pick your format.

实时进度可视化

旧版是黑箱：点生成，然后盲等。

新版你会看到每一步：“正在研究主题……”“正在写第 3/5 段……”“正在生成音频……”。不再需要猜到底是崩了还是在跑。

可管理的播客库

终于有 search、filter、sort、delete。

内容越多，管理能力越关键。现在可按标题/主题搜索，按状态过滤，按时间排序，不满意的版本可直接删。

看似小功能，但日常体验提升很大。

Search, filter, and manage your growing podcast library.

可选两步验证（2FA）

如果你在这上面创作内容，你应该能保护账户。现在可接任意 authenticator app 开启 2FA。

不炫，但重要。

Claude Code 协作体验

这次高密度协作里，几个点让我意外：

并行 agents 真的能打

我会直接告诉 Claude Code：“合适时请用并行 agents。”

它会照做。一个 agent 先梳理代码库，一个设计实现方案，第三个在我审新功能时同步改旧代码。

体感像带一个团队。只是这个团队不睡觉，也不会抱怨。

Plan mode 改变了我思考方式

在动代码前，Claude Code 会先进入 “plan mode”：探索代码库、梳理依赖、提出架构方案。

很多方案比我自己想得更完整。边界条件考虑更全面，对既有模式兼容更稳。

我开始不把自己看作“首席架构师”，而更像 reviewer、decision-maker、taste-setter。

这次的数字

| Metric | Value |

|--------|-------|

| Total commits | 119 |

| Days elapsed | 14 |

| Files changed | 484 |

| Lines added/removed | 89,000+ |

| New voices | 6 → 30 |

| My code written | ~0 |

最后一行不是玩笑。我的手写代码接近 0 行。我主要做的是描述目标、审结果、做决策。实际实现由 Claude Code 完成。

真正让我睡不着的部分

下面这段是我最不舒服的地方。

我有个十几岁的女儿。聪明、好奇、努力。一个父母会希望孩子拥有的特质她都有。

但我不知道该怎么告诉她未来应该准备什么。

我 18 年广告职业里练出来的东西——策略思考、创意解题、理解人性——仍然有价值。但执行层技能呢？“把东西真正做出来”的部分，AI 现在能做，而且很多时候比我做得更快。并且还在每月变强。

我以前觉得“critical thinking”是答案：会思考，就不会被替代。

但现在问题是：AI 对任何问题都能先给你 50% 的 critical thinking，甚至 70%。门槛被整体抬高后，“我会思考”本身已经不再是过去那个差异化标签。

那还剩什么？品味？判断？知道什么是好？也许是。但我还没自信到能把我女儿的职业选择全部押在这上面。

不舒服的现实

我对这次结果是兴奋的。DIALØGUE v2 确实更好。用户会有更高控制权、更高灵活度，也更容易做出真正体现自己专业能力的播客。

但我也害怕。

不是怕技术本身，是怕速度。

14 天前我手上是一个“能用”的产品。今天它已经是一个底层逻辑都不同的产品。旧版回头看几乎像原始形态。再过 14 天呢？再过 6 个月呢？

社会整体还没为这种变化速度准备好。教育系统没准备好，就业结构没准备好，我们对“什么技能重要、什么职业稳定”的心理模型也没准备好。

我自己都没准备好。 而我还是在主动构建这些工具的人之一。

那为什么还要继续做

因为不做，结果可能更差。

如果 AI 工具一定会存在（而它们一定会存在），我宁可去构建“放大人类专业能力”的工具，而不是“直接替代人”的工具。

DIALØGUE 的目标不是替你生产内容，而是让你比单独工作时做出更好的内容。interactive outline editor、script revision pause point、source attribution——这些设计都是为了让人仍然握住控制权。

AI 负责繁琐部分，你负责关键判断。

这是我的方法论。它是否足够应对接下来发生的事？我坦白：不知道。

你可以自己试

如果你想直观看看 14 天构建能做出什么：

DIALØGUE 已经 live

本次更新包括：

- 30 个 AI 声音（从 6 扩展）+ 语速/语气自定义

- PDF 上传 + 来源标注

- 生成前声音试听

- 脚本内联编辑

- 8 种播客风格模板

- 实时进度追踪

- 播客库搜索/筛选/管理

- MFA/2FA 支持

- 完整重做的 mobile-first UI

Mobile-first design that works beautifully on any device.

新用户有 2 次免费播客额度。你可以做一条听起来真正像你的内容。

我还在思考的问题

我没有干净答案，但我现在在盯这四个问题：

5 年后真正值钱的技能是什么？ 不只是“AI 现在还做不到什么”，而是当 AI“多数场景都做得够用”后，市场到底还会付费给什么。
下一代该怎么准备？ 我女儿现在初中。她进入职场时会面对一个我无法准确预测的世界。她到底该学什么？
放大和替代的边界在哪里？ 我相信 human-in-the-loop，但这个 loop 正在变小。它什么时候会消失？
更快构建真的等于更好构建吗？ 我 14 天推了 119 commits。但这些真的是“最该做的”吗？速度如果没有方向，最终只是混乱。

这些问题我没有答案，也不确定有人有。

但我会继续构建、继续写、继续公开思考。就在这次重建两天后，我又在 48 小时内给 DIALØGUE 加了 5 种语言——基于同一套 Next.js + Supabase 新底座。

这是我现在唯一能确定会继续做的事。

---

Still building. Still scared. Still trying to figure out what to tell my daughter.

Update (Feb 2026): 我开始在不会 Swift 的情况下给 DIALØGUE 做原生 iOS app。这个过程让我对“女儿那个问题”的理解更具体了——答案可能是：“去学会成为那个会打开 Simulator 的人。”

---