我几个月前发布了 DIALØGUE 的 iOS app。然后,我几乎把它重做了一遍。
第一版就是 web 产品缩小后塞进手机:topic、PDF upload、voice picker、credits、library、settings——全部照搬过来。它能用。问题恰恰就在这里。
握在手里的手机不是缩小版的桌面。那是另一个场景。这篇文章想讲的,就是这两个版本之间的差距。
那一版背后的假设很简单:DIALØGUE 是个 AI podcast generator,所以 app 的任务就是把这个 generator 摆出来。可一旦这么想,手机很快就变成了一个小 dashboard。
但没有人打开 podcast app,是因为想管理 dashboard。
他们打开它,是因为有一个 idea 想变成 audio。或者有一集已经完成,想听。或者有一个重复 show 的 setup,不想每次重新配置。所以我最后不是围绕 feature list 重做 app,而是围绕 workflow 重做。
现在的 iOS 版本已经在 App Store 上线。我不会编造安装量、评分或采用数据。这里更值得写的是一个产品教训:对很多 AI app 来说,workflow 才是产品。
Create 不只是一个表单
创建流程从最简单的问题开始:这个 podcast 要讲什么?
你可以从 topic 开始,从 PDF 开始,也可以两者都用。topic 适合让系统帮你 research 和结构化。PDF 适合你已经有可信 source material,想把它变成可以听的内容。
这个 screen 不只是 input。它是第一个 trust moment。
在 desktop 上,可以展示更多 context。在手机上,每多一个 panel 都在索取 attention。iOS app 需要更有取舍,而不是更完整。
信任是在 review 里建立的
我以前把 DIALØGUE 叫做 AI podcast generator。这没错,但不完整。
更重要的说法是:先 review,再生成 audio。
workflow 里有两个 review gate。先是 outline:在 full script 写出来之前,你可以 approve 或给 feedback。然后是 script review:在生成 audio 之前,你可以阅读真正的文字。
这不只是一个 UX 细节。它减少 wasted credits、wasted time,也减少发布“差一点对,但其实不对”的内容的风险。
script review 同样重要,只是更接近 point of no return。在这里,tone、host rhythm 和内容的 confidence 都会显现出来。
对我来说,这就是“AI as magic”和“AI as product”的区别。Magic 隐藏过程。Product 让关键决定可以被检查。
Listening 不是后续补充
这里我也错了。
有一段时间,我把 listening 当成产品结束后的事情:创建 podcast,生成 audio,放进 library。结束。
但如果 output 是 audio,listening 就不是结尾。它是产品的一半。
现在 app 有 synced transcript。episode 播放时,你可以跟着 text 看,也可以 tap 某一行直接跳转。因为 DIALØGUE 生成了 script,它已经理解 episode 的结构。transcript 不是附加物;它让 output 更容易导航,也更值得信任。
offline listening 也是一样。如果有人为通勤、散步、飞行或弱网环境创建 podcast,audio 就必须像真正的 audio 一样工作。
Repeatability 不是 automation
DIALØGUE 以前把 recurring shows 叫 Studio。听起来不错,但太重了。
Studio 让人想到 control room、很多 knobs、很多管理。更清楚的概念是 Series。
Series 是一个保存好的 setup:hosts、tone、format、language、source pattern。它让你生成下一集时,不用从零开始配置。
正确的问题不是“这里还能管理什么”。正确的问题是:哪些重复工作可以安全地消失?
Localized screenshots 是产品证据
App 目前支持七种语言:英语、越南语、日语、韩语、西班牙语、中文和法语。
只翻译 App Store listing 很容易。但多语言产品不会因为 marketing copy 被翻译就变得可信。真正的 flow 在用户语言里看起来自然,信任才会增加。这也是我第一次把 DIALOGUE 做成多语言产品时学到的同一个道理。
我不是说每种语言都同样成熟。那太容易,也太自信。但正因为如此,screenshot package 很重要:它让 quality bar 可见。
我带走的 lesson
做 AI product 的时候,很容易觉得 model 就是 product。
有时候是。但大多数时候,我认为 workflow 才是 product。
Model 给你 capability。Workflow 把 capability 变成人可以信任使用的东西。它决定 user 什么时候有 control,system 什么时候可以继续,output 什么时候必须 inspectable,interface 什么时候应该停止索取 attention。
对 DIALØGUE on iOS 来说,这意味着:
- 有 idea 或 source material 时 Create
- 在 time 和 credits 花到 audio 前 Review
- 用 transcript 和 offline support Listen
- 用 Series Repeat,不用每次重新 setup
- Localize 真正的 flow,而不只是 marketing page
我可能仍然错。真正的 test 不是 screenshots 好不好看。真正的 test 是:有人是否会创建一集、听完,然后回来再创建下一集。
这是我现在在意的 bar。
常见问题
DIALØGUE iOS app 改了什么?
App 现在使用三个 main tabs:Listen、Create 和 You。它还加入了 synced transcript、offline downloads、Siri/Shortcuts、用于 recurring shows 的 Series,以及七种 app languages 的 localized App Store screenshots。
为什么说 workflow 是 product?
因为有用的不只是 AI 生成 audio。有用的是完整路径:topic 或 PDF、outline、script、audio、带 context 的 listening,以及可重复使用的 setup。
DIALØGUE 比 NotebookLM 更好吗?
取决于 job。NotebookLM 对 source-based audio overviews 很有用,而且免费。DIALØGUE 想做的是更完整的 podcast workflow:language、outline review、script review、voices、final audio、transcript、offline access 和 Series。
DIALØGUE iOS app 支持哪些语言?
七种:英语、越南语、日语、韩语、西班牙语、中文和法语。目前每种语言的成熟度并不相同——英语用得最多——但创建、审核、收听这些核心 flow 都做了 localize,不只是 App Store listing。
DIALØGUE 的 podcast 可以离线收听吗?
可以。你可以下载 episode 离线收听,这在通勤、坐飞机或信号不好的地方很有用。播放 episode 时,synced transcript 让你边看文字边听,并 tap 任意一行直接跳转到那个位置。
今天就到这里。
如果你也在做 AI product,我很好奇:product 到底住在哪里——model、interface,还是围绕它的 workflow?
祝好, Chandler






