跳到正文
Chandler Nguyen
AI閱讀時間3分鐘

AI

iOS app 唔係產品。Workflow 先係。

我幾個月前 ship 咗 DIALØGUE 個 iOS app,之後幾乎成個重做。真正嘅 product 原來係 workflow:create、review、listen、repeat——喺七種語言入面。

我幾個月前 ship 咗 DIALØGUE 個 iOS app。之後,我幾乎成個重做。

第一版就係 web product 縮細塞入手機:topic、PDF upload、voice picker、credits、library、settings——全部照搬過嚟。佢用得到。問題正正就喺呢度。

揸喺手嘅手機唔係細咗嘅 desktop。嗰個係另一個場景。呢篇文想講嘅,就係呢兩個版本之間嘅距離。

嗰一版背後嘅假設好簡單:DIALØGUE 係個 AI podcast generator,所以 app 嘅工作就係將個 generator 擺出嚟。但一咁諗,手機好快就變成一個細 dashboard。

但冇人打開 podcast app,係因為想 manage dashboard。

佢打開,係因為有個 idea 想變成 audio。或者有集已經完成,想聽。或者有個 recurring show setup,唔想每次重新 configure。所以我最後係圍住 workflow rebuild 個 app,而唔係圍住 feature list。

而家 iOS version 已經喺 App Store live。我唔會作 install numbers、ratings、adoption metrics。呢篇想寫嘅係一個 product lesson:好多 AI apps 入面,workflow 先係 product。

Create 唔只係一個 form

Flow 由最簡單嘅問題開始:呢個 podcast 講乜?

你可以由 topic 開始,可以由 PDF 開始,亦可以兩樣都用。Topic 適合想 system 幫你 research 同 structure。PDF 適合你已經有 trusted source material,想變成聽得嘅內容。

呢個 screen 唔只係 input。佢係第一個 trust moment。

DIALØGUE iOS create screen,有 topic input 同 PDF attachment
iOS app 入面嘅 create flow——system 接觸 source material 之前第一個 trust moment。

Desktop 可以 show 多啲 context。Phone 上面,每多一個 panel 都係問 user 攞 attention。iOS app 需要更有取捨,而唔係更完整。

Trust 係 review 入面建立

我以前叫 DIALØGUE 做 AI podcast generator。冇錯,但唔完整。

更重要嘅 phrase 係:audio 之前先 review

Workflow 有兩個 review gates。第一係 outline:full script 寫出嚟之前,你可以 approve 或者俾 feedback。第二係 script review:audio 生成之前,你可以睇真正嘅文字。

呢個唔係 UX decoration。佢減少 wasted credits、wasted time,同埋 publish 一啲「差少少啱,但其實唔啱」內容嘅風險。

DIALØGUE iOS outline review screen,有 approval controls
Outline review gate——audio 之前,workflow 要可以畀人 inspect。

Script review 都一樣重要,只係更近 point of no return。Tone、host rhythm、content confidence,都會喺呢度浮現。

DIALØGUE iOS script review screen,audio generation 之前
Script review gate——重點係 audio 前有 control,而唔係只係 generate 得更快。

對我嚟講,呢個就係「AI as magic」同「AI as product」嘅分別。Magic 會隱藏工作。Product 會令重要 decision 可以 inspect。

Listening 唔係 afterthought

呢度我都錯過。

有一段時間,我將 listening 當成 product 完成之後先發生嘅事:create podcast、generate audio、放入 library。完。

但如果 output 係 audio,listening 唔係結尾。佢係 product 嘅一半。

App 而家有 synced transcript。Episode 播緊嘅時候,你可以跟住 text 睇,tap 某一行直接跳去嗰度。因為 DIALØGUE 生成咗 script,佢本身已經理解 episode structure。Transcript 唔係 add-on;佢令 output 更容易 navigate,同更值得信任。

DIALØGUE iOS synced transcript screen,有 tap-to-seek transcript cards
Synced transcript——listening 係 workflow 一部分,唔係 generation 之後嘅 decoration。

Offline listening 都係同一個 logic。如果有人 create podcast 係為咗 commute、散步、搭飛機、或者冇乜 signal 嘅地方聽,audio 就要似真正 audio 咁運作。

DIALØGUE iOS offline listening screen,有 downloaded episode controls
Offline listening——app 要尊重真實 listening conditions。

Repeatability 唔等於 automation

DIALØGUE 以前用 Studio 呢個字去講 recurring shows。好聽,但太重。

Studio 令人諗起 control room,好多 knobs,好多 management。更清楚嘅諗法係 Series

Series 係一個 saved setup:hosts、tone、format、language、source pattern。你可以 create 下一集,而唔使每次由零開始 configure。

DIALØGUE iOS Series screen,用嚟保存可重複嘅 podcast setup
Series——repeatability 應該減少 setup work,而唔係取消 review。

正確問題唔係「呢度仲可以 manage 啲咩」。正確問題係:邊啲 repeated work 可以安全咁消失?

Localized screenshots 係 product evidence

App 而家支援七種語言:English、Vietnamese、Japanese、Korean、Spanish、Chinese、French。

只係 translate App Store listing 好容易。但 multilingual product 唔會因為 marketing copy 被翻譯就可信。真正嘅 flow 喺 user 嘅語言入面睇落自然,先會增加 trust。呢個都係我第一次將 DIALOGUE 做成多語言產品嗰陣學到嘅同一個道理。

DIALØGUE iOS voice preview screen,有 voice selection controls
Voice preview——localization 要去到真正 decision points,唔只係 landing page。

我唔係話每種語言都同樣成熟。咁講太容易,亦太自信。正正因為咁,screenshot package 重要:佢令 quality bar 變得 visible。

我帶走嘅 lesson

Build AI product 嘅時候,好容易以為 model 就係 product。

有時係。但大部分時間,我覺得 workflow 先係 product。

Model 給你 capability。Workflow 將 capability 變成一樣人可以信任使用嘅嘢。佢決定 user 幾時有 control,system 幾時可以繼續,output 幾時需要 inspectable,interface 幾時應該停止問 user 攞 attention。

對 DIALØGUE on iOS 嚟講,意思係:

  • 有 idea 或 source material 時 Create
  • 花 time 同 credits 去 audio 前 Review
  • 用 transcript 同 offline support Listen
  • 用 Series Repeat,唔使每次 setup
  • Localize 真正 flow,而唔只係 marketing page

我可能仲係錯。真正 test 唔係 screenshots 靚唔靚。真正 test 係:有人會唔會 create 一集、聽完,然後返嚟 create 下一集。

呢個先係我而家在意嘅 bar。

常見問題

DIALØGUE iOS app 改咗啲咩?

App 而家有三個 main tabs:Listen、Create、You。亦加入 synced transcript、offline downloads、Siri/Shortcuts、俾 recurring shows 用嘅 Series,同七種 app languages 嘅 localized App Store screenshots。

點解話 workflow 先係 product?

因為有用嘅唔只係 AI 生成 audio。真正有用係成條路:topic 或 PDF、outline、script、audio、有 context 嘅 listening、同可以重用嘅 setup。如果冇呢啲 step,model output 再好都只係一段難以信任嘅 audio。

DIALØGUE 係咪好過 NotebookLM?

睇 job。NotebookLM 對 source-based audio overviews 好有用,而且免費。DIALØGUE 想做一個更完整嘅 podcast workflow:language、outline review、script review、voices、final audio、transcript、offline access、Series。

DIALØGUE iOS app 支援邊啲語言?

七種:英文、越南文、日文、韓文、西班牙文、中文、法文。而家唔係每種語言都同樣成熟——英文用得最多——但 create、review、listen 呢啲核心 flow 都做咗 localize,唔只係 App Store listing。

DIALØGUE 嘅 podcast 可唔可以離線聽?

可以。你可以下載 episode 離線聽,喺通勤、搭飛機或者信號差嘅地方好有用。播緊 episode 嗰陣,synced transcript 可以俾你一路睇 text 一路聽,仲可以 tap 任何一行直接跳去嗰個位置。

今日先到呢度。

如果你都有 build AI product,我好好奇:product 真正住喺邊度——model、interface,定係圍住佢嘅 workflow?

祝好, Chandler