본문으로 건너뛰기
Chandler Nguyen
AI5분 읽기

AI

iOS 앱이 제품이 아니었어요. 워크플로가 제품이었죠.

저는 DIALØGUE의 iOS 앱을 몇 달 전에 출시했고, 그다음 거의 전부 다시 만들었습니다. 진짜 제품은 워크플로였습니다. 만들고, 검토하고, 듣고, 반복하고 — 일곱 개 언어에서.

저는 DIALØGUE의 iOS 앱을 몇 달 전에 출시했습니다. 그리고 거의 전부 다시 만들었습니다.

첫 버전은 웹 제품을 휴대폰에 맞게 줄여 놓은 것이었습니다. topic, PDF upload, voice picker, credits, library, settings — 전부 그대로 옮겼습니다. 작동했습니다. 그게 바로 문제였습니다.

누군가의 손에 들린 휴대폰은 작아진 데스크톱이 아닙니다. 그것은 다른 순간입니다. 이 글은 그 두 버전 사이의 간극에 관한 이야기입니다.

그 버전 밑에 깔린 가정은 단순했습니다. DIALØGUE는 AI podcast generator니까, 앱이 할 일은 그 generator를 드러내는 것이다. 그런데 그렇게 생각하면 휴대폰은 금세 작은 dashboard가 되어 버립니다.

하지만 누구도 dashboard를 관리하려고 podcast app을 열지는 않습니다.

아이디어를 audio로 만들고 싶어서 열죠. 완성된 episode를 듣고 싶어서 열죠. 반복되는 show setup을 매번 다시 설정하고 싶지 않아서 열죠. 그래서 저는 feature list가 아니라 workflow를 중심으로 앱을 다시 만들었습니다.

현재 iOS 버전은 App Store에 올라와 있습니다. 설치 수, 평점, 사용량 같은 숫자를 만들어 말하지는 않겠습니다. 제가 가진 것은 더 유용한 제품 교훈입니다. 많은 AI 앱에서 제품은 모델이 아니라 workflow입니다.

Create는 단순한 form이 아닙니다

흐름은 가장 단순한 질문으로 시작합니다. 이 podcast는 무엇에 관한 것인가?

topic으로 시작할 수도 있고, PDF로 시작할 수도 있고, 둘 다 사용할 수도 있습니다. topic은 시스템이 조사하고 구조화하기를 원할 때 좋습니다. PDF는 이미 믿을 수 있는 source material이 있을 때 좋습니다.

이 화면은 단순한 입력 화면이 아닙니다. 첫 번째 신뢰 순간입니다.

DIALØGUE iOS 생성 화면, topic input과 PDF 첨부가 보임
iOS 앱의 create flow입니다. 시스템이 source material을 다루기 전 첫 trust moment입니다.

데스크톱에서는 더 많은 맥락을 보여줄 수 있습니다. 휴대폰에서는 panel 하나가 늘어날 때마다 attention을 요구합니다. iOS 앱은 더 완전해지는 것이 아니라 더 분명한 선택을 해야 했습니다.

신뢰는 review에서 만들어집니다

저는 예전에 DIALØGUE를 AI podcast generator라고 불렀습니다. 맞는 말이지만 충분하지 않습니다.

더 중요한 표현은 audio 전에 review입니다.

workflow에는 두 개의 review gate가 있습니다. 먼저 outline입니다. full script가 작성되기 전에 승인하거나 feedback을 줄 수 있습니다. 그다음 script review입니다. audio로 만들기 전에 실제 문장을 읽을 수 있습니다.

이것은 단순한 UX 디테일이 아닙니다. credits와 시간을 낭비하지 않게 하고, "거의 맞지만 아직 아닌" 결과물을 publish하는 위험을 줄이는 장치입니다.

DIALØGUE iOS outline review 화면, 승인 컨트롤이 보임
Outline review gate입니다. audio 전에 workflow를 inspect할 수 있어야 합니다.

script review도 같은 이유로 중요합니다. 다만 되돌리기 어려운 지점에 더 가깝습니다. 여기서 tone, host rhythm, 내용의 confidence가 보입니다.

DIALØGUE iOS script review 화면, audio generation 전 단계
Script review gate입니다. 핵심은 더 빠른 generation이 아니라 audio 전의 control입니다.

저에게 이것은 "마법으로서의 AI"와 "제품으로서의 AI"의 차이입니다. 마법은 일을 숨깁니다. 제품은 중요한 결정을 확인 가능하게 만듭니다.

듣기는 afterthought가 아닙니다

이 부분에서도 저는 틀렸습니다.

한동안 저는 listening을 제품이 끝난 뒤의 일로 생각했습니다. podcast를 만들고, audio를 생성하고, library에 넣는다. 끝.

하지만 output이 audio라면 listening은 끝이 아닙니다. 제품의 절반입니다.

앱에는 이제 synced transcript가 있습니다. episode가 재생되는 동안 text를 따라가고, 한 줄을 tap해서 그 위치로 이동할 수 있습니다. DIALØGUE가 script를 생성했기 때문에 episode 구조를 이미 알고 있습니다. transcript는 부가 기능이 아니라 output을 더 탐색 가능하고 더 신뢰 가능하게 만드는 장치입니다.

DIALØGUE iOS synced transcript 화면, tap-to-seek 카드가 보임
Synced transcript입니다. listening은 generation 뒤의 장식이 아니라 workflow의 일부입니다.

offline listening도 같은 논리입니다. 누군가 출퇴근, 산책, 비행, 또는 신호가 약한 곳에서 들으려고 podcast를 만든다면 audio는 진짜 audio처럼 동작해야 합니다.

DIALØGUE iOS offline listening 화면, 다운로드된 episode 컨트롤이 보임
Offline listening입니다. app은 실제 listening conditions를 존중해야 합니다.

repeatability는 automation과 다릅니다

DIALØGUE는 예전에 recurring shows를 Studio라고 불렀습니다. 괜찮게 들렸지만 너무 무거운 말이었습니다.

Studio는 control room처럼 느껴집니다. 많은 knob, 많은 management. 더 명확한 이름은 Series였습니다.

Series는 저장된 setup입니다. hosts, tone, format, language, source pattern. 다음 episode를 만들 때 모든 것을 다시 설정하지 않아도 됩니다.

DIALØGUE iOS Series 화면, 반복 가능한 podcast setup 저장용
Series입니다. repeatability는 setup work를 줄여야지 review를 없애면 안 됩니다.

올바른 질문은 "여기서 무엇을 더 관리할 수 있을까?"가 아닙니다. "어떤 반복 작업을 control을 잃지 않고 없앨 수 있을까?"입니다.

localized screenshots는 제품 증거입니다

앱은 현재 영어, 베트남어, 일본어, 한국어, 스페인어, 중국어, 프랑스어를 지원합니다.

App Store listing만 번역하는 것은 쉬웠을 것입니다. 하지만 multilingual product는 marketing copy가 번역되었다고 신뢰받지 않습니다. 실제 flow가 사용자의 언어에서 자연스럽게 느껴질 때 신뢰가 생깁니다. 이건 제가 DIALOGUE를 여러 언어로 출시했을 때 처음 배운 것과 같은 교훈입니다.

DIALØGUE iOS voice preview 화면, voice selection 컨트롤이 보임
Voice preview입니다. localization은 landing page뿐 아니라 실제 decision points까지 닿아야 합니다.

모든 언어가 같은 수준으로 성숙했다고 말하지 않겠습니다. 그건 너무 쉽고 너무 자신만만한 말입니다. 그래서 screenshot package가 중요합니다. quality bar를 보이게 만들기 때문입니다.

제가 가져가는 교훈

AI product를 만들다 보면 model이 product라고 생각하기 쉽습니다.

가끔은 맞습니다. 하지만 대부분의 경우, 저는 workflow가 product라고 생각합니다.

model은 capability를 줍니다. workflow는 그 capability를 사람이 신뢰하고 사용할 수 있는 것으로 바꿉니다. user가 언제 control을 갖는지, system이 언제 다음 단계로 가도 되는지, output이 언제 inspectable해야 하는지, interface가 언제 attention을 그만 요구해야 하는지를 정합니다.

DIALØGUE on iOS에서는 이렇게 정리됐습니다.

  • 아이디어나 source material이 있을 때 Create
  • 시간과 credits를 audio에 쓰기 전에 Review
  • transcript와 offline support로 Listen
  • 매번 setup하지 않고 Series로 Repeat
  • marketing page가 아니라 실제 flow를 Localize

제가 여전히 틀렸을 수도 있습니다. 진짜 test는 screenshots가 예쁜지가 아닙니다. 누군가 episode를 만들고, 듣고, 다시 돌아와 다음 episode를 만드는지입니다.

지금 제가 신경 쓰는 기준은 그것입니다.

자주 묻는 질문

DIALØGUE iOS app에서 무엇이 바뀌었나요?

앱은 이제 Listen, Create, You 세 개의 main tabs를 사용합니다. synced transcript, offline downloads, Siri/Shortcuts, recurring shows를 위한 Series, 그리고 7개 app languages의 localized App Store screenshots도 포함합니다.

왜 workflow가 product라고 하나요?

유용한 것은 AI가 audio를 생성한다는 사실만이 아니기 때문입니다. topic 또는 PDF에서 시작해 outline, script, audio, context가 있는 listening, 그리고 recurring shows용 reusable setup까지 이어지는 전체 path가 가치입니다.

DIALØGUE가 NotebookLM보다 나은가요?

job에 따라 다릅니다. NotebookLM은 source-based audio overview에 유용하고 무료입니다. DIALØGUE는 language, outline review, script review, voices, final audio, transcript, offline access, Series까지 포함한 더 포괄적인 podcast workflow를 지향합니다.

DIALØGUE iOS 앱은 어떤 언어를 지원하나요?

일곱 개입니다. 영어, 베트남어, 일본어, 한국어, 스페인어, 중국어, 프랑스어. 아직 모든 언어가 같은 수준으로 성숙하지는 않았습니다 — 영어 사용량이 가장 많습니다 — 하지만 만들기, 검토, 듣기 같은 핵심 flow가 App Store listing뿐 아니라 본체까지 localize되어 있습니다.

DIALØGUE 팟캐스트를 오프라인으로 들을 수 있나요?

네. episode를 다운로드해 오프라인으로 들을 수 있어 출퇴근, 비행, 신호가 약한 곳에서 유용합니다. episode를 재생하는 동안 synced transcript로 텍스트를 따라가며 아무 줄이나 tap해 그 지점으로 이동할 수 있습니다.

오늘은 여기까지입니다.

AI product를 만든다면 궁금합니다. product는 정말 어디에 있을까요 — model, interface, 아니면 그 주변의 workflow?

감사합니다, Chandler