मैंने DIALØGUE का iOS app कुछ महीने पहले ship किया था। फिर मैंने उसका लगभग पूरा हिस्सा दोबारा बनाया।
पहला version web product ही था, बस phone में फ़िट होने के लिए छोटा किया हुआ: topic input, PDF upload, voice picker, credits, library, settings — सब कुछ, ज्यों का त्यों port किया हुआ। यह चलता था। यही तो दिक्कत थी।
किसी के हाथ में पकड़ा हुआ phone एक छोटा desktop नहीं होता। यह एक अलग moment होता है। इन्हीं दो versions के बीच का फ़र्क इस post का विषय है।
इसके पीछे की धारणा simple थी: DIALØGUE एक AI podcast generator है, तो app का काम बस उस generator को सामने लाना है। और इसी सोच के साथ phone जल्दी ही एक छोटा dashboard बन जाता है।
लेकिन कोई podcast app इसलिए नहीं खोलता कि उसे dashboard manage करना है।
वह खोलता है क्योंकि उसके पास idea है जिसे audio बनाना है। या एक finished episode है जिसे सुनना है। या repeatable show setup है जिसे हर बार फिर से configure नहीं करना। इसलिए मुझे app को features की list के around नहीं, workflow के around rebuild करना पड़ा।
Current iOS version App Store पर live है। मैं install, rating, या adoption numbers invent नहीं करूंगा। मेरे पास उससे ज़्यादा useful product lesson है: बहुत सारे AI apps में workflow ही product होता है।
Create सिर्फ form नहीं है
Flow सबसे simple question से शुरू होता है: यह podcast किस बारे में है?
आप topic से शुरू कर सकते हैं, PDF से, या दोनों से। Topic तब useful है जब system को research और structure करना है। PDF तब useful है जब आपके पास already trusted source material है।
यह screen सिर्फ input नहीं है। यह पहला trust moment है।
Desktop पर आप ज़्यादा context दिखा सकते हैं। Phone पर हर extra panel attention मांगता है। iOS app को ज़्यादा opinionated होना था, ज़्यादा complete नहीं।
Trust review में बनता है
मैं DIALØGUE को पहले AI podcast generator कहता था। यह सही है, लेकिन अधूरा।
ज़्यादा important phrase है: audio से पहले review.
Workflow में दो review gates हैं। पहले outline: आप approve कर सकते हैं या feedback दे सकते हैं, इससे पहले कि full script लिखी जाए। फिर script review: audio बनने से पहले आप actual words पढ़ सकते हैं।
यह सिर्फ nice UX detail नहीं है। यही wasted credits, wasted time, और "लगभग सही लेकिन ठीक नहीं" output publish करने के risk को कम करता है।
Script review भी उतना ही important है, बस point of no return के और पास। यहीं tone, host rhythm, और content confidence साफ दिखता है।
मेरे लिए यही "AI as magic" और "AI as product" का फर्क है। Magic काम छुपाता है। Product important decisions को inspectable बनाता है।
Listening afterthought नहीं है
इस हिस्से में भी मैं गलत था।
कुछ समय तक मैं listening को product के बाद आने वाली चीज़ मानता था। Podcast create किया, audio generate किया, library में डाल दिया। Done.
लेकिन अगर output audio है, तो listening ending नहीं है। Product का आधा हिस्सा है।
App में अब synced transcript है। Episode play होते समय आप text follow कर सकते हैं और किसी line पर tap करके वहीं jump कर सकते हैं। DIALØGUE ने script generate किया है, इसलिए वह episode structure already समझता है। Transcript add-on नहीं है; यह output को navigable और trustworthy बनाता है।
Offline listening भी इसी logic पर है। अगर कोई podcast walk, commute, flight, या weak signal वाली जगह के लिए बनाता है, तो audio को real audio की तरह behave करना चाहिए।
Repeatability automation नहीं है
DIALØGUE पहले recurring shows के लिए Studio शब्द इस्तेमाल करता था। सुनने में अच्छा था, लेकिन बहुत भारी।
Studio control room जैसा लगता है: बहुत सारे knobs, बहुत management. ज़्यादा clear idea है Series.
Series एक saved setup है: hosts, tone, format, language, source pattern. इससे आप next episode बना सकते हैं बिना हर चीज़ zero से set किए।
सही question यह नहीं है कि यहां और क्या manage किया जा सकता है। सही question है: कौन सा repeated work safely गायब हो सकता है?
Localized screenshots product evidence हैं
App अभी सात languages support करता है: English, Vietnamese, Japanese, Korean, Spanish, Chinese, और French.
सिर्फ App Store listing translate करना आसान था। लेकिन multilingual product सिर्फ translated marketing copy से trustworthy नहीं बनता। Trust तब बढ़ता है जब actual flow user की language में natural लगे। यही सीख मुझे पहली बार DIALOGUE को कई languages में ship करने से मिली थी।
मैं यह claim नहीं कर रहा कि हर language बराबर mature है। वह बहुत easy और बहुत overconfident होगा। लेकिन इसी वजह से screenshot package important है: quality bar visible हो जाता है।
Lesson
AI products build करते समय model को product मान लेना आसान है।
कभी-कभी वह सही है। लेकिन ज़्यादातर समय, मुझे लगता है product workflow है।
Model capability देता है। Workflow उस capability को ऐसी चीज़ बनाता है जिस पर इंसान भरोसा कर सके। वह तय करता है कब user के पास control होगा, कब system आगे बढ़ेगा, कब output inspectable होगा, और कब interface को attention मांगना बंद करना चाहिए।
DIALØGUE on iOS के लिए इसका मतलब:
- Create जब आपके पास idea या source material हो
- Review audio पर time और credits खर्च करने से पहले
- Listen transcript और offline support के साथ
- Repeat Series के साथ, setup फिर से नहीं
- Localize actual flow, सिर्फ marketing page नहीं
शायद मैं अभी भी गलत हूं। Real test screenshots नहीं हैं। Real test यह है कि कोई एक episode बनाए, उसे सुने, और फिर दूसरा बनाने वापस आए।
अब यही bar मेरे लिए मायने रखती है।
अक्सर पूछे जाने वाले सवाल
DIALØGUE iOS app में क्या बदला?
App में अब तीन main tabs हैं: Listen, Create, और You. इसमें synced transcript, offline downloads, Siri/Shortcuts, recurring shows के लिए Series, और सात app languages में localized App Store screenshots भी हैं।
Workflow को product क्यों कह रहा हूं?
क्योंकि useful part सिर्फ AI audio generation नहीं है। Useful part पूरा path है: topic या PDF, outline, script, audio, context के साथ listening, और recurring shows के लिए reusable setup.
क्या DIALØGUE NotebookLM से बेहतर है?
Job पर depend करता है। NotebookLM source-based audio overviews के लिए useful और free है। DIALØGUE एक fuller podcast workflow बनने की कोशिश कर रहा है: language, outline review, script review, voices, final audio, transcript, offline access, और Series.
DIALØGUE iOS app कौन-कौन सी languages support करता है?
सात: English, Vietnamese, Japanese, Korean, Spanish, Chinese, और French. हर language अभी एक जैसी mature नहीं है — English सबसे ज़्यादा इस्तेमाल होती है — लेकिन create, review, listen के core flows localized हैं, सिर्फ App Store listing नहीं।
क्या DIALØGUE podcasts offline सुने जा सकते हैं?
हां। आप episodes download करके offline सुन सकते हैं, जो commute, flight, या weak signal वाली जगहों पर काम आता है। Episode play होते समय synced transcript आपको text follow करने और किसी भी line पर tap करके वहीं jump करने देता है।
आज के लिए इतना ही।
अगर आप AI products build करते हैं, तो मैं curious हूं: product सच में कहां रहता है — model में, interface में, या उसके around बने workflow में?
शुभकामनाओं सहित, Chandler






