Tôi đã ship app iOS của DIALØGUE từ mấy tháng trước. Rồi tôi build lại gần như toàn bộ.
Phiên bản đầu tiên là sản phẩm web thu nhỏ cho vừa điện thoại: topic input, PDF upload, voice picker, credits, library, settings — tất cả, được port lại y nguyên. Nó chạy được. Và đó chính là vấn đề.
Một chiếc điện thoại trong tay ai đó không phải là desktop thu nhỏ. Đó là một thời điểm khác. Khoảng cách giữa hai phiên bản đó chính là điều tôi muốn viết trong bài này.
Giả định nằm dưới phiên bản đó rất đơn giản: DIALØGUE là một AI podcast generator, nên việc của app là phơi bày cái generator đó ra. Và nghĩ như vậy thì bạn rất dễ biến điện thoại thành một dashboard nhỏ xíu.
Nhưng không ai mở một app podcast vì họ muốn quản lý dashboard.
Họ mở app vì có một ý tưởng muốn biến thành audio. Hoặc vì có một tập đã hoàn tất và muốn nghe. Hoặc vì có một show lặp lại và không muốn cấu hình lại từ đầu. Vậy nên tôi phải rebuild app quanh workflow, không phải quanh danh sách tính năng.
Phiên bản iOS hiện tại đã live trên App Store. Tôi không có số install hay retention kịch tính để khoe. Điều tôi có là một bài học sản phẩm hữu ích hơn: với nhiều app AI, workflow mới là sản phẩm.
Create không chỉ là một form
Flow tạo podcast bắt đầu bằng câu hỏi đơn giản nhất: podcast này nói về gì?
Bạn có thể bắt đầu bằng một chủ đề, một PDF, hoặc cả hai. Chủ đề phù hợp khi bạn muốn hệ thống research và dựng cấu trúc. PDF phù hợp khi bạn đã có tài liệu nguồn đáng tin cậy và muốn biến nó thành nội dung nghe được.
Màn hình này không chỉ là input. Đây là trust moment đầu tiên.
Trên desktop, bạn có thể hiện nhiều ngữ cảnh hơn. Trên điện thoại, mỗi panel mới đều đòi thêm attention. Vì vậy iOS app cần có chính kiến hơn, không phải đầy đủ hơn.
Review là nơi sản phẩm tạo niềm tin
Tôi từng gọi DIALØGUE là AI podcast generator. Cụm đó đúng, nhưng thiếu.
Cụm quan trọng hơn là: review trước khi tạo audio.
Workflow có hai cổng review. Đầu tiên là outline: bạn duyệt hoặc gửi feedback trước khi hệ thống viết script đầy đủ. Sau đó là script review: bạn đọc lời thoại trước khi tạo audio.
Đây không chỉ là một chi tiết UX dễ thương. Đây là cách giảm phí credit lãng phí, giảm thời gian chờ sai hướng, và giảm khả năng xuất bản một thứ nghe "gần đúng nhưng chưa đúng".
Script review cũng quan trọng như vậy, nhưng gần điểm không thể quay lại hơn. Đây là lúc tone, nhịp hội thoại, và mức tự tin của nội dung hiện ra rõ nhất.
Tôi nghĩ đây là khác biệt giữa "AI như phép màu" và "AI như sản phẩm". Phép màu giấu công việc. Sản phẩm làm cho các quyết định quan trọng có thể kiểm tra được.
Nghe không phải là phần phụ
Tôi cũng từng sai ở điểm này.
Trong một thời gian, tôi xem listening là việc xảy ra sau khi sản phẩm đã xong. Tạo podcast, generate audio, bỏ vào library. Xong.
Nhưng nếu output là audio, listening không phải đoạn kết. Nó là một nửa sản phẩm.
iOS app hiện có transcript đồng bộ. Khi episode phát, bạn có thể đọc theo text và chạm vào một dòng để nhảy đến đoạn đó. Với DIALØGUE, đây không chỉ là một tính năng player. Vì hệ thống đã tạo script, nó hiểu cấu trúc của episode. Transcript là một cách làm output dễ dò, dễ review, và đáng tin hơn.
Offline listening cũng vậy. Nếu ai đó tạo podcast để nghe lúc đi bộ, đi làm, bay, hoặc ở nơi mạng yếu, audio phải cư xử như audio thật.
Repeatability khác automation
DIALØGUE từng dùng chữ Studio cho các show lặp lại. Nghe hay, nhưng hơi quá nặng.
Studio gợi một phòng điều khiển lớn, nhiều knob, nhiều thứ để quản lý. Thứ feature này cần thì đơn giản hơn: Series.
Series là một cấu hình đã lưu: host, tone, format, language, và pattern nguồn. Bạn tạo episode tiếp theo mà không phải dựng lại mọi thứ từ đầu.
Đây là chỗ workflow framing giúp tôi ra quyết định. Nếu gọi nó là dashboard, tôi sẽ muốn thêm management features. Nếu gọi nó là workflow, câu hỏi trở thành: việc lặp lại nào có thể biến mất một cách an toàn?
Screenshot localize là bằng chứng sản phẩm
App hiện hỗ trợ bảy ngôn ngữ: Anh, Việt, Nhật, Hàn, Tây Ban Nha, Trung, và Pháp.
Rất dễ chỉ dịch App Store listing rồi xem như xong. Nhưng sản phẩm đa ngôn ngữ không trở nên đáng tin chỉ vì marketing copy được dịch. Nó đáng tin hơn khi chính flow tạo, duyệt, nghe, và lặp lại trông tự nhiên trong ngôn ngữ của người dùng. Đây cũng là bài học tôi rút ra từ việc đưa DIALOGUE lên nhiều ngôn ngữ ngay từ lần đầu.
Tôi không nói mọi ngôn ngữ đều chín như nhau. Nói vậy thì quá dễ và quá tự tin. Nhưng chính vì thế screenshot package quan trọng: nó làm quality bar trở nên nhìn thấy được.
Bài học tôi mang theo
Khi build sản phẩm AI, rất dễ nghĩ model là sản phẩm.
Đôi khi đúng. Nhưng phần lớn thời gian, tôi nghĩ workflow mới là sản phẩm.
Model cho bạn capability. Workflow biến capability đó thành thứ con người có thể tin. Nó quyết định khi nào người dùng có quyền kiểm soát, khi nào hệ thống được đi tiếp, khi nào output phải được inspect, và khi nào interface nên ngừng đòi attention.
Với DIALØGUE trên iOS, điều đó có nghĩa là:
- Create khi bạn có ý tưởng hoặc tài liệu nguồn
- Review trước khi hệ thống dùng thời gian và credit để tạo audio
- Listen với transcript và offline support
- Repeat bằng Series thay vì setup lại từ đầu
- Localize flow thật, không chỉ trang marketing
Tôi có thể vẫn sai. Bài test thật không phải screenshot đẹp hay App Store copy đọc ổn. Bài test thật là liệu ai đó tạo một episode, nghe nó, rồi quay lại tạo episode tiếp theo.
Đó là bar tôi quan tâm bây giờ.
Câu hỏi thường gặp
DIALØGUE iOS thay đổi gì?
App giờ có cấu trúc ba tab: Listen, Create, và You. Bản này cũng thêm transcript đồng bộ, offline downloads, Siri/Shortcuts, Series cho show lặp lại, và screenshot App Store localize cho bảy ngôn ngữ app hỗ trợ.
Vì sao bài này nói workflow mới là sản phẩm?
Vì phần hữu ích không chỉ là AI tạo audio. Phần hữu ích là toàn bộ đường đi: bắt đầu từ topic hoặc PDF, duyệt outline, duyệt script, tạo audio, nghe có ngữ cảnh, và dùng lại setup khi show lặp lại.
DIALØGUE có tốt hơn NotebookLM không?
Tùy job. NotebookLM rất hữu ích cho audio overview miễn phí dựa trên nguồn. DIALØGUE đang cố trở thành một podcast workflow đầy đủ hơn: chọn language, duyệt outline, duyệt script, chọn voice, nghe transcript, offline access, và Series cho show lặp lại.
App iOS DIALØGUE hỗ trợ những ngôn ngữ nào?
Bảy ngôn ngữ: Anh, Việt, Nhật, Hàn, Tây Ban Nha, Trung, và Pháp. Chưa phải ngôn ngữ nào cũng chín như nhau — tiếng Anh có nhiều người dùng nhất — nhưng các flow chính tạo, duyệt, nghe đều được localize, không chỉ phần App Store listing.
Có nghe podcast DIALØGUE offline được không?
Được. Bạn có thể tải episode về để nghe offline, hữu ích khi đi làm, đi máy bay, hoặc ở nơi mạng yếu. Khi episode phát, transcript đồng bộ cho phép bạn đọc theo và chạm vào bất kỳ dòng nào để nhảy đến đúng đoạn đó.
Đó là hết từ tôi hôm nay.
Nếu bạn build sản phẩm AI, tôi rất tò mò: bạn nghĩ sản phẩm thật sự nằm ở model, interface, hay workflow quanh nó?
Thân mến, Chandler






