Zum Inhalt springen
Chandler Nguyen
KI6 Min. Lesezeit

KI

Die iOS-App war nicht das Produkt. Der Workflow war es.

Ich habe die iOS-App von DIALØGUE veröffentlicht und fast komplett neu gebaut. Das eigentliche Produkt war der Workflow — in sieben Sprachen.

Ich habe die iOS-App von DIALØGUE vor Monaten veröffentlicht. Dann habe ich fast alles neu gebaut.

Die erste Version war das Webprodukt, geschrumpft aufs Handy: Thema-Eingabe, PDF-Upload, Stimmenauswahl, Credits, Bibliothek, Einstellungen — alles, originalgetreu übertragen. Es funktionierte. Genau das war das Problem.

Ein Handy in der Hand ist kein kleinerer Desktop. Es ist ein anderer Moment. Um den Abstand zwischen diesen beiden Versionen geht es in diesem Beitrag.

Die Annahme darunter war simpel: DIALØGUE ist ein KI-Podcast-Generator, also besteht die Aufgabe der App darin, diesen Generator zu zeigen. Und mit dieser Annahme wird das Handy schnell zu einem kleinen Dashboard.

Aber niemand öffnet eine Podcast-App, weil er ein Dashboard verwalten möchte.

Menschen öffnen sie, weil sie eine Idee in Audio verwandeln wollen. Oder weil sie eine fertige Episode hören wollen. Oder weil sie eine wiederkehrende Show haben und nicht jedes Mal alles neu einrichten möchten. Also habe ich die App um den Workflow herum neu gebaut, nicht um eine Featureliste.

Die aktuelle iOS-Version ist im App Store verfügbar. Ich werde keine Installations-, Bewertungs- oder Retention-Zahlen erfinden. Was ich habe, ist eine Produktlektion: Bei vielen KI-Apps ist der Workflow das Produkt.

Erstellen ist mehr als ein Formular

Der Flow beginnt mit der einfachsten Frage: Worum soll es in diesem Podcast gehen?

Man kann mit einem Thema starten, mit einem PDF oder mit beidem. Ein Thema ist sinnvoll, wenn das System recherchieren und strukturieren soll. Ein PDF ist sinnvoll, wenn bereits vertrauenswürdiges Material vorliegt.

Dieser Screen ist nicht nur ein Eingabefeld. Er ist der erste Vertrauensmoment.

DIALØGUE iOS Erstellen-Screen mit Thema-Eingabe und PDF-Anhang
Der Erstellen-Flow in der iOS-App — der erste Vertrauensmoment, bevor das System das Quellmaterial berührt.

Auf dem Desktop kann man mehr Kontext zeigen. Auf dem Handy verlangt jeder zusätzliche Bereich Aufmerksamkeit. Die iOS-App musste entschiedener werden, nicht vollständiger.

Vertrauen entsteht in der Prüfung

Ich nannte DIALØGUE früher einen KI-Podcast-Generator. Das stimmt, ist aber unvollständig.

Wichtiger ist: prüfen, bevor Audio erzeugt wird.

Es gibt zwei Prüfpunkte. Zuerst das Outline: Man kann es genehmigen oder Feedback geben, bevor das komplette Skript geschrieben wird. Danach prüft man das Skript, bevor es zu Audio wird.

Das ist kein nettes UX-Detail. Es reduziert verschwendete Credits, verlorene Zeit und das Risiko, etwas zu veröffentlichen, das fast richtig klingt, aber eben nur fast.

DIALØGUE iOS Outline-Review-Screen mit Freigabe-Steuerung
Das Outline-Review-Gate — der Workflow muss vor dem Audio prüfbar sein.

Die Skriptprüfung ist derselbe Gedanke, nur näher am Punkt ohne Rückkehr. Hier sieht man Ton, Rhythmus der Hosts und fachliche Sicherheit.

DIALØGUE iOS Script-Review-Screen vor der Audio-Erstellung
Das Script-Review-Gate — Kontrolle vor Audio, nicht nur schnellere Generierung.

Für mich ist das der Unterschied zwischen "KI als Magie" und "KI als Produkt". Magie versteckt die Arbeit. Ein Produkt macht die wichtigen Entscheidungen überprüfbar.

Hören ist kein Nachgedanke

Auch hier lag ich falsch.

Eine Zeit lang behandelte ich das Hören als etwas, das nach dem Produkt passiert: Podcast erstellen, Audio generieren, in die Bibliothek legen. Fertig.

Aber wenn das Ergebnis Audio ist, ist Hören nicht das Ende. Es ist die Hälfte des Produkts.

Die App hat jetzt ein synchronisiertes Transkript. Während die Episode läuft, kann man den Text mitlesen und eine Zeile antippen, um direkt dorthin zu springen. Weil DIALØGUE das Skript erzeugt hat, kennt es die Struktur der Episode bereits. Das Transkript macht das Ergebnis navigierbarer und vertrauenswürdiger.

DIALØGUE iOS synchrones Transkript mit Tap-to-Seek-Karten
Das synchronisierte Transkript — Hören ist Teil des Workflows, keine Dekoration nach der Generierung.

Offline-Hören folgt derselben Logik. Wenn jemand einen Podcast für den Weg zur Arbeit, einen Spaziergang oder einen Flug erstellt, muss sich Audio wie echtes Audio verhalten.

DIALØGUE iOS Offline-Hören-Screen mit heruntergeladenem Episoden-Status
Offline-Hören — die App muss echte Hörsituationen respektieren.

Wiederholbarkeit ist nicht Automatisierung

DIALØGUE nutzte früher das Wort Studio für wiederkehrende Shows. Das klang gut, war aber zu schwer.

Studio klingt nach Kontrollraum, nach vielen Reglern, nach Management. Die klarere Idee ist Series.

Eine Series ist eine gespeicherte Konfiguration: Hosts, Ton, Format, Sprache und Quellenmuster. Damit lässt sich die nächste Episode erstellen, ohne alles neu aufzubauen.

DIALØGUE iOS Series-Screen zum Speichern eines wiederholbaren Podcast-Setups
Series — Wiederholbarkeit soll Setup-Arbeit reduzieren, nicht Review entfernen.

Die richtige Frage lautet nicht: Was kann ich hier noch verwalten? Sie lautet: Welche wiederholte Arbeit kann sicher verschwinden?

Lokalisierte Screenshots sind Produktbeweise

Die App unterstützt derzeit sieben Sprachen: Englisch, Vietnamesisch, Japanisch, Koreanisch, Spanisch, Chinesisch und Französisch.

Nur den App-Store-Text zu übersetzen wäre einfach gewesen. Aber ein mehrsprachiges Produkt wird nicht glaubwürdig, nur weil das Marketing übersetzt ist. Es wird glaubwürdiger, wenn der echte Flow in der Sprache des Nutzers natürlich wirkt. Das ist dieselbe Lektion, die ich beim Launch von DIALOGUE in mehreren Sprachen zum ersten Mal gelernt habe.

DIALØGUE iOS Voice-Preview-Screen mit Stimmenauswahl
Voice Preview — Lokalisierung muss die echten Entscheidungspunkte erreichen, nicht nur die Landingpage.

Ich behaupte nicht, dass alle Sprachen gleich ausgereift sind. Das wäre zu bequem und zu selbstsicher. Genau deshalb ist das Screenshot-Paket wichtig: Es macht die Qualitätslatte sichtbar.

Die Lektion

Wenn man KI-Produkte baut, ist es verlockend zu denken, das Modell sei das Produkt.

Manchmal stimmt das. Meistens glaube ich: Der Workflow ist das Produkt.

Das Modell liefert Fähigkeit. Der Workflow macht daraus etwas, dem ein Mensch vertrauen kann. Er entscheidet, wann der Nutzer Kontrolle bekommt, wann das System weitergehen darf, wann das Ergebnis überprüfbar sein muss und wann die Oberfläche aufhören sollte, Aufmerksamkeit zu verlangen.

Für DIALØGUE auf iOS heißt das:

  • Erstellen, wenn man eine Idee oder Quelle hat
  • Prüfen, bevor Zeit und Credits in Audio fließen
  • Hören mit Transkript und Offline-Unterstützung
  • Wiederholen mit Series statt jedes Mal neu einzurichten
  • Lokalisieren des echten Flows, nicht nur der Marketingseite

Ich kann immer noch falsch liegen. Der echte Test ist nicht, ob die Screenshots gut aussehen. Der echte Test ist, ob jemand eine Episode erstellt, sie anhört und zurückkommt, um die nächste zu erstellen.

Das ist die Messlatte, die mich jetzt interessiert.

Häufige Fragen

Was hat sich in der DIALØGUE iOS-App geändert?

Die App nutzt jetzt drei Haupttabs: Listen, Create und You. Dazu kommen synchronisierte Transkripte, Offline-Downloads, Siri/Shortcuts, Series für wiederkehrende Shows und lokalisierte App-Store-Screenshots in sieben App-Sprachen.

Warum ist der Workflow das Produkt?

Weil der Wert nicht nur darin liegt, dass KI Audio erzeugt. Der Wert liegt im gesamten Weg: Thema oder PDF, Outline, Skript, Audio, Hören mit Kontext und wiederverwendbare Einrichtung.

Ist DIALØGUE besser als NotebookLM?

Das hängt vom Job ab. NotebookLM ist nützlich und kostenlos für quellenbasierte Audio Overviews. DIALØGUE versucht, ein vollständigerer Podcast-Workflow zu sein: Sprache, Outline Review, Script Review, Stimmen, finales Audio, Transkript, Offline Access und Series.

Welche Sprachen unterstützt die DIALØGUE iOS-App?

Sieben: Englisch, Vietnamesisch, Japanisch, Koreanisch, Spanisch, Chinesisch und Französisch. Noch ist nicht jede Sprache gleich ausgereift — Englisch wird am meisten genutzt — aber die zentralen Flows zum Erstellen, Prüfen und Hören sind lokalisiert, nicht nur der App-Store-Eintrag.

Kann man DIALØGUE-Podcasts offline hören?

Ja. Episoden lassen sich für die Offline-Wiedergabe herunterladen — praktisch für Pendelwege, Flüge oder Orte mit schlechtem Empfang. Während eine Episode läuft, kann man mit dem synchronisierten Transkript mitlesen und jede Zeile antippen, um direkt dorthin zu springen.

Das war es von mir für heute.

Wenn du KI-Produkte baust, interessiert mich: Wo lebt das Produkt wirklich — im Modell, in der Oberfläche oder im Workflow darum herum?

Viele Grüße, Chandler