Skip to content
··5 menit baca

Cara Saya Membuat Kursus 7 Modul Sendirian Sambil Bekerja Full-Time

Satu orang. Tujuh modul. Tiga jam video. Lima belas template. Pipeline slide custom dengan 18 tipe layout. Professional voice clone. Semua sambil tetap bekerja sebagai VP. Ini yang terlihat ketika model operasional AI-first diterapkan pada diri sendiri.

Saya terus bilang ke orang-orang bahwa model operasional AI-first memungkinkan tim kecil berproduksi di level yang dulu butuh tim jauh lebih besar. Lalu saya sadar, mungkin saya harus membuktikannya.

Jadi ini cerita bagaimana saya membuat "AI-Native Media Operations: From Workflow to Operating Model" — kursus 7 modul, ~3 jam video dengan 15 template, panduan pendamping, PDF deep-dive 50 halaman, dan resources eksekutif — sambil bekerja full-time sebagai VP.

Saya membagikan ini bukan untuk memamerkan, tapi karena proses produksinya sendiri adalah studi kasus dari model operasional yang diajarkan kursus ini. Dan karena saya rasa orang-orang meremehkan apa yang bisa dilakukan satu orang dengan AI tools yang tepat — sekaligus melebih-lebihkan betapa mudahnya.


Pipeline-nya

Pipeline produksi kursus ini punya empat fase. Masing-masing dibantu AI, dan masing-masing membutuhkan human judgment di titik-titik tertentu.

Fase 1: Konten & Slide

Saya menulis konten kursus dalam Markdown — satu file per modul, dengan format tertentu: **On screen:** untuk apa yang dilihat audience, **Speaker notes:** untuk skrip narasi, dan **Companion notes:** untuk panduan tertulis yang lebih dalam dari apa yang bisa disampaikan video.

Rendering slide menggunakan pipeline custom yang saya bangun: Markdown → 18 tipe layout berbeda (title, flow-diagram, stat-callout, two-column, checklist, before-after, timeline, dan lainnya) → HTML yang di-render dengan design system editorial yang hangat.

Yang ditangani AI: Drafting konten slide awal dari outline saya, menyarankan tipe layout, menghasilkan CSS dan kode rendering.

Yang butuh human judgment: Setiap keputusan konten. Framework mana yang dimasukkan dan mana yang dipotong. Bagaimana mengurutkan argumen. Apa yang terlalu banyak untuk satu slide dan sebaiknya masuk panduan pendamping. Design system itu sendiri — memilih warm light mode di atas dark-mode default, palet warna, pasangan font.

Fase 2: Suara

Narasi menggunakan ElevenLabs Professional Voice Clone — suara asli saya, di-clone dari sampel yang saya rekam. Ini bukan suara AI generik. Ini suara saya, dihasilkan dari speaker notes yang saya tulis.

Pipeline-nya menghasilkan audio dengan word-level timestamps, yang dipakai Fase 3 untuk menyinkronkan transisi slide dengan narasi. Slide dengan progressive reveals (bullet lists, checklists, flow diagrams) maju fragment demi fragment, diselaraskan dengan kata-kata yang sedang diucapkan.

Yang ditangani AI: Semua audio generation, word-level timestamp extraction, silence detection sebagai fallback.

Yang butuh human judgment: Penulisan speaker notes. Setiap skrip narasi melewati beberapa kali revisi — bukan karena AI tidak bisa membuatnya, tapi karena "secara teknis benar" dan "terdengar seperti sesuatu yang benar-benar akan saya ucapkan" itu beda. Saya juga harus men-tune voice settings: stability, similarity, style, speed. Percobaan pertama terdengar robotik. Butuh beberapa iterasi untuk menemukan setting yang terdengar natural.

Fase 3: Video Assembly

Screenshot dari setiap slide yang di-render + segmen audio yang sesuai → dirakit menjadi video MP4 final. Sistem fragment sync memisahkan audio di word boundaries yang natural supaya progressive reveals terasa selaras dengan narasi, bukan dipotong sembarangan.

Yang ditangani AI: Seluruh pipeline assembly — screenshot capture, audio splitting di word boundaries, ffmpeg assembly, silence padding.

Yang butuh human judgment: Review video final. Menangkap slide di mana timing fragment terasa salah. Mengidentifikasi transisi yang butuh voiceover smoothing. Sekitar 29 perbaikan transisi di semua 7 modul dalam putaran terakhir saja.

Fase 4: Material

Lima belas template, panduan deep-dive 50 halaman, panduan pendamping untuk setiap modul, executive resources (template presentasi board, panduan delegasi, ROI worksheet, executive briefs).

Yang ditangani AI: Draft pertama sebagian besar template, struktur panduan pendamping, formatting.

Yang butuh human judgment: Semua keputusan konten. Template Workflow Audit bukan output AI generik — dirancang dari 20 tahun menyaksikan tim mengaudit workflow mereka dan keliru. ROI Worksheet menyertakan data biaya nyata dari produk saya sendiri karena saya tidak mau mengarang angka. Setiap template melewati beberapa kali revisi.


Berapa Biayanya Sebenarnya (Waktu)

Saya tidak punya hitungan jam yang pasti karena saya mengerjakannya di malam hari dan akhir pekan selama beberapa bulan, bersamaan dengan peran VP full-time saya. Tapi ini perkiraan kasarnya:

  • Penulisan dan revisi konten: Paling banyak waktunya. Berminggu-minggu. Konten kursus melewati beberapa siklus review — reviewer eksternal memberikan feedback yang mengubah struktur Modul 6 dan 7 secara signifikan.
  • Pengembangan pipeline slide: Sistem rendering, tipe layout, dan design system butuh waktu untuk dibangun — tapi reusable untuk kursus-kursus mendatang.
  • Audio generation: Cepat begitu voice settings sudah di-tune. Satu-dua jam per modul untuk generation + spot-checking.
  • Video assembly: Sebagian besar otomatis. Waktu review yang menjadi bottleneck, bukan waktu generation.
  • Template dan material: Beberapa hari untuk set lengkap.

Kalau saya menyewa tim produksi — desainer, editor video, voice talent, desainer template — ini akan menghabiskan puluhan ribu dolar dan butuh berbulan-bulan koordinasi. Sebaliknya, biayanya hanya kredit API dan waktu saya.


Pembagian 60/40

Di blog post bulan lalu, saya menulis tentang prinsip 60/40: AI membawa Anda sekitar 60% jalan, dan 40% sisanya adalah penyempurnaan manusia. Membangun kursus ini mengonfirmasinya.

AI menangani produksi — rendering, audio generation, video assembly, draft pertama. Itu 60%-nya. Manusia menangani judgment — keputusan konten, taste desain, quality review, revisi demi revisi. Itu 40%-nya.

40% itu tempat semua value berada. Tanpanya, ini akan menjadi kursus buatan AI yang secara teknis lengkap tapi kosong secara pengalaman. Dengannya, setiap slide punya alasan untuk ada, setiap speaker note terdengar seperti sesuatu yang benar-benar akan saya ucapkan di meeting, dan setiap template dirancang untuk benar-benar bisa dipakai seseorang Senin pagi.


Kenapa Saya Menceritakan Ini

Karena kursus ini mengajarkan model operasional AI-first, dan saya rasa wajar untuk menunjukkan bahwa saya mempraktikkan apa yang saya ajarkan.

Saya mengungkapkan metode produksi di dalam kursus itu sendiri — ada slide transparansi di Modul 1 yang menjelaskan persis bagaimana kursus ini dibuat. Suara adalah PVC. Slide dibuat dengan pipeline custom. Panduan pendamping ditulis bersama Claude. Saya tidak menyembunyikan apapun.

Kalau satu orang bisa memproduksi kursus 7 modul sambil bekerja full-time sebagai VP, tim Anda yang 20 orang bisa melakukan jauh lebih banyak dari yang Anda kira dengan model operasional yang sama. Tools-nya sama. Leverage-nya lebih besar.

Itulah tesisnya. Kursus ini buktinya.


Apa yang Akan Saya Lakukan Berbeda

  • Mulai dari design system, bukan konten. Saya mendesain sistem slide di tengah produksi dan harus me-retrofit modul-modul sebelumnya. Lain kali: design system dulu, baru tulis konten yang sesuai.
  • Review eksternal lebih awal. Feedback reviewer yang mengubah bentuk Modul 6-7 datang terlambat. Kalau saya dapat feedback itu setelah Modul 3, keseluruhan kursus akan lebih tight.
  • Speaker notes lebih sulit dari slide. Saya meremehkan berapa banyak revisi yang dibutuhkan skrip narasi. "Menulis dengan jelas" dan "menulis untuk diucapkan" adalah skill yang berbeda.

Itu saja dari saya. Kalau Anda sedang berpikir untuk membuat kursus, knowledge product, atau proyek konten apa pun — tools-nya sudah ada. Model operasionalnya bekerja. Tinggal anggarkan untuk yang 40%.

Cheers, Chandler

Lanjutkan Membaca

ProdukPerjalanan Saya
Terhubung
Bahasa
Preferensi