Skip to content
··5 min de leitura

Como Construí um Curso de 7 Módulos Sozinho Trabalhando Full-Time

Uma pessoa. Sete módulos. Três horas de vídeo. Quinze templates. Uma pipeline de slides customizada com 18 tipos de layout. Voice clone profissional. Tudo mantendo meu emprego como VP. É assim que o modelo operacional AI-first se parece quando você aplica em si mesmo.

Eu vivo dizendo que o modelo operacional AI-first permite que uma equipe pequena produza num nível que antes exigia uma equipe muito maior. Aí percebi que deveria provar isso.

Então aqui vai a história de como construí "AI-Native Media Operations: From Workflow to Operating Model" — um curso de 7 módulos, ~3 horas de vídeo com 15 templates, guias complementares, um PDF deep-dive de 50 páginas e recursos executivos — enquanto trabalhava full-time como VP.

Estou compartilhando isso não para impressionar ninguém, mas porque o processo de produção em si é um caso de estudo do modelo operacional que o curso ensina. E porque acho que as pessoas subestimam o que é possível com uma pessoa e as ferramentas de AI certas — ao mesmo tempo que superestimam o quão fácil é.


A Pipeline

A pipeline de produção do curso tem quatro fases. Cada uma é AI-augmented, e cada uma exigiu julgamento humano real em pontos específicos.

Fase 1: Conteúdo e Slides

Escrevi o conteúdo do curso em Markdown — um arquivo por módulo, com um formato específico: **On screen:** para o que a audiência vê, **Speaker notes:** para o roteiro de narração, e **Companion notes:** para o guia escrito que vai mais fundo que o vídeo consegue.

A renderização de slides usa uma pipeline customizada que construí: Markdown → 18 tipos diferentes de layout (title, flow-diagram, stat-callout, two-column, checklist, before-after, timeline, e mais) → HTML renderizado com um design system editorial e quente.

O que a AI fez: Rascunho de conteúdo inicial dos slides a partir dos meus outlines, sugerir tipos de layout, gerar CSS e código de renderização.

O que exigiu julgamento humano: Toda decisão de conteúdo. Quais frameworks incluir e quais cortar. Como sequenciar o argumento. O que é demais para um slide e pertence ao guia complementar. O design system em si — escolher warm light mode em vez do dark mode padrão, a paleta de cores, a combinação de fontes.

Fase 2: Voz

A narração usa ElevenLabs Professional Voice Clone — minha voz real, clonada de amostras que gravei. Não é uma voz genérica de AI. É a minha voz, gerada a partir dos speaker notes que escrevi.

A pipeline gera áudio com timestamps no nível de palavra, que a Fase 3 usa para sincronizar transições de slides com a narração. Slides com revelação progressiva (bullet lists, checklists, flow diagrams) avançam fragmento por fragmento, sincronizados com as palavras sendo faladas.

O que a AI fez: Toda a geração de áudio, extração de timestamps por palavra, detecção de silêncio como fallback.

O que exigiu julgamento humano: A escrita dos speaker notes. Todo roteiro de narração passou por múltiplas revisões — não porque a AI não conseguia gerar, mas porque "tecnicamente correto" e "soa como algo que eu realmente diria" são coisas diferentes. Também tive que ajustar configurações de voz: stability, similarity, style, speed. As primeiras tentativas soavam robóticas. Levou várias iterações para encontrar configurações que soassem naturais.

Fase 3: Montagem de Vídeo

Screenshots de cada slide renderizado + os segmentos de áudio correspondentes → montados em vídeos MP4 finais. O sistema de sincronização de fragmentos divide o áudio em fronteiras naturais de palavras para que revelações progressivas pareçam sincronizadas com a narração, não cortadas arbitrariamente.

O que a AI fez: A pipeline inteira de montagem — captura de screenshots, divisão de áudio em fronteiras de palavras, montagem ffmpeg, padding de silêncio.

O que exigiu julgamento humano: Revisar os vídeos finais. Identificar slides onde o timing dos fragmentos parecia errado. Encontrar transições que precisavam de suavização de narração. Cerca de 29 correções de transição em todos os 7 módulos só na última rodada.

Fase 4: Materiais

Quinze templates, um guia deep-dive de 50 páginas, guias complementares para cada módulo, recursos executivos (template de apresentação para diretoria, guia de delegação, planilha de ROI, briefs executivos).

O que a AI fez: Primeiros rascunhos da maioria dos templates, estrutura dos guias complementares, formatação.

O que exigiu julgamento humano: Todas as decisões de conteúdo. O template de Workflow Audit não é um output genérico de AI — foi desenhado a partir de 20 anos observando equipes auditarem seus fluxos de trabalho e errarem. A Planilha de ROI inclui dados reais de custo dos meus próprios produtos porque eu não queria inventar números. Todo template passou por múltiplas rodadas de revisão.


Quanto Realmente Custou (Tempo)

Não tenho uma contagem exata de horas porque trabalhei nisso em noites e fins de semana ao longo de vários meses, junto com minha função full-time de VP. Mas aqui vai a divisão aproximada:

  • Escrita e revisão de conteúdo: O que mais levou tempo. Semanas. O conteúdo do curso passou por múltiplos ciclos de revisão — revisores externos deram feedback que mudou significativamente a estrutura dos Módulos 6 e 7.
  • Desenvolvimento da pipeline de slides: O sistema de renderização, tipos de layout e design system levaram tempo para construir — mas são reutilizáveis para cursos futuros.
  • Geração de áudio: Rápido depois que as configurações de voz foram ajustadas. Uma ou duas horas por módulo para geração + verificação pontual.
  • Montagem de vídeo: Maioria automatizada. O gargalo era o tempo de revisão, não de geração.
  • Templates e materiais: Alguns dias para o conjunto completo.

Se eu tivesse contratado uma equipe de produção — designer, editor de vídeo, locutor, designer de templates — isso teria custado dezenas de milhares de dólares e levado meses de coordenação. Em vez disso, custou créditos de API e meu tempo.


A Divisão 60/40

Num post do mês passado, escrevi sobre o princípio 60/40: AI te leva uns 60% do caminho, e os 40% restantes são refinamento humano. Construir este curso confirmou.

A AI cuidou da produção — renderização, geração de áudio, montagem de vídeo, primeiros rascunhos. Esses são os 60%. O humano cuidou do julgamento — decisões de conteúdo, gosto no design, revisão de qualidade, revisão após revisão. Esses são os 40%.

Os 40% são onde vive todo o valor. Sem eles, seria um curso gerado por AI que é tecnicamente completo e experiencialmente vazio. Com eles, cada slide tem uma razão para existir, cada speaker note soa como algo que eu realmente diria numa reunião, e cada template é desenhado para alguém realmente usar na segunda-feira de manhã.


Por Que Estou Contando Isso

Porque o curso ensina um modelo operacional AI-first, e acho justo mostrar que pratico o que ensino.

Divulguei o método de produção no próprio curso — há um slide de transparência no Módulo 1 que diz exatamente como o curso foi feito. Voz é PVC. Slides são uma pipeline customizada. Guias co-escritos com Claude. Não estou escondendo nada disso.

Se uma pessoa consegue produzir um curso de 7 módulos trabalhando full-time como VP, sua equipe de 20 pode fazer dramaticamente mais do que vocês imaginam com o mesmo modelo operacional. As ferramentas são as mesmas. A alavancagem é maior.

Essa é a tese. Este curso é a prova.


O Que Faria Diferente

  • Comece com o design system, não o conteúdo. Eu desenhei o sistema de slides no meio da produção e tive que adaptar os módulos anteriores. Próxima vez: design system primeiro, depois escrever conteúdo que encaixe nele.
  • Revisão externa mais cedo. O feedback do revisor que reformulou os Módulos 6-7 chegou tarde no processo. Se tivesse recebido depois do Módulo 3, o curso inteiro estaria mais enxuto.
  • Speaker notes são mais difíceis que slides. Subestimei quanta revisão os roteiros de narração precisariam. "Escrever com clareza" e "escrever para entrega falada" são habilidades diferentes.

É isso. Se você está pensando em construir um curso, um produto de conhecimento, ou qualquer projeto pesado em conteúdo — as ferramentas estão aí. O modelo operacional funciona. Só reserve budget para os 40%.

Cheers, Chandler

Continuar Lendo

ProdutosMinha Jornada
Conectar
Idioma
Preferências