Skip to content
··6 min basahin

Magaling ang CrewAI! - Ang Aking Unang mga Impression

Pagkatapos ng 10 araw na pagbuo ng AI-generated podcasts gamit ang CrewAI, natutunan ko na bagama't napakadaling gamitin ng framework, ang kalidad na content ay nangangailangan pa rin ng tunay na pagsisikap ng tao.

Natuklasan ko ang CrewAI ilang linggo na ang nakalipas sa pamamagitan ng kursong "Practical Multi AI Agents and Advanced Use Cases with crewAI". Bagama't nag-aalangan akong subukan ito dahil gumagamit na ako ng Langgraph para sa aking agent na si Sydney, dalawang bagay ang pumukaw sa aking interes:

  1. Nag-eexplore ako ng mga paraan para gumawa ng podcasts mula sa simula, partikular na nakatuon sa kung paano gamitin ang Gen AI para "mag-reason" sa 15 taon kong blog content sa halip na kopyahin at i-paste lang ang mga posts. Sinubukan ko ang NotebookLLM para dito (na gumagana naman, maaari mong pakinggan ang podcast episode dito), pero gusto ko ng mas maraming kontrol sa conversation flow at opening hooks.
  2. Gusto kong matuto ng bagong bagay at mag-experiment sa text-to-speech models ng OpenAI.

Update Nob 2025: Nag-graduate na ako mula sa paggamit ng agent framework at nagsimulang mag-code mula sa simula gamit ang Claude Code at Google Gemini CLI. Nagbigay ito sa akin ng higit na kontrol. Ang pinakabagong launches ko ay STRATUM (market intelligence) at DIALOGUE (AI podcast generator) — na direktang nag-evolve mula sa CrewAI experiment na ito sa ibaba.

Pagkatapos ng mga 10 araw ng paglalaro sa CrewAI, narito ang aking mga pangunahing obserbasyon:

1. Ang magagandang bagay

1.1 Kamangha-manghang madaling magsimula

  • Ang learning curve ay napakaikli — nasa ilang oras lang ay tumatakbo na ako
  • Ang pag-set up ng custom tools (tulad ng pagkuha ng content mula sa aking blog gamit ang Weaviate bilang vector store) ay straightforward. Ang pag-convert ng iyong podcast script sa audio output ay madali ring i-set up.
  • Ang kakayahang ilarawan ang mga agents at kanilang mga gawain sa plain English gamit ang YAML files ay makapangyarihan (Pro tip: Sobrang nakakatulong ang autocomplete ng Visual Studio Code dito!)

1.2 Flexible na pagpili ng model

Ang pagpapalit ng iba't ibang LLMs ay kasing-simple ng pag-update ng iyong crew.py:

llm_openai_4o_mini = LLM(model="gpt-4o-mini", temperature=0)
llm_anthropic_35 = LLM(model="claude-3-5-sonnet-20240620", temperature=0)
llm_openai_4o = LLM(model="gpt-4o", temperature=0)
llm_gemini_15_pro = LLM(model="gemini/gemini-1.5-pro-002", temperature=0)

Maaari mong i-assign ang specific na models sa iba't ibang agents base sa kanilang mga kalakasan. Halimbawa,

@agent
	def content_researcher(self) -> Agent:
		return Agent(
			config=self.agents_config['content_researcher'],
			llm=llm_anthropic_35,
			tools=[BlogContentRetrievalTool()],
			verbose=True
		)

Lahat ng ito ay nangangahulugan ng malaking kontrol sa kung paano ko gustong ma-structure at ma-script ang aking podcast.

1.3 Text-to-Speech: Pangako at Limitasyon

Bagama't impressive sa kalidad ang text-to-speech API ng OpenAI, anim na voice models lang ang inaalok nito sa ngayon. Para sa paggawa ng podcast, medyo limitado ito — lalo na kapag sinusubukan mong lumikha ng mga engaging na usapan sa pagitan ng maraming hosts. Ang kakulangan ng variety sa boses ay nangangahulugan na maaaring magkaroon ka ng mga podcast na katulad ng tunog ng iba na gumagamit ng parehong teknolohiya. Ito ay tiyak na isang lugar kung saan umaasa akong makita ang pagpapabuti sa hinaharap, maging sa pamamagitan ng pagpapalawak ng OpenAI ng kanilang voice options o sa pamamagitan ng integration sa iba pang text-to-speech providers.

Naiintindihan ko rin ang AI safety concerns kaya maaaring hindi masyadong magmadali ang iba't ibang AI labs sa pagbibigay ng masyadong maraming voice models.

2. Ang Reality Check: Hindi Ito Basta "Click and Create"

Sa simula, nag-aalala ako na maaaring mag-ambag ito sa baha ng AI-generated content (o "AI Slop") na nakikita natin online. Pagkatapos ng lahat, maaari akong mag-generate ng 15-minutong podcast script sa loob ng mga 5 minuto. (Sa DeepLearning.AI training course sa itaas, dumaan si Joao sa isang code example ng "Content creation at scale".)

Gayunpaman, nagbago ang aking pananaw pagkatapos aktuwal na basahin/suriin ang unang ilang paunang scripts na na-generate.

Ang paglikha ng mataas na kalidad na content ay nangangailangan pa rin ng malaking trabaho!

2.1 Maingat na Agent Structure

Kailangan kong baguhin ang structure ng AI crew ng maraming beses, nagdadagdag ng karagdagang mga papel, lalo na ang papel ng isang "fact_checker". Ang kasalukuyang podcast crew ko ay kasama ang:

  • Content researcher
  • Script writer
  • Fact checker
  • Script editor
  • Audio producer

2.2 Patuloy na Pagpapino

Nangangailangan ang tagumpay ng:

  • Maingat na pag-define ng mga layunin at gawain ng bawat agent gamit ang industry-specific na wika. Isang taong may aktwal na karanasan sa industriya ng podcast ang maaaring gumamit ng industry specific na wika at makakapag-utos sa bawat agent na magsagawa ng napaka-specific na gawain. Magiging mas maganda ang output sa ganoong paraan.
  • Pagiging selective sa tool access (hindi palaging mas maganda ang mas marami). Madali para sa mga agents na maipit sa patuloy na mga loops.
  • Malinaw na delegation rules sa pagitan ng mga agents
  • Specific na output structure requirements
  • Maayos na pagkakadefine ng quality criteria ng "Ano ang hitsura ng magandang trabaho" (Isinama ko pa ang anak ko dito — siya ang creative! :D).

Kaya muli, gaya ng nakikita niyo, bagama't ang paggamit ng crew ng AI agents ay tumutulong na pabilisin ang aking trabaho nang malaki (hindi bababa sa 5X mula research hanggang scripting, fact check, revision, audio creation), nasa akin pa rin ang lumikha ng mataas na kalidad na content.

2.3 Mahalaga ang pagpili ng model

Ang iba't ibang LLM models ay may natatanging "mga personalidad" at magkakaibang antas ng pagsunod sa instructions. Kaya kailangan mong mag-experiment para maunawaan ang mga kalakasan at kahinaan ng iba't ibang models at kung paano nila angkop ang iyong pangangailangan sa bawat hakbang ng proseso.

Ilang obserbasyon:

  • Ang mga sagot ng API ay maaaring mag-iba mula sa mga sagot ng web chat interface para sa parehong model
  • Sa ngayon, mas gusto ko ang mga Anthropic models para sa long-form content gamit ang API. Gayunpaman, pagdating sa web version, sa tingin ko ay magkapareho ang claude-3-5-sonnet-20241022 at GPT-4o.
  • Ang o1-preview ng OpenAI ang go-to ko para sa coding tasks

2.4 Ang Feedback at Memory ay mga Game-Changers

Kailangan mong magbigay ng feedback sa iyong AI crew. Magaling sila sa pagsunod sa mga direksyon pero hindi nila alam kung ano ang gusto mo at hindi nila mababasa ang isip mo (hindi pa sa ngayon haha). Ang kakayahang i-train ang iyong crew sa pamamagitan ng feedback ay napakaimportante.

Sa CrewAI, medyo simple lang ang pag-train ng iyong crew at pagbibigay ng feedback, sa pamamagitan lang ng pagpapatakbo ng

crewai train -n <n_iterations> <filename> (optional)

Bagama't hindi ko pa lubos na na-explore ang memory functions ng CrewAI, ang kombinasyon ng feedback at memory ay mukhang napaka-powerful para sa paglikha ng consistent, mataas na kalidad na output.

3. Ipakita Mo ang mga Resulta!

Ok, ok - naririnig ko kayong nagsasabi na "Chandler, sapat nang nagsalita ka. Ipakita mo sa amin ang sample ng podcast script na na-generate ng iyong AI crew!"

Narito ang isang kumpletong workflow example:

  • Research Phase: Tingnan kung paano nag-analyze at nag-extract ng key information ang Content Researcher agent mula sa aking mga blog posts
  • Fact Check Summary: Ang detalyadong verification report ng Fact Checker
  • Initial Script Draft: Ang unang take ng Script Writer sa podcast conversation
  • Final Polished Script: Ang refined version ng Script Editor na may pinahusay na flow at engagement
  • Pakinggan ang Resulta: Ang final audio version na ginawa ng Audio Producer agent

Bawat link sa itaas ay nagpapakita ng progression mula sa raw content hanggang polished podcast, na nagde-demonstrate kung paano nag-aambag ang iba't ibang agents sa final product.

Bagama't may iniisip pa akong mga paraan kung paano mapapaganda pa ang buong pipeline, sana ang nasa itaas ay nagbigay sa inyo ng magandang ideya kung ano ang posible.

Mga huling saloobin

Na-impress ako sa CrewAI sa balanse nito ng simplicity at kapangyarihan. Bagama't ginagawa nitong mas accessible ang content creation, hindi ito magic button — ang kalidad ay nangangailangan pa rin ng kadalubhasaan, maingat na pagpaplano, at patuloy na pagpapino.

Nag-experiment ka na ba sa mga multi-agent frameworks tulad ng CrewAI o Langgraph? Gusto kong marinig kung ano ang binubuo niyo — huwag mag-atubiling mag-drop ng komento o makipag-ugnayan.

Maraming salamat,

Chandler

Update Ene 2026: Ang CrewAI experiment na ito ay kalaunan ay naging DIALOGUE — isang buong production app. Ang voice limitation na nabanggit ko sa itaas? Lumipat ako sa Gemini TTS, na nagbigay sa akin ng 30 voices sa 7 wika. Malaking upgrade mula sa 6 OpenAI voices! Kung curious ka, tingnan mo.

Ipagpatuloy ang Pagbasa

Ang Journey Ko
Kumonekta
Wika
Mga Preference