Ginagamit ko na ang Claude Code para sa lahat ng iba pa, maliban sa coding
Labinsiyam na araw matapos kong kanselahin ang Claude Max, settled na ang pattern ko. Ang Codex na may GPT-5.4 sa xHigh ang kumuha ng coding seat. Ang Claude Code na may Opus 4.7 sa xHigh ang kumuha ng lahat ng ibang upuan sa desk ko.
Noong April 3, 2026, sinabi ko na babalik ako pagkalipas ng 30 araw para sabihin ang totoo tungkol sa nangyari matapos kong kanselahin ang Claude Max.
Labing-isang araw akong maaga.
Hindi dahil impatient ako. Dahil settled na ang pattern, at kung hihintayin ko pa hanggang May 2, para na lang iyong palabas.
Mali ang tunog ng punchline sa unang dinig. Ang tool na tinatawag na Claude Code ay siya na ngayong tool na ginagamit ko sa halos lahat maliban sa code.
Ito ang short version:
- Ang Codex na may GPT-5.4 sa xHigh thinking ang kumuha ng coding seat.
- Ang Claude Code na may Opus 4.7 sa xHigh ang kumuha ng lahat ng ibang upuan sa desk ko.
- Nabasag agad ang kuwentong "murang Codex" nang dumating ang tunay na limits.
Kung gusto mo ng pinakamalinis na thesis, marahil ito iyon:
Codex-GPT-5.4 sa xHigh para sa lahat ng coding-related. Claude Code na may Opus 4.7 sa xHigh para sa lahat ng iba pa.
Mas matalas iyang hati kaysa sa inaasahan ko labinsiyam na araw ang nakalipas.
Mas mahal din ito, at mas revealing sa psychology ng workflow ko, kaysa sa inaasahan ko.
Ang unang nabasag ay hindi ang quality ng code
Noong sinulat ko ang cancellation post, nakakaakit ang simpleng kuwento:
- Claude Max: $200/buwan
- Codex / ChatGPT: $20-25/buwan
- mabilis na lumiit ang gap sa execution quality
- mas maaasahan ang dating ng OpenAI
Mukha iyong madaling downgrade.
Hindi pala.
Ang unang nabasag ay hindi architecture, hindi plan quality, hindi execution discipline.
Ang unang nabasag ay ang kuwento ng limits.
Ganito mas mukhang totoo ang timeline ko:
- Apr 6: Nag-sign up ako sa dalawang ChatGPT Business seats na tig-$25/buwan, monthly billing.
- Apr 6: Nasa workaround mindset na agad ako. Para mapanatili ang halos parehong coding pace, hinala ko kailangan ko ng mga tatlong Codex-capable accounts.
- Apr 10: Pagkatapos ng ilang araw na sinubukan kong mabuhay sa setup na iyon, sapat na ang ebidensiya ko para sabihin ito nang direkta: kahit tatlong murang account, hindi pa rin nababalik ang ibinigay ng Claude Max sa pinakamagandang anyo nito.
- Apr 12: Bumili ako ng ChatGPT Pro sa halagang $100/buwan dahil habang mas ginagamit ko ang Codex para sa pure coding work, mas gusto ko ng mas maraming GPT-5.4 sa high at xHigh reasoning, hindi mas kaunti.
Iyan ang unang tapat na correction sa post noong April 3.
Hindi ito ang klaseng kapalit na "$200 Claude Max ay naging $20 Codex."
Mas malapit ito sa:
- "Hindi ko na kailangan ang eksaktong Anthropic plan na kailangan ko noon."
- "Kailangan ko pa rin ng mas maraming Codex capacity kaysa sa ibinibigay ng murang tier."
- "Ang totoong comparison ay workflow quality sa ilalim ng totoong limits, hindi benchmark screenshots."
Sa basa ko ngayon, malamang na agresibo ang OpenAI sa limits dahil gusto nitong kumuha ng market share. Inference iyon, hindi insider knowledge. Kung tama iyon, baka hindi manatiling bukas nang matagal ang window na ito.
Kaya kung ibinabatay mo ang buong desisyon mo sa economics ng $20 ngayon, dapat aminin man lang na maaaring tactical ang pricing environment na ito, hindi stable.
Nakuha ng Codex ang coding seat
Ang pinakamalaking natutunan ko ay ang GPT-5.4 sa xHigh thinking ay parang coding specialist.
Hindi charismatic.
Hindi warm.
At hindi rin parang gustong maging kaibigan mo.
Pero specialist.
May bare, no-nonsense na dating ang Codex na mas nagustuhan ko kaysa sa inaasahan ko. Para itong katrabahong engineer na maingat, methodical, at hindi nagpe-perform ng personality sa harap mo.
Mas mahalaga pala iyon kaysa sa inaasahan ko sa mahabang workdays.
Ang pinakaklarong sandali para sa akin ay April 17. Binigyan ko ang Codex-GPT-5.4 sa xHigh ng isang agreed plan at hinayaan ko itong magtrabaho. Tuloy-tuloy itong tumakbo nang tatlumpu hanggang apatnapu't limang minuto sa iisang session, mahigpit na sinusunod ang plano, sumusulat at nagpapatakbo ng unit tests, integration tests, at browser tests sa local, nang hindi ko kailangang bantayan bawat galaw nito.
Wala pa akong ibang tool na gumawa niyan para sa akin nang ganoon ka-consistent.
Binago niyan ang tingin ko sa Codex. Hindi na lang ito "good enough sa maliliit na task." Kaya nitong mag-deliver ng mahaba at disiplinadong execution kapag malinaw ang plan.
Para sa pure coding work, halos Codex na ang gamit ko palagi:
- architecture
- implementation
- debugging
- eval design
- test framing
- pipeline cleanup
- production-minded product logic
Ang pinakamagandang April example ay ang Prova.
Hindi glamorous ang karamihan sa kapaki-pakinabang na trabaho sa Prova. Hindi ito "tingnan mo kung gaano katalino ang model." Ito ay:
- pag-evaluate ng composable sprints
- paghihigpit ng onboarding logic
- paghahanap ng contradictions sa pagitan ng roadmap generation at assigned sprint state
- pag-improve ng produkto batay sa real user rows at totoong production behavior
At lumalabas na bagay na bagay iyon sa Codex.
Competent, thorough, at surprisingly sharp ito kapag ang trabaho ay:
- tukuyin ang contradiction
- ihiwalay ang logic bug
- paghiwalayin ang correctness at RFC territory
- irekomenda ang pinakamaliit na susunod na hakbang na kayang ipagtanggol
Isa sa pinakamalinaw na halimbawa ay galing sa isang production row ng Prova para sa user na may builder intent.
Nagawa ng system ang mga ito:
- nilagyan ang isang builder-intent user ng label na
marketing_vp - nag-assign ng
table-stakes-diagnostic - gumawa ng roadmap na mas huli nagsisimula sa journey
- nagpakita agad ng Context Check card pagkatapos ng onboarding
Ang nagpahalaga sa episode na iyon ay hindi lang diagnosis, kundi ang cross-review loop.
Nadala ako ng Opus 4.7 sa unang tatlong issue:
- isang track-calculation bug
- isang timing bug
- isang builder-opener / RFC question
Pagkatapos, itinulak pa ng GPT-5.4 ang analysis at nahuli nito ang contradiction na na-miss ng Opus:
- magkaibang katotohanan na ang sinasabi ng assigned first sprint at generated roadmap sa iisang user
Mahalaga iyon. Binago nito ang usapan mula sa "i-ship ba natin ngayon ang Builder RFC?" tungo sa "ayusin muna ang live contradiction, saka balikan ang RFC."
Hindi ito naramdaman na modelong gustong magpasikat. Para itong senior SWE na nagsasabing: ayusin muna ang kasalukuyang contradiction, saka tayo mag-usap tungkol sa product theory.
Naulit iyon nang sapat na beses ngayong buwan para hindi ko na isipin ang Codex bilang "mas murang alternative." Iniisip ko na ito bilang pangunahing coding instrument ko.
Nakuha ng Claude Code ang lahat ng ibang upuan
Kung doon nagtapos ang kuwento, simple sana ang sagot: lumipat sa Codex at tuloy lang.
Pero hindi iyon ang nangyari.
Mas magaling pa rin ang Claude Code na may Opus 4.7 para sa trabaho kung saan nakaasa sa taste ang output, o kung mahaba, iterative, at context-heavy ang loop.
Dito humihinto ang title ng post na ito na maging kontradiktoryo at nagiging eksakto. Ang Claude Code, na dating instinctive kong hinihila kapag oras na para mag-code, ay siya na ngayong tool na ginagamit ko kapag oras nang gawin ang kahit ano bukod sa pagsusulat ng code.
Sa "lahat ng iba pa," ang ibig kong sabihin ay:
- writing na kailangang tunog ako
- pag-iterate sa structure at rhythm
- naming at positioning
- taglines at brand phrasing
- image prompts para sa cover art ng blog post
- logo at identity exploration
- mas malalakas na
/frontend-designpass kapag visual judgment ang kailangan, hindi lang functional UI - mahahabang research thread kung saan bumubuo ako ng point of view sa loob ng ilang session
Sa experience ko nitong nakaraang labinsiyam na araw, paulit-ulit itong napatunayan.
Pinakakita ang gap kapag may feedback loop.
Kayang basahin ng Claude at Codex ang historical posts, silipin ang mga lumang prompt, at gamitin ang existing work bilang reference. Pero kapag maraming rounds ng refinement ang ginagawa ko, na may feedback pagkatapos ng bawat attempt, si Claude pa rin ang mas reliable sa pag-intindi sa direksiyong gusto ko.
Totoo iyan sa writing.
Totoo rin iyan sa image prompting.
Totoo rin iyan sa naming.
Ang pinakaklarong product example ay ang Prova. Hindi ko nakuha ang pangalang iyon gamit ang Codex. Kailangan ko ang Opus para sa ganoong klase ng trabaho. Totoo rin iyan sa maraming brand-language exploration. Nagbibigay sa akin ang GPT-5.4 ng solid at competent na sagot. Ang Opus ang nagbigay ng mas malawak at mas malakas na creative range.
Lumilitaw din ang parehong pattern sa site design.
Mas gumagana pa rin para sa akin ang /frontend-design workflow sa ilalim ng Superpowers kapag Opus ang gamit kaysa GPT-5.4 kapag design-led ang trabaho kaysa engineering-led. Binibigyan ako ng Codex ng functional na output. Si Claude naman ay mas madalas nagbibigay ng bagay na gusto ko talagang i-ship nang may pride.
Kaya kung ang tanong ay:
"Pinalitan ba ng Codex ang Claude para sa lahat?"
Hindi.
Pinalitan nito ang Claude sa coding seat. Hindi nito pinalitan para sa lahat ng iba pa.
Mahalaga ang distinction na iyon.
Totoo ang familiarity, at totoo rin ang withdrawal
Mga 13 buwan ko nang ginagamit ang Claude Code.
Binabago ng ganoong kahabang panahon hindi lang ang preference list mo kundi pati ang body language mo sa trabaho.
Nang mas agresibo akong lumipat sa Codex, talagang may naramdaman akong parang withdrawal effect.
Hindi dahil pangit ang Codex.
Kundi dahil iba ito.
Maliit ang friction points, pero paulit-ulit:
- ilang permission confirmations
- ang pakiramdam na minsan ay may isa pa itong tanong na hindi kailangan
- sterile na tono ng mga sagot
- kakulangan ng pamilyar na Claude "voice" sa loop
Hindi iyan mga objective defect.
Workflow differences iyan.
At binabago ng familiarity ang paraan ng pagdama mo sa mga iyon.
Ayokong magpanggap na dinaanan ko ang transition na ito bilang isang purong rational economist.
Hindi.
Sa isang punto nahuli ko ang sarili kong ipinapadaan ang trabaho sa Claude bilang extra safety-net review pass, hindi dahil kailangan ko ang second opinion, kundi dahil mas malakas ang hatak kaysa sa sarili kong naratibong "malinis akong nagse-switch."
Ang itinuro nito sa akin ay hindi lang sa raw capability ng Claude nakatali ang totoong dependency. Nakatali rin ito sa pakiramdam ng safety na galing sa pagkakaroon ng isa pang intelligent system sa loop na iba ang klase ng tiwalang ibinibigay ko.
Iyon din ang dahilan kung bakit hindi kailanman magiging "pumili ka ng isa habambuhay" ang final answer ko.
Mahalaga rin ang psychology ng workflow.
May sarili ring failure modes ang Codex
Hindi ito isang mahabang serye ng Codex victories.
May mga totoong isyu rin akong tinamaan.
Ang unang mukhang talagang Codex-specific na problema ay nangyari noong April 14. Sa dalawang terminal session, tumama ako sa error na ito:
{
"error": {
"message": "Unknown parameter: 'prompt_cache_retention'.",
"type": "invalid_request_error",
"param": "prompt_cache_retention",
"code": "unknown_parameter"
}
}
Mahalaga ang ganitong bagay dahil sinisira nito ang tiwala sa harness layer, hindi sa reasoning layer.
Napansin ko rin na mas istrikto ang Codex sa kung ano ang pinapayagang gawin ng model sa palibot ng deploy o paghawak sa production, kahit na may approvals nang naibigay kanina pa sa parehong session.
Minsan magandang bagay iyon.
Minsan nakakairita.
Pero malinaw na bahagi iyon ng tunay na user experience.
Isang maliit na bagay na genuinely mas gusto ko sa Codex side: ang pag-check ng status at limits nang hindi naaantala ang pangunahing daloy. Ang kakayahang magpatakbo ng /status nang hindi naghihintay na matapos ang kasalukuyang trabaho ay maliit na bagay lang, pero sa loob ng labinsiyam na araw, naiipon ang mga maliliit na ergonomics na ganoon.
Iyan ang ibig kong sabihin kapag sinasabi kong hindi lang sila magkaiba sa output quality. Magkaiba rin sila sa pakiramdam ng harness.
Mahalaga pa rin ang reliability, at hindi nakatulong ang Abril sa kaso ni Claude
Isa sa mga dahilan kung bakit komportable akong mag-switch sa simula pa lang ay reliability.
Naisulat ko na ang tungkol sa 90-day status gap sa pagitan ng Anthropic at OpenAI sa follow-up noong March 31. Mahalaga pa rin ang malaking larawan:


At pagkatapos ay nagdagdag ang Abril ng isa pang paalala mula sa totoong mundo.
Noong April 15, nagkaroon ulit ng elevated errors ang Claude sa Claude.ai, API, at Claude Code. Apektado ang login. Naunang nakabawi ang API. Nakapagtrabaho pa rin ang mga user ng Claude Code na naka-login na, pero sira muna nang sandali ang login mismo.
Hindi nito binubura ang lakas ni Claude.
Pinapalakas lang nito ang praktikal na kaso na huwag isugal ang buong workflow mo sa iisang vendor.
Isa pa rin ito sa pinakamatitibay na aral mula sa buong experiment:
Ang dual-wielding ay hindi lang luho. Operational resilience ito.
Kapag may masamang hapon ang isang provider, tuloy ka pa ring mag-ship.
Pinalinaw ng Opus 4.7 ang pattern, hindi binaligtad
Lumabas ang Claude Opus 4.7 noong April 16. Hindi magiging patas ang mag-publish ng anumang honest verdict nang hindi ko ito seryosong sinubukan.
Kaya halos agad ko itong itinapat sa isang totoong coding diagnostic sa Prova.
Nagbigay ang Opus 4.7 ng solid first pass. Natukoy nito ang track bug, ang mistimed Context Check card, at ang mas malawak na Builder-opener question.
Pagkatapos ay pinatakbo ko ang diagnosis na iyon sa GPT-5.4 bilang critique pass, hindi bilang blind second opinion, kundi bilang reviewer na tumitingin sa nakasulat na analysis ni Opus. Nahuli ng GPT-5.4 ang mas matalim na contradiction na na-miss ni Opus: nag-a-assign na ang produkto ng isang first sprint habang gumagawa rin ng roadmap na nagsisimula sa ibang lugar. Hindi iyon simpleng Builder-fit issue lang. Isa iyong live correctness problem.
Pagkatapos ay ibinalik ko ang revised diagnosis sa Opus at nag-converge ito.
Pero dumating ang sorpresa mula sa kabilang direksiyon.
Noong April 19, may napansin akong hindi ko inaasahan: para sa mas simpleng tasks — isang maikling code review pass, isang focused execution para sa maliit na change — kapansin-pansing mas mabagal ang Opus 4.7 sa xHigh kaysa sa Codex-GPT-5.4 sa xHigh. Kabaligtaran ang inaasahan ko.
Ibinangon muli ng detalyeng iyon ang pattern ko.
Kung saan malinaw na panalo pa rin si Opus para sa akin ay sa taste-heavy, iterative, at long-context na trabaho na inilarawan ko sa itaas. Kung saan malinaw na panalo si Codex ay sa deep coding diagnosis at pati sa fast, everyday coding turns na dati kong iniaabot agad kay Claude.
Kaya ang tapat na bersyon ay ito:
- nakakabigay pa rin ang Opus 4.7 ng magandang first pass sa mas malalim na coding analysis
- sa mas magaang coding turns, mas mabagal ito ngayon kaysa GPT-5.4 sa parehong thinking level
- kapag pinagsama sa continuous-execution experience noong April 17, lalo nitong itinulak ang coding seat papunta sa Codex, hindi papunta sa tie
Saan talaga ako napunta
Kung aalisin ang drama, pricing screenshots, outage screenshots, at social-post framing, hanggang April 22 settled na nang ganito ang working pattern ko:
Para sa anumang coding-related
Una kong inaabot ang Codex na may GPT-5.4 sa xHigh thinking.
Bakit:
- specialized ang dating nito
- methodical ito
- maingat ito
- mahusay ito sa architecture at execution
- kaya nitong patakbuhin ang isang buong agreed plan na may unit, integration, at browser tests sa loob ng tatlumpu hanggang apatnapu't limang minuto
- sa everyday coding turns, mas mabilis ito ngayon kaysa sa Opus 4.7 sa xHigh
- mas madali ko na itong pagkatiwalaan sa deep coding work
Para sa lahat ng iba pa
Una kong inaabot ang Claude Code na may Opus 4.7 sa xHigh thinking.
Sakop na nito ngayon ang:
- writing na kailangang tunog ako
- image prompts para sa cover art
- naming, positioning, at brand language
/frontend-designpasses na kailangan ng visual judgment- mahabang research threads kung saan bumubuo ako ng point of view sa iba’t ibang session
- pagre-review ng sarili kong plans bago ibigay sa Codex
- ang blog post na ito
Bakit:
- mas sinusundan nito ang style ko
- mas mahusay ito sa feedback-driven creative iteration
- mas malakas ito sa brand taste at design taste
- ito pa rin ang model na pinaka-pinagkakatiwalaan ko kapag judgment ang trabaho, hindi execution
Para sa mahahalagang coding plans
Gusto ko pa rin ang cross-review loop:
- kumuha ng plan mula sa isa
- ipabatikos iyon sa kabila
- saka higpitan mula roon
Mas matibay pa rin ang workflow na iyan kaysa tumaya sa unang sagot ng iisang model, gaano man ito kagaling. Ang builder-intent row na dinaanan ko sa itaas ang eksaktong dahilan kung bakit gusto ko pa rin ang setup na ito.
Para sa pricing
Hindi ako nauwi sa simpleng murang switch.
Dito ako nauwi:
- hindi ko na gusto ang dating $200 Claude Max structure
- gusto ko ng mas maraming Codex capacity, hindi mas kaunti
- tinatanggap ko ang ChatGPT Pro na $100 bilang mas makatotohanang sagot para sa coding plan
- at pinananatili ko pa rin si Claude sa loop para sa lahat ng hindi code
Para sa shipping
Ang buong punto ng switch na ito ay para magpatuloy sa pag-ship. Hindi ito labinsiyam na araw ng tool benchmarking na walang maipapakitang bunga. Sa loob ng parehong window, naging live ang Operator/Builder split ng Prova na may totoong Builder execution lane, lumabas ang dalawang substantial blog posts, at nagpatakbo ako ng full translation pass sa labindalawang locale. Ang sagot kung nabawasan ba ang output ko dahil sa experiment na ito ay hindi.
Kung gusto mo ng pinaka-compressed na bersyon:
Kinansela ko ang Claude Max, pero hindi ko inalis ang Claude Code sa trabaho ko. Inilipat ko lang ang Claude Code mula sa pangunahing coding seat at ibinigay ko rito ang natitirang bahagi ng desk.
Iyan ang pinakatapat na summary na kaya kong ibigay.
Kaya: kung uulitin ko, ganoon pa rin ba ang desisyon ko?
Oo.
Pero iba ko na ito ilalarawan ngayon.
Noong April 3, ang framing ay:
"Kinansela ko ang Claude Max at tine-test ko kung kayang palitan ito ng Codex."
Pagdating ng April 22, mas ganito na ang framing:
"Kinansela ko ang Claude Max, nakita kong mas malakas na coding specialist ang Codex para sa akin sa ngayon, at ginagamit ko na ang Claude Code para sa lahat ng iba pa sa desk ko — kung saan ito pa rin ang pinakamagandang tool na meron ako."
Mas hindi binary ang sagot na iyan, mas mahal kaysa sa simpleng social-post version, at mas malapit sa totoo.
Frequently asked questions
Talaga bang pinalitan ng Codex ang Claude para sa coding?
Para sa akin, oo. Sa pure coding work, ang Codex na may GPT-5.4 sa xHigh thinking ang naging default seat ko. Nakakabigay pa rin ang Opus 4.7 sa xHigh ng useful na first pass sa deep diagnosis, pero hindi na iyon ang primary coding seat ko, at mas mabagal pa rin ito ngayon sa mas magaang coding turns.
Tumibay ba ang "murang Codex" na kuwento?
Hindi talaga. Sa sandaling ginamit ko ito sa totoong volume, tumigil ang low-tier economics sa pagiging buong kuwento. Lumipat ako sa mas mahal na OpenAI plan dahil gusto ko ng mas maraming capacity, hindi dahil bumagsak ang experiment.
Kailangan mo pa ba si Claude?
Oo, kung kasama sa trabaho mo ang writing, design, naming, image prompting, mahahabang research threads, o anumang taste-heavy o judgment-heavy na loop. Ang Opus 4.7 sa xHigh ang default ko na ngayon para sa lahat ng hindi code sa workflow ko.
Paano naman ang reliability?
Mahalaga pa rin ang reliability gap. Mas pinagtibay pa iyon ng Abril. Hindi panic ang sagot. Ang sagot ay backup coverage.
Bakit nag-publish ka nang labing-isang araw nang maaga?
Dahil settled na ang pattern. Ang paghihintay hanggang May 2 para lang sundin ang eksaktong bilang sa orihinal na headline ay magiging teatro. Ang tapat na gawin ay sabihin kung ano talaga ang ginagawa ko ngayon at magpatuloy.
So aling plan ang bibilhin mo ngayon?
Kung mostly coding ang trabaho mo, seryoso kong titingnan muna ang Codex / GPT-5.4. Kung halo itong coding at maraming taste-heavy creative work, ayokong mawalan ng Claude. At kung hindi pa abot ang $100/buwan ngayon, gumagana pa rin ang $20 Codex tier para sa mas maliliit na individual projects — asahan mo lang na mas mabilis kang tatama sa limits kapag sustained at multi-project ang trabaho. Ang sariling sagot ko ngayon ay hindi na single-tool answer.
Iyan ang tapat na nineteen-day update.
Nakuha ng Codex ang coding seat.
Nakuha ng Claude Code ang lahat ng ibang upuan.
Kaya ang tool na literal na tinatawag na Claude Code ay siya na ngayong tool na inaabot ko kapag lahat ng iba pa bukod sa code ang trabaho.
At ang totoong lesson, muli, ay mas mahalaga ang workflow kaysa fandom.
Kung nagkaroon ka rin ng katulad na switch ngayong buwan, gusto ko talagang malaman kung saan ka napadpad. May isa bang tool na malinaw na nanalo para sa iyo, o mas tumalas din ang sarili mong split?
Maraming salamat,
Chandler





