Google Gemini 2.5 Pro依家係我寫code嘅首選拍檔
用咗5,000個鐘頭測試AI model之後,Gemini 2.5 Pro喺寫code方面贏咗Claude同ChatGPT——以下係佢點樣成為我build複雜應用嘅默認工具。
好難想像ChatGPT係2022年尾先launch嘅。之後變化咗好多。作為一個過去3年大概花咗5,000個鐘頭同多個GenAI model一齊工作嘅人,我可以「感受到」Google Gemini 2.5 Pro嘅質變。佢依家係我寫code嘅首選工具,勝過Claude 3.7 Sonnet(包括Claude Code)、DeepSeek R1、OpenAI o1或者o3-mini。
呢個偏好唔係來自一個「Eureka」時刻,而係來自日復一日同唔同model工作嘅累積經驗。Code質素、長context window、速度、同埋用心嘅UI加埋一齊,令Gemini 2.5 Pro喺我作為developer嘅特定需求上面脫穎而出。
呢個係我個人嘅「感覺」——冇做任何benchmarking。
背景
因為呢篇文係講我對唔同工具嘅感覺,我覺得有必要俾你了解我嘅背景同埋我點樣用唔同嘅Gen AI工具。我係一個中年廣告人(係嘅,我過咗40歲,所以無論你用邊個young adult嘅定義,我都唔合格 T.T),過去幾年一直喺學寫code。我完成咗一啲基礎課程,例如:Google IT Automation with Python、Google Cybersecurity Specialization、Machine learning specialization等等...
為咗將學到嘅嘢應用到現實生活,我用Langgraph build咗一個RAG agent,佢可以回答我過去約20年喺呢個blog寫過嘅內容同埋S&P 500入面Magnificent 7嘅財務問題。我呢個agent嘅high level tech stack係:
- Database: Weaviate(用嚟做vector store database同hybrid search)、Google Cloud上嘅PostgreSQL
- Agent orchestration: Lang Graph
- CI/CD: Google Cloud上嘅Cloud Run
- Front-end: React
我依家做緊咩
過去幾個月,我一直喺做一個比較複雜嘅應用。我試過用Lang Graph嚟build但performance唔達到我嘅期望,主要係速度/回應方面。所以而家我嘅overall architecture係:
Backend architecture
- Hybrid Database Approach: 我用咗hybrid database架構,結合PostgreSQL(用嚟儲user data同保證transactional integrity)同DynamoDB(用嚟做scalable state management)
- Serverless Workflow Orchestration: 超越基本嘅agent pattern,我用AWS Step Functions嚟coordinate複雜嘅multi-stage workflow,加上proper error handling
- Credit-Based System Implementation: 加咗credit-based freemium model,有proper transaction management
- VPC Configuration: 設定好proper network isolation,有security groups同VPC endpoints
Front end改進
- Modern React Stack: 用Next.js 15配合React 18同TypeScript做type-safe development
- Authentication System: 整合咗AWS Cognito做secure user management
- Polling & State Management: 做咗efficient status tracking,有adaptive polling frequencies
- Responsive Design System: 整咗個minimalist、乾淨嘅UI,有consistent styling patterns
點解我決定用AWS而唔係GCP呢?話說我本身喺host呢個網站同用現有Agent嘅時候已經有啲GCP嘅知識。所以我想學啲完全新嘅嘢。
點解Gemini 2.5 Pro喺寫code方面特別出色
其他人可以俾你benchmark,我可以俾你我嘅感覺——點解我覺得Gemini 2.5 Pro更好。
實際嘅code質素更好
俾同一個prompt同context,Gemini 2.5 Pro嘅code回應比DeepSeek R1或Claude 3.7 Sonnet更好(或至少一樣好)。我已經唔用OpenAI o1或o3喇,因為質素差好多。
我特別appreciate Gemini 2.5 Pro願意generate完整、可以即用嘅code。Claude 3.7 Sonnet同DeepSeek R1有時都幾「懶」,淨係俾partial implementation或者pseudocode,需要大幅修改。對於我呢種冇深厚技術專長嘅人嚟講,尤其係backend,呢個造成額外挑戰。我需要喺codebase入面搵啱嘅位置嚟edit或者擴展佢哋俾嘅partial solution。
另一方面,Gemini 2.5 Pro傾向提供fully-implemented嘅solution,我通常可以直接copy and paste落我嘅project,只需要少量調整。呢種完整嘅code generation幫我慳咗好多時間,減少咗填補空白嘅cognitive load。
Inference time/速度更快
DeepSeek有scale problem。可能因為太多人用而且唔係用最新嘅Nvidia chips做inference,佢慢好多而且成日show server is busy嘅error message。Gemini 2.5 Pro就好快,極快。Claude 3.7 Sonnet web版同Gemini 2.5 Pro差唔多快,Claude Code就慢少少。
超長context window(即係可以有更多chat iterations)
Claude 3.7 Sonnet係好嘅,但我成日撞到chat depth或context window length嘅limit。我嘅應對方法之一係叫model清楚咁寫documentation,將下一個任務交俾另一個「backend developer」或「front end developer」做,然後開一個新chat。呢個好快就開始變得好攰。而且我哋都知我哋需要debug,唔可以100%信AI generate嘅code,尤其係涉及backend同front end嘅integration。但如果context window length太細,每次都要開新chat,machine可能冇完整嘅context去搵到啲bugs。
相反,用Gemini 2.5 Pro嘅1M context window length(免費tier),我可以繼續iterate,copy and paste code、error message入去,遞歸式咁問model。呢個大大提升咗我嘅速度同code quality。:D
(快速note,我發現一旦超過300k或400k token per prompt,inference time同UI responsiveness會明顯變慢。)
4月4日更新:過去48小時UI responsiveness改善咗好多。依家即使喺300k token,都好似run得好順暢!
成本考量
而家Gemini 2.5 Pro係免費用嘅。回想我喺2024年尾每個月俾OpenAI $200用佢哋嘅Pro model,質素仲唔及Gemini 2.5,真係好insane T.T
Claude Code係好用嘅,但好貴。每個鐘頭好容易使$5或$10,所以對我嚟講暫時唔可行。成本好容易就累積上去。
Gemini 2.5 Pro嘅UI優勢
我係透過Google嘅AI Studio用Gemini 2.5 Pro嘅。同DeepSeek R1或Claude 3.7比,我好appreciate UI背後嘅心思同對細節嘅注意。以下係一啲我鍾意嘅例子:
Token count顯示 Prompt入面嘅token count。我知max大概係1M token,但我用咗幾多?仲可以繼續行幾遠先要叫machine寫documentation總結我哋做過咩,然後我可以喺另一個new chat繼續?
Temperature control 就喺Token count下面。完美,好方便調整。
Keyboard shortcuts Mac OS上用「Command + Enter」嚟run prompt:正。依家你講我嘅語言喇,因為好多次我唔小心撳咗「Enter」但其實係想新開一行黎paste更多內容入chat。(你可以話學用Command + Enter開新行好簡單,好似Claude咁,但我就係有啲古怪。)
Output length control 又係好正,因為有時候我想要短答案,有時候想要長好多嘅回應因為我要跨多個files嘅actual code。
Copy功能
連copy功能都好過人。佢有「Copy markdown」,呢個正正係developer成日想用嘅!
我就講到呢度,但我諗你get到個point喇。呢個UI好啱Developer用,我好appreciate。對我嚟講好過ChatGPT、DeepSeek甚至Claude。我好鍾意Claude,但主要缺點係唔知到目前為止嘅token消耗同limit嘅比較。
展望未來
隨住我繼續build越來越複雜嘅應用,AI寫code拍檔嘅質素變得越來越重要。雖然所有model都會不斷改進,但Gemini 2.5 Pro喺code質素、長context window同用心UI嘅組合,俾佢喺我嘅development workflow入面有顯著優勢。
真正嘅考驗係睇吓隨住我繼續push自己嘅boundaries,呢啲model點樣處理更複雜嘅system。(呢個考驗喺我用Claude Code build咗一個native iOS app但唔識Swift嘅時候到嚟——AI處理咗scaffold,但「可以run嘅code」同「完成品」之間嘅gap,先係真正所有real work嘅所在。)
所以就係咁喇。呢個就係點解喺短時間內,Gemini 2.5 Pro贏咗我,依家係我寫code嘅首選工具。:D
我好想知——你而家用緊咩AI寫code工具?過去幾個月有冇變過?我覺得個landscape變得好快,今日最好用嘅下個季度可能唔再係。話俾我知你點睇!
祝好,
Chandler
P.S. 我亦試過Github Copilot Agent,但唔係好鍾意,因為到目前為止每個chat嘅limit好細,inference speed好慢。我好常撞到Claude 3.7 Sonnet嘅limit,而且佢仲未有Gemini 2.5 Pro。




