Google Gemini 2.5 Pro依家係我寫code嘅首選拍檔

好難想像ChatGPT係2022年尾先launch嘅。之後變化咗好多。作為一個過去3年大概花咗5,000個鐘頭同多個GenAI model一齊工作嘅人，我可以「感受到」Google Gemini 2.5 Pro嘅質變。佢依家係我寫code嘅首選工具，勝過Claude 3.7 Sonnet（包括Claude Code）、DeepSeek R1、OpenAI o1或者o3-mini。

呢個偏好唔係來自一個「Eureka」時刻，而係來自日復一日同唔同model工作嘅累積經驗。Code質素、長context window、速度、同埋用心嘅UI加埋一齊，令Gemini 2.5 Pro喺我作為developer嘅特定需求上面脫穎而出。

呢個係我個人嘅「感覺」——冇做任何benchmarking。

背景

因為呢篇文係講我對唔同工具嘅感覺，我覺得有必要俾你了解我嘅背景同埋我點樣用唔同嘅Gen AI工具。我係一個中年廣告人（係嘅，我過咗40歲，所以無論你用邊個young adult嘅定義，我都唔合格 T.T），過去幾年一直喺學寫code。我完成咗一啲基礎課程，例如：Google IT Automation with Python、Google Cybersecurity Specialization、Machine learning specialization等等...

為咗將學到嘅嘢應用到現實生活，我用Langgraph build咗一個RAG agent，佢可以回答我過去約20年喺呢個blog寫過嘅內容同埋S&P 500入面Magnificent 7嘅財務問題。我呢個agent嘅high level tech stack係：

Database: Weaviate（用嚟做vector store database同hybrid search）、Google Cloud上嘅PostgreSQL
Agent orchestration: Lang Graph
CI/CD: Google Cloud上嘅Cloud Run
Front-end: React

我依家做緊咩

過去幾個月，我一直喺做一個比較複雜嘅應用。我試過用Lang Graph嚟build但performance唔達到我嘅期望，主要係速度/回應方面。所以而家我嘅overall architecture係：

Backend architecture

Hybrid Database Approach: 我用咗hybrid database架構，結合PostgreSQL（用嚟儲user data同保證transactional integrity）同DynamoDB（用嚟做scalable state management）
Serverless Workflow Orchestration: 超越基本嘅agent pattern，我用AWS Step Functions嚟coordinate複雜嘅multi-stage workflow，加上proper error handling
Credit-Based System Implementation: 加咗credit-based freemium model，有proper transaction management
VPC Configuration: 設定好proper network isolation，有security groups同VPC endpoints

Front end改進

Modern React Stack: 用Next.js 15配合React 18同TypeScript做type-safe development
Authentication System: 整合咗AWS Cognito做secure user management
Polling & State Management: 做咗efficient status tracking，有adaptive polling frequencies
Responsive Design System: 整咗個minimalist、乾淨嘅UI，有consistent styling patterns

點解我決定用AWS而唔係GCP呢？話說我本身喺host呢個網站同用現有Agent嘅時候已經有啲GCP嘅知識。所以我想學啲完全新嘅嘢。

點解Gemini 2.5 Pro喺寫code方面特別出色

其他人可以俾你benchmark，我可以俾你我嘅感覺——點解我覺得Gemini 2.5 Pro更好。

實際嘅code質素更好

俾同一個prompt同context，Gemini 2.5 Pro嘅code回應比DeepSeek R1或Claude 3.7 Sonnet更好（或至少一樣好）。我已經唔用OpenAI o1或o3喇，因為質素差好多。

我特別appreciate Gemini 2.5 Pro願意generate完整、可以即用嘅code。Claude 3.7 Sonnet同DeepSeek R1有時都幾「懶」，淨係俾partial implementation或者pseudocode，需要大幅修改。對於我呢種冇深厚技術專長嘅人嚟講，尤其係backend，呢個造成額外挑戰。我需要喺codebase入面搵啱嘅位置嚟edit或者擴展佢哋俾嘅partial solution。

另一方面，Gemini 2.5 Pro傾向提供fully-implemented嘅solution，我通常可以直接copy and paste落我嘅project，只需要少量調整。呢種完整嘅code generation幫我慳咗好多時間，減少咗填補空白嘅cognitive load。

Inference time/速度更快

DeepSeek有scale problem。可能因為太多人用而且唔係用最新嘅Nvidia chips做inference，佢慢好多而且成日show server is busy嘅error message。Gemini 2.5 Pro就好快，極快。Claude 3.7 Sonnet web版同Gemini 2.5 Pro差唔多快，Claude Code就慢少少。

超長context window（即係可以有更多chat iterations）

Claude 3.7 Sonnet係好嘅，但我成日撞到chat depth或context window length嘅limit。我嘅應對方法之一係叫model清楚咁寫documentation，將下一個任務交俾另一個「backend developer」或「front end developer」做，然後開一個新chat。呢個好快就開始變得好攰。而且我哋都知我哋需要debug，唔可以100%信AI generate嘅code，尤其係涉及backend同front end嘅integration。但如果context window length太細，每次都要開新chat，machine可能冇完整嘅context去搵到啲bugs。

相反，用Gemini 2.5 Pro嘅1M context window length（免費tier），我可以繼續iterate，copy and paste code、error message入去，遞歸式咁問model。呢個大大提升咗我嘅速度同code quality。:D

（快速note，我發現一旦超過300k或400k token per prompt，inference time同UI responsiveness會明顯變慢。）

4月4日更新：過去48小時UI responsiveness改善咗好多。依家即使喺300k token，都好似run得好順暢！

成本考量

而家Gemini 2.5 Pro係免費用嘅。回想我喺2024年尾每個月俾OpenAI $200用佢哋嘅Pro model，質素仲唔及Gemini 2.5，真係好insane T.T

Claude Code係好用嘅，但好貴。每個鐘頭好容易使$5或$10，所以對我嚟講暫時唔可行。成本好容易就累積上去。

Gemini 2.5 Pro嘅UI優勢

我係透過Google嘅AI Studio用Gemini 2.5 Pro嘅。同DeepSeek R1或Claude 3.7比，我好appreciate UI背後嘅心思同對細節嘅注意。以下係一啲我鍾意嘅例子：

Token count顯示 Prompt入面嘅token count。我知max大概係1M token，但我用咗幾多？仲可以繼續行幾遠先要叫machine寫documentation總結我哋做過咩，然後我可以喺另一個new chat繼續？

Temperature control 就喺Token count下面。完美，好方便調整。

Keyboard shortcuts Mac OS上用「Command + Enter」嚟run prompt：正。依家你講我嘅語言喇，因為好多次我唔小心撳咗「Enter」但其實係想新開一行黎paste更多內容入chat。（你可以話學用Command + Enter開新行好簡單，好似Claude咁，但我就係有啲古怪。）

Output length control 又係好正，因為有時候我想要短答案，有時候想要長好多嘅回應因為我要跨多個files嘅actual code。

Copy功能

連copy功能都好過人。佢有「Copy markdown」，呢個正正係developer成日想用嘅！

我就講到呢度，但我諗你get到個point喇。呢個UI好啱Developer用，我好appreciate。對我嚟講好過ChatGPT、DeepSeek甚至Claude。我好鍾意Claude，但主要缺點係唔知到目前為止嘅token消耗同limit嘅比較。

展望未來

隨住我繼續build越來越複雜嘅應用，AI寫code拍檔嘅質素變得越來越重要。雖然所有model都會不斷改進，但Gemini 2.5 Pro喺code質素、長context window同用心UI嘅組合，俾佢喺我嘅development workflow入面有顯著優勢。

真正嘅考驗係睇吓隨住我繼續push自己嘅boundaries，呢啲model點樣處理更複雜嘅system。（呢個考驗喺我用Claude Code build咗一個native iOS app但唔識Swift嘅時候到嚟——AI處理咗scaffold，但「可以run嘅code」同「完成品」之間嘅gap，先係真正所有real work嘅所在。）

所以就係咁喇。呢個就係點解喺短時間內，Gemini 2.5 Pro贏咗我，依家係我寫code嘅首選工具。:D

我好想知——你而家用緊咩AI寫code工具？過去幾個月有冇變過？我覺得個landscape變得好快，今日最好用嘅下個季度可能唔再係。話俾我知你點睇！

祝好，

Chandler

P.S. 我亦試過Github Copilot Agent，但唔係好鍾意，因為到目前為止每個chat嘅limit好細，inference speed好慢。我好常撞到Claude 3.7 Sonnet嘅limit，而且佢仲未有Gemini 2.5 Pro。

Google Gemini 2.5 Pro依家係我寫code嘅首選拍檔

背景

我依家做緊咩

Backend architecture

Front end改進

點解Gemini 2.5 Pro喺寫code方面特別出色

實際嘅code質素更好

Inference time/速度更快

超長context window（即係可以有更多chat iterations）

成本考量

Gemini 2.5 Pro嘅UI優勢

展望未來

繼續閱讀

一年之後：我嘅搜尋習慣印證咗 AI 助手嘅崛起同 SEO 嘅未來轉變

用 ChatGPT 同 Google Best Practices 生成高效能 SEM 廣告文案

廣告人變 Code 人？我嘅 Python 冒險之旅

一個禮拜嘅回顧：我用 Google Gen App Builder 嘅經驗同學到嘅嘢

Google Generative AI agent 喺我嘅網站上線啦

Chat 對 SEO 同出版商嘅潛在影響：三個月後嘅回顧