Google Gemini 2.5 Pro giờ là trợ thủ lập trình số một của tôi

Thật khó tưởng tượng rằng ChatGPT chỉ mới ra mắt vào cuối năm 2022. Rất nhiều thứ đã thay đổi kể từ đó. Là người đã dành (có lẽ) 5.000 giờ làm việc cùng nhiều model GenAI trong 3 năm qua, tôi có thể "cảm nhận" được bước nhảy vọt với Google Gemini 2.5 Pro. Giờ đây nó là công cụ lập trình hàng đầu của tôi, so với Claude 3.7 Sonnet (bao gồm Claude Code) hay DeepSeek R1 hay OpenAI o1 hay o3-mini.

Sự ưu tiên này không đến từ một khoảnh khắc "eureka" duy nhất, mà từ trải nghiệm tích lũy khi làm việc với các model khác nhau ngày qua ngày. Chất lượng code, context window dài, tốc độ, và giao diện chu đáo — tất cả cộng lại khiến Gemini 2.5 Pro nổi bật cho nhu cầu phát triển cụ thể của tôi.

Đây là "cảm nhận" cá nhân — không có benchmark nào được thực hiện cho bài viết này.

Bối cảnh

Vì bài viết này nói về cảm nhận của tôi với các công cụ khác nhau, tôi nghĩ điều quan trọng là bạn hiểu background và cách tôi sử dụng các công cụ Gen AI khác nhau. Tôi là một chuyên gia quảng cáo trung niên (vâng, tôi đã qua 40 nên dù bạn dùng định nghĩa nào về "người trẻ", tôi đều không đủ tiêu chuẩn T.T) Và tôi đã học lập trình trong vài năm qua. Tôi đã hoàn thành một số khóa học nền tảng như: Google IT Automation with Python, Google Cybersecurity Specialization, Machine learning specialization, v.v...

Để áp dụng những gì đã học vào thực tế, tôi đã xây dựng RAG agent sử dụng Langgraph, có thể trả lời câu hỏi về những gì tôi viết trên blog này trong ~20 năm qua và cả câu hỏi tài chính về Magnificent 7 trong S&P 500. Stack tổng quan của tôi cho agent này là:

Database: Weaviate (cho vector store database và hybrid search), PostgreSQL trên Google Cloud
Agent orchestration: Lang Graph
CI/CD: Google Cloud Run trên GCP
Front-end: React

Những gì tôi đang làm

Trong vài tháng qua, tôi đã làm việc trên một ứng dụng phức tạp hơn. Tôi thử xây dựng nó bằng Lang graph nhưng hiệu suất không đạt kỳ vọng, chủ yếu về tốc độ/phản hồi. Nên hiện tại, kiến trúc tổng thể của tôi là:

Kiến trúc backend

Hybrid Database Approach: Tôi triển khai kiến trúc database kết hợp PostgreSQL (cho dữ liệu người dùng và tính toàn vẹn giao dịch) với DynamoDB (cho quản lý trạng thái mở rộng)
Serverless Workflow Orchestration: Vượt ra ngoài các pattern agent cơ bản, tôi sử dụng AWS Step Functions để phối hợp các workflow nhiều giai đoạn phức tạp với xử lý lỗi đúng cách
Credit-Based System Implementation: Thêm mô hình freemium dựa trên credit với quản lý giao dịch đúng cách
VPC Configuration: Thiết lập network isolation đúng cách với security groups và VPC endpoints

Cải thiện front end

Modern React Stack: Sử dụng Next.js 15 với React 18 và TypeScript cho phát triển type-safe
Authentication System: Tích hợp AWS Cognito cho quản lý người dùng an toàn
Polling & State Management: Triển khai theo dõi trạng thái hiệu quả với tần suất polling thích ứng
Responsive Design System: Tạo giao diện tối giản, gọn gàng với các pattern styling nhất quán

Tại sao tôi chọn AWS thay vì GCP khi muốn chuyển khỏi Langgraph? Đơn giản vì tôi muốn học điều mới. Tôi đã có kiến thức về GCP từ việc host website này và sử dụng nó cho Agent hiện tại. Nên tôi muốn học thứ gì đó hoàn toàn mới.

Tại sao Gemini 2.5 Pro nổi bật cho lập trình

Trong khi người khác có thể cho bạn benchmark, tôi có thể chia sẻ cảm nhận về việc tại sao Gemini 2.5 Pro tốt hơn.

Code thực sự tốt hơn

Với cùng prompt và context, code response từ Gemini 2.5 Pro tốt hơn (hoặc ít nhất bằng) DeepSeek R1 hay Claude 3.7 Sonnet. Tôi đã ngừng dùng OpenAI o1 hay o3 vì chất lượng kém hơn hẳn.

Điều tôi đặc biệt đánh giá cao ở Gemini 2.5 Pro là sự sẵn lòng tạo ra code hoàn chỉnh, sẵn sàng sử dụng. Cả Claude 3.7 Sonnet và DeepSeek R1 đôi khi khá "lười", chỉ đưa ra triển khai một phần hoặc pseudocode cần chỉnh sửa đáng kể. Với người như tôi không có chuyên môn kỹ thuật sâu, đặc biệt về backend, điều này tạo thêm thách thức. Tôi phải tìm kiếm trong codebase để tìm đúng chỗ cần sửa hoặc mở rộng các giải pháp một phần đó.

Ngược lại, Gemini 2.5 Pro có xu hướng cung cấp giải pháp triển khai đầy đủ mà tôi thường có thể copy và paste trực tiếp vào dự án với ít chỉnh sửa. Việc tạo code hoàn chỉnh này tiết kiệm đáng kể thời gian và giảm tải nhận thức khi phải tự lấp đầy khoảng trống.

Tốc độ/thời gian suy luận tốt hơn

DeepSeek có vấn đề về quy mô. Có lẽ do quá nhiều người sử dụng và không chạy trên chip Nvidia mới nhất cho suy luận, nó chậm hơn nhiều và thường hiện thông báo server bận. Ngược lại Gemini 2.5 Pro nhanh, cực kỳ nhanh. Claude 3.7 Sonnet phiên bản web nhanh ngang Gemini 2.5 Pro còn Claude Code thì hơi chậm hơn.

Context window cực dài (nghĩa là nhiều lượt chat hơn)

Claude 3.7 Sonnet tốt nhưng tôi thường gặp giới hạn độ sâu chat hoặc context window. Một cách tôi đối phó là yêu cầu model viết tài liệu rõ ràng để chuyển task tiếp theo cho "backend developer" hoặc "front end developer" khác làm rồi TẠO chat mới. Điều này nhanh chóng trở nên mệt mỏi. Và chúng ta đều biết cần debug và chưa thể tin 100% code từ GenAI, đặc biệt khi tích hợp backend và front end. Nhưng nếu context window quá nhỏ và phải bắt đầu chat mới mỗi lần, máy có thể không có đủ context để xác định bug.

Ngược lại với context window 1M token (miễn phí) từ Gemini 2.5 Pro, tôi có thể tiếp tục lặp lại, copy paste code, error message vào và hỏi model đệ quy. Điều này đã cải thiện đáng kể tốc độ và chất lượng code của tôi. :D

(Lưu ý nhanh là tôi nhận thấy tốc độ suy luận và phản hồi UI chậm đi đáng kể khi vượt qua 300k hoặc 400k token mỗi prompt.)

Cập nhật ngày 4 tháng 4: Phản hồi UI đã cải thiện rất nhiều trong 48 giờ qua. Giờ, ngay cả ở 300k token, nó có vẻ chạy mượt!

Chi phí

Hiện tại, Gemini 2.5 Pro MIỄN PHÍ sử dụng. Nhớ lại tôi từng trả OpenAI $200/tháng cuối năm 2024 để dùng model Pro của họ và chất lượng không bằng Gemini 2.5, thật điên rồ T.T

Claude Code tốt nhưng rất đắt. Rất dễ tiêu $5 hay $10 mỗi giờ khi làm việc cùng Claude Code nên chưa khả thi với tôi. Chi phí cộng dồn nhanh lắm.

Ưu điểm giao diện của Gemini 2.5 Pro

Tôi sử dụng Gemini 2.5 Pro qua AI Studio từ Google. So với DeepSeek R1 hay Claude 3.7, tôi đánh giá cao sự tỉ mỉ và chú ý đến chi tiết trong giao diện. Đây là một số điểm tôi thích:

Hiển thị số token Số token trong prompt hiện tại. Tôi biết tối đa khoảng 1M token nhưng đang ở đâu so với giới hạn? Còn bao xa trước khi phải bảo máy viết tài liệu tóm tắt để tiếp tục trong chat mới?

Điều chỉnh temperature Nằm ngay bên dưới Token count. Hoàn hảo, dễ điều chỉnh.

Phím tắt "Command + Enter" để chạy prompt trên Mac OS: Tuyệt vời. Giờ bạn nói đúng ngôn ngữ của tôi vì rất nhiều lần, tôi vô tình nhấn "Enter" nhưng muốn tạo dòng mới để paste thêm nội dung vào chat. (Bạn có thể nói dễ học dùng Command + Enter cho dòng mới như Claude nhưng tôi hơi kỳ quặc.)

Kiểm soát độ dài output Lại tuyệt vời vì đôi khi tôi muốn câu trả lời ngắn và đôi khi muốn phản hồi dài hơn nhiều vì cần code thực tế qua nhiều file.

Chức năng copy

Ngay cả chức năng copy cũng tốt hơn. Nó có "Copy markdown" — thứ developer thường muốn dùng!

Tôi dừng ở đây nhưng chắc bạn hiểu ý. Giao diện này rất phù hợp cho Developer và tôi đánh giá cao. Tốt hơn nhiều so với ChatGPT hay DeepSeek hay thậm chí Claude. Tôi rất thích Claude nhưng điểm trừ chính là không biết mức tiêu thụ token so với giới hạn.

Nhìn về phía trước

Khi tiếp tục xây dựng các ứng dụng phức tạp hơn, chất lượng trợ thủ lập trình AI ngày càng quan trọng. Dù tất cả model chắc chắn sẽ cải thiện, sự kết hợp của chất lượng code, context window dài, và giao diện chu đáo đã cho Gemini 2.5 Pro lợi thế đáng kể cho quy trình phát triển của tôi.

Bài kiểm tra thực sự sẽ là xem các model xử lý hệ thống phức tạp hơn ra sao khi tôi tiếp tục đẩy giới hạn bản thân. (Bài kiểm tra đó đã đến khi tôi xây dựng ứng dụng iOS native mà không biết Swift bằng Claude Code — AI xử lý khung sườn, nhưng khoảng cách giữa "code hoạt động" và "sản phẩm hoàn thiện" hóa ra là nơi mọi công việc thực sự nằm.)

Vậy đó. Đó là lý do trong thời gian ngắn, Gemini 2.5 Pro đã chinh phục tôi và giờ là công cụ lập trình hàng đầu. :D

Tôi rất muốn biết — công cụ AI lập trình ưa thích của bạn hiện tại là gì? Và nó có thay đổi trong vài tháng qua không? Tôi cảm thấy bối cảnh đang thay đổi nhanh đến mức thứ tốt nhất hôm nay có thể không còn là câu trả lời vào quý tới. Hãy cho tôi biết suy nghĩ của bạn!

Thân mến, Chandler

P.S. Tôi cũng thử Github Copilot Agent nhưng không thích lắm vì hiện tại, giới hạn mỗi chat rất nhỏ và tốc độ suy luận rất chậm. Tôi thường xuyên gặp giới hạn Claude 3.7 Sonnet và nó chưa có Gemini 2.5 Pro.

Google Gemini 2.5 Pro giờ là trợ thủ lập trình số một của tôi

Bối cảnh

Những gì tôi đang làm

Kiến trúc backend

Cải thiện front end

Tại sao Gemini 2.5 Pro nổi bật cho lập trình

Code thực sự tốt hơn

Tốc độ/thời gian suy luận tốt hơn

Context window cực dài (nghĩa là nhiều lượt chat hơn)

Chi phí

Ưu điểm giao diện của Gemini 2.5 Pro

Nhìn về phía trước

Đọc tiếp

Một năm sau: Thói quen tìm kiếm của tôi xác nhận sự trỗi dậy của trợ lý AI và tương lai đang thay đổi của SEO

Tạo Quảng Cáo SEM Hiệu Quả Cao Với ChatGPT Và Best Practices Của Google

Từ dân quảng cáo thành dân lập trình? Hành trình Python của tôi

Một tuần đánh giá: Trải nghiệm và bài học với Gen App Builder của Google

Google Generative AI agent đã hoạt động trên trang web của tôi

Tác động tiềm năng của chat lên SEO và nhà xuất bản: Nhìn Lại Ba Tháng