Một tuần đánh giá: Trải nghiệm và bài học với Gen App Builder của Google
Tôi đã dành một tuần thử nghiệm Gen App Builder của Google và phát hiện chìa khóa cho câu trả lời chatbot tốt hơn: cung cấp dữ liệu phi cấu trúc VÀ sử dụng ChatGPT để chuyển đổi hơn 450 bài blog sang đúng định dạng.
Bài viết này được viết năm 2023. Một số chi tiết có thể đã thay đổi.
Cập nhật tháng 2 năm 2026
Chatbot Google Gen App Builder không còn hoạt động trên trang này. Những bực bội tôi mô tả dưới đây — thiếu khả năng tổng hợp nội dung, các phản hồi cũ kỹ — chính là điều thúc đẩy tôi tự xây dựng chatbot riêng. Sau nhiều lần lặp lại (agent của Google, OpenAI API, LangChain, Weaviate), tôi đã có Sydney, một trợ lý AI cuối cùng làm được những gì tôi luôn mong muốn: tổng hợp 486 bài blog và trả lời bằng giọng văn của tôi.
Bài viết gốc từ tháng 9 năm 2023 được giữ nguyên bên dưới để tham khảo.
Tuần trước, tôi đã nhanh chóng triển khai một chatbot trên blog sử dụng Google Gen App Builder. Dù tôi thích sự nhanh chóng và dễ dàng của toàn bộ quy trình (và credit miễn phí — thích lắm), chatbot có một vài điểm cần cải thiện và điều lớn nhất với tôi là làm sao để chatbot "tổng hợp" nội dung từ nhiều bài viết thay vì chỉ đơn giản khớp truy vấn người dùng với nội dung cũ. Tôi không chắc đây có phải kỳ vọng thực tế không nhưng tôi muốn thử.
Và đây là những gì tôi đã học được sau khi tìm hiểu:
1. Thêm nội dung dưới dạng dữ liệu phi cấu trúc vào bot dường như có ích
Ý tôi là gì? Ngoài việc để crawler của Google index website trực tiếp, bạn cũng có thể thêm tất cả nội dung của mình vào bot, sử dụng "Data store."
Sau khi data store được tạo, bạn có thể thêm store mới vào chatbot, trong Agent settings
Sau khi làm điều này, tôi thấy câu trả lời của chatbot tốt hơn nhiều. Dường như nó "biết" về nội dung nhiều hơn.
Google cung cấp hướng dẫn ở đây, mục "Unstructured data store" và "Upload with metadata".
ehhh nhưng làm sao tôi chuyển đổi hơn 450 bài blog sang định dạng yêu cầu, bao gồm file JSON Line? :P
2. ChatGPT hỗ trợ làm sạch và chuẩn bị dữ liệu
Tôi không phải người kỹ thuật (chà, chưa phải :D) nên tất cả những gì tôi có thể làm là xuất nội dung blog từ WordPress sang file .XML. Tôi phải nhờ ChatGPT giúp viết code để làm sạch và chuẩn bị dữ liệu theo định dạng yêu cầu.
Tôi thích ChatGPT ở điểm này vì với "custom instructions", ChatGPT có hiểu biết cơ bản về tình huống của tôi và có thể cung cấp hướng dẫn chi tiết từng bước.
Lần đầu tiên tôi cố gắng làm việc với ChatGPT để chuyển đổi file .XML sang định dạng .HTML và .JSON Line, tôi đã viết: "The blog uses wordpress. I can export all published posts from this blog using WordPress. I need to prepare the data so that it can be used to train a large language model. What should I do to prepare this data?"
Sau khi thực hiện tất cả các bước, với các script liên quan được cung cấp bởi ChatGPT và upload dữ liệu lên Gen App Builder, tôi gặp nhiều lỗi. Về cơ bản, dữ liệu không đúng định dạng mà Google yêu cầu để có thể nhập/tích hợp dữ liệu.
Vì vậy, đây là nơi tôi học được bài học quý giá. Tôi nên bắt đầu bằng cách cung cấp toàn bộ tài liệu hướng dẫn Google Gen App Builder cho ChatGPT.
Cung cấp cho ChatGPT tài liệu hướng dẫn thực tế
Tôi chỉ đơn giản "copy and paste" toàn bộ tài liệu hướng dẫn từ Google Cloud vào ChatGPT và yêu cầu nó viết code Python cho tôi để chuyển đổi dữ liệu từ .XML sang định dạng .HTML và .JSON Line theo yêu cầu. Lần này, vì ChatGPT hiểu định dạng và template cuối cùng, code nó tạo ra hoạt động tốt hơn nhiều mà không gặp nhiều lỗi khi upload.
3. Kiến thức chung về Python thực sự có ích
Tôi hoàn toàn là người mới khi nói đến Python nên phải nhờ ChatGPT cho hầu hết phần code thực tế. Tuy nhiên, kiến thức chung về Python sẽ giúp ích rất nhiều vì bạn biết nên yêu cầu ChatGPT làm gì. Nó cực kỳ mạnh nhưng nó không biết những gì bạn không biết và môi trường phát triển của bạn.
Ví dụ, code Python do ChatGPT tạo ra thường thiếu dòng "shebang". Vì tôi biết về nó, tôi thường yêu cầu ChatGPT thêm dòng đó vào code. Ngoài ra khi ChatGPT yêu cầu bạn làm gì đó bằng command line, bạn có ý tưởng sơ bộ về lý do tại sao.
4. Cập nhật tháng 10 năm 2023
Kể từ khi đăng bài này, tôi đã xây dựng được chatbot riêng, sử dụng OpenAI API. Chatbot cho phép bạn tương tác với tất cả nội dung lịch sử trên blog cho đến cuối tháng 9 năm 2023. Ưu điểm lớn nhất là nó có thể tổng hợp nội dung từ nhiều bài viết cùng chủ đề, đây là vấn đề lớn nhất của tôi với giải pháp có sẵn. Bạn có thể xem chatbot trực tiếp ở đây hoặc đọc bài viết về "Cách tôi xây dựng Chatbot riêng không cần kinh nghiệm code: Bài học kinh nghiệm."
Vậy là hết phần chia sẻ của tôi. Bạn đã thử xây dựng chatbot với Gen AI chưa? Tôi rất muốn nghe về trải nghiệm của bạn :)
Thân mến,
Chandler








