一周回顾:我使用 Google Gen App Builder 的体验与收获
我花了一周测试 Google 的 Gen App Builder,并发现提升 chatbot 回答质量的关键:不仅要喂入非结构化数据,还要用 chatGPT 把 450+ 篇博客整理成正确格式。
本文写于2023年,部分内容可能已发生变化。
Update Feb 2026
The Google Gen App Builder chatbot is no longer active on this site. The frustrations I describe below—the lack of content synthesis, the stale responses—are exactly what pushed me to build my own. After many iterations (Google's agent, OpenAI API, LangChain, Weaviate), I ended up with Sydney, an AI assistant that finally does what I always wanted: synthesize 486 blog posts and answer in my voice.
Original post from Sep 2023 preserved below for context.
上周我很快就在博客上部署了一个 chatbot,用的是 Google Gen App Builder。整个流程我很喜欢:快、简单,而且还有免费额度(这点很香)。但这个 chatbot 仍有几个可改进点,对我来说最大的问题是:它如何才能“综合(synthesize)”多篇文章内容,而不是只是把用户 query 和旧内容做匹配。我不确定这是否现实,但我还是想试。
这是我玩了一阵后的收获:
1. 把内容作为非结构化数据加入 bot,确实有帮助
我指的是什么?除了让 Google crawler 去抓取线上网站,你还可以通过 “Data store” 把你的全部内容喂给 bot。
data store 建好后,可以在 Agent settings 下把新 store 加到 chatbot 里。
做完这步后,我发现 chatbot 回答明显更好。它看起来对内容“更熟”。
Google 的官方指南在这里,重点看 “Unstructured data store” 和 “Upload with metadata”。
ehhh 但问题来了:我怎么把 450+ 篇博客转成它要求的格式(包含 JSON Line 文件)? :P
2. 用 chatGPT 帮忙做数据清洗与准备
我不是技术背景(至少当时还不是 :D),所以我能做的就是先把 WordPress 内容导出成 .XML。后面的数据清洗和格式转换代码都得依赖 chatGPT。
我喜欢 chatGPT 在这个场景下的原因是:通过 “custom instructions”,它对我的背景有基础理解,能给出非常细致的步骤。
第一次我让 chatGPT 做 .XML 到 .HTML/.Json Line 转换时,用的提示是:“The blog uses wordpress. I can export all published posts from this blog using WordPress. I need to prepare the data so that it can be used to train a large language model. What should I do to prepare this data?”
按步骤做完、脚本也跑了、数据也上传到 Gen App Builder 后,我仍遇到很多错误。核心是数据格式和 Google 预期不一致,所以系统无法正确 ingest/integrate。
这里我学到一个重要教训:一开始就该把 Google Gen App Builder 的完整文档给 chatGPT。
Provide chatGPT with the Actual Documentation guide
我直接把 Google Cloud 的整份文档内容复制粘贴给 chatGPT,然后让它写 Python 代码,帮我把 .XML 转成要求的 .HTML 与 .JSON line 格式。这次因为 chatGPT 理解了最终模板和格式,生成代码在上传时错误明显减少,效果好多了。
3. 懂一点 Python 常识帮助很大
我在 Python 方面仍是新手,所以绝大多数实际编码还是依赖 chatGPT。但你有基本 Python 认知会非常有帮助,因为你知道该让 ChatGPT 做什么。它很强,但它不知道你不知道什么,也不知道你的开发环境细节。
例如,chatGPT 生成的 Python 代码常漏掉 “shebang” 行。因为我知道这个点,所以会主动要求它加上。另外当 chatGPT 让你在命令行执行某步骤时,你也会大概理解为什么。
4. Oct 2023 update
这篇发布后,我已经用 OpenAI API 做出了自己的 chatbot。它可以和我博客截至 2023 年 9 月底的历史内容互动。相对于现成方案,它最大的优势是能跨多篇同主题文章做综合回答,这正是我对 off-the-shelf 方案最大的不满。你可以直接在这里试用 chatbot,或看这篇 "How I Built My Own Chatbot with No Coding Experience: Lessons Learned"。
我这边就先写到这里。你有试过用 Gen AI 搭 chatbot 吗?很想听听你的实战体验 :)
致敬,
Chandler








