Skip to content
··1分で読めます

一週間の振り返り:GoogleのGen App Builderでの体験と学び

GoogleのGen App Builderを1週間テストして、チャットボットの回答を改善する鍵を発見しました:非構造化データを与えること、そしてchatGPTを使って450以上のブログ記事を適切なフォーマットに変換することです。

この記事は2023年に書かれたものです。一部の情報が変更されている可能性があります。

2026年2月アップデート

Google Gen App Builderチャットボットはこのサイトでは稼働していません。 以下で説明している不満 — コンテンツの統合不足、古い回答 — がまさに自分で構築する動機となりました。多くのイテレーション(Googleのエージェント、OpenAI API、LangChain、Weaviate)を経て、最終的にずっと求めていたことを実現するSydneyというAIアシスタントにたどり着きました:486のブログ記事を統合し、私の声で回答すること。

Ask Sydney →


以下は2023年9月のオリジナル投稿を文脈として保存したものです。

先週、Google Gen App Builderを使ってブログにチャットボットを素早くデプロイしました。全体的なプロセスの速さと簡単さ(そして無料クレジット — 最高)は気に入っていますが、チャットボットにはいくつかの改善点があり、最大の課題は、ユーザーのクエリを過去のコンテンツと単にマッチングさせるのではなく、複数の投稿にわたるコンテンツを「統合」させる方法です。これが現実的な期待かどうかわかりませんが、試してみたいと思います。

そして、少し触ってみた後に学んだことがこちらです:

1. コンテンツを非構造化データとしてボットに追加すると効果があるようです

どういう意味でしょうか?Googleのクローラーにライブウェブサイトをインデックスさせるだけでなく、「Data store」を使ってすべてのコンテンツをボットに追加することもできます。

adding multiple data stores to chatbot google gen app builder

Data storeを作成した後、Agent settingsからチャットボットに新しいストアを追加できます

google gen app builder chatbot agent setting

これを行った後、チャットボットの回答がかなり良くなったことがわかりました。コンテンツについてかなり多くのことを「知っている」ようになったようです。

Googleはガイドをこちらで提供しています。「Unstructured data store」と「Upload with metadata」の項目を参照してください。

えっと、でも450以上のブログ記事をJSON Lineファイルを含む必要なフォーマットにどうやって変換すればいいのでしょうか? :P

2. データクリーニングと準備にchatGPTを活用

私は技術的な人間ではない(まあ、まだですが :D)ので、できたのはWordPressからブログコンテンツを.XMLファイルにエクスポートすることだけでした。必要なフォーマットにデータをクリーニングし準備するコードについては、chatGPTに頼る必要がありました。

この点でchatGPTが気に入っているのは、「カスタム指示」により、chatGPTが私の状況を基本的に理解し、非常に詳細なステップバイステップのガイドを提供できるからです。

.XMLファイルを.HTMLと.JSON Lineフォーマットに変換する初めての試みで、私はこう書きました。「ブログはWordPressを使用しています。WordPressからすべての公開記事をエクスポートできます。このデータを大規模言語モデルのトレーニングに使えるように準備する必要があります。データを準備するために何をすべきですか?」

chatGPT prepare data for LLM step by step guide

すべての手順を踏み、chatGPTが提供したスクリプトを使ってGen App Builderにデータをアップロードした後、多くのエラーが発生しました。基本的に、データがGoogleが期待するフォーマットではなかったため、取り込めなかったのです。

ここで貴重な教訓を学びました。最初からGoogle Gen App Builderのドキュメントガイド全体をchatGPTに提供すべきだったのです。

chatGPTに実際のドキュメントガイドを提供する

Google Cloudのドキュメントガイド全体を単純に「コピー&ペースト」してchatGPTに渡し、データを.XMLから必要な.HTMLと.JSON Lineフォーマットに変換するPythonコードを書いてもらいました。今回は、chatGPTが最終的なフォーマットとテンプレートを理解しているので、生成されたコードはアップロード時のエラーがはるかに少なく、はるかにうまく動きました。

3. Pythonの一般的な知識があると助かります

私はPythonに関しては非常に初心者なので、実際のコーディングのほとんどをchatGPTに頼る必要があります。しかし、Pythonの一般的な知識があると非常に助かります。なぜなら、chatGPTに何をしてもらうべきかがわかるからです。非常に強力ですが、あなたが知らないことやあなたの開発環境を知りません。

例えば、chatGPTが生成するPythonコードは「shebang」行を省略することがよくあります。私はそれを知っているので、chatGPTにその行をコードに含めるよう頼むことがよくあります。また、chatGPTがコマンドラインで何かをするよう指示する際にも、その理由がおおまかにわかります。

4. 2023年10月アップデート

この投稿を公開して以来、OpenAI APIを使って自分のチャットボットを構築することができました。このチャットボットでは、2023年9月末までのブログの全履歴コンテンツとやり取りできます。最大の利点は、同じトピックに関する複数の投稿にわたるコンテンツを統合できることで、これが既製ソリューションでの最大の問題でした。チャットボットはこちらで直接お試しいただくか、「コーディング経験ゼロで自分のチャットボットを作った方法:学んだ教訓」の投稿もご覧ください。

以上です。Gen AIでチャットボットを構築してみたことはありますか?ぜひ体験を聞かせてください :)

よろしくお願いします、Chandler

続きを読む

私の歩み
つながる
言語
設定