1주일 리뷰: Google Gen App Builder와의 경험과 배움
Google의 Gen App Builder를 1주일간 테스트하면서 더 나은 챗봇 응답의 핵심을 발견했습니다: 비정형 데이터를 제공하고 chatGPT를 사용하여 450개 이상의 블로그 글을 올바른 형식으로 변환하는 것입니다.
이 글은 2023에 작성되었습니다. 이후 일부 내용이 달라졌을 수 있습니다.
2026년 2월 업데이트
Google Gen App Builder 챗봇은 이 사이트에서 더 이상 활성화되어 있지 않습니다. 아래에 설명하는 불만 사항들—콘텐츠 종합의 부족, 오래된 응답—이 바로 제가 직접 만들게 된 계기입니다. 여러 반복(Google의 에이전트, OpenAI API, LangChain, Weaviate)을 거친 후, 결국 Sydney라는 AI 어시스턴트를 완성했는데, 이것은 제가 항상 원했던 것을 해냅니다: 486개 블로그 글을 종합하고 제 목소리로 답변합니다.
2023년 9월의 원본 글은 맥락을 위해 아래에 보존되어 있습니다.
지난주에 Google Gen App Builder를 사용하여 블로그에 챗봇을 빠르게 배포했습니다. 전체 과정이 얼마나 빠르고 쉬운지(그리고 무료 크레딧 — 좋아합니다) 좋아하지만, 챗봇에는 몇 가지 개선이 필요한 부분이 있으며 가장 큰 것은 챗봇이 이전 콘텐츠와 단순히 매칭하는 것이 아니라 여러 글에 걸쳐 콘텐츠를 "종합"하도록 하는 방법입니다. 현실적인 기대인지 모르겠지만, 시도해 보겠습니다.
그리고 조금 다뤄본 후 배운 것들입니다:
1. 콘텐츠를 비정형 데이터로 봇에 추가하면 도움이 되는 것 같습니다
이것이 무슨 뜻일까요? Google의 크롤러가 라이브 웹사이트를 인덱싱하는 것 외에도, "Data store"를 사용하여 모든 콘텐츠를 봇에 추가할 수 있습니다.
데이터 스토어가 생성된 후, Agent settings에서 챗봇에 새 스토어를 추가할 수 있습니다
이 작업을 한 후, 챗봇의 답변이 훨씬 나아진 것을 발견했습니다. 콘텐츠에 대해 훨씬 더 "알고 있는" 것 같습니다.
Google은 여기에서 "Unstructured data store"와 "Upload with metadata" 아래에 가이드를 제공합니다.
에... 그런데 450개 이상의 블로그 글을 JSON Line 파일을 포함한 필요한 형식으로 어떻게 변환할까요? :P
2. 데이터 정리와 준비를 위한 chatGPT
저는 기술적인 사람이 아니므로 (아직은요 :D) 할 수 있는 것은 WordPress에서 블로그 콘텐츠를 .XML 파일로 내보내는 것뿐이었습니다. 데이터를 필요한 형식으로 정리하고 준비하는 코드를 위해 chatGPT에 의존해야 했습니다.
이런 점에서 chatGPT가 마음에 드는데, "커스텀 지시사항"을 통해 chatGPT가 제 상황에 대한 기본적인 이해를 가지고 매우 상세한 단계별 가이드를 제공할 수 있기 때문입니다.
처음으로 chatGPT와 함께 .XML 파일을 .HTML과 .Json Line 형식으로 변환하려고 했을 때, 이렇게 작성했습니다 "이 블로그는 WordPress를 사용합니다. WordPress를 사용하여 게시된 모든 글을 내보낼 수 있습니다. 대규모 언어 모델을 훈련하는 데 사용할 수 있도록 데이터를 준비해야 합니다. 이 데이터를 준비하려면 어떻게 해야 하나요?"
모든 단계를 따르고, chatGPT가 제공한 관련 스크립트를 사용하고, Gen App Builder에 데이터를 업로드한 후, 많은 오류가 발생했습니다. 기본적으로 데이터가 Google이 기대하는 형식이 아니어서 데이터를 인식/통합할 수 없었습니다.
그래서 여기서 귀중한 교훈을 배웠습니다. 처음부터 Google Gen App Builder의 전체 문서 가이드를 chatGPT에게 제공했어야 했습니다.
chatGPT에 실제 문서 가이드를 제공하기
Google Cloud의 전체 문서 가이드를 chatGPT에 "복사 붙여넣기"하고 .XML에서 필요한 .HTML 및 .JSON line 형식으로 데이터를 변환할 수 있도록 Python 코드를 작성해 달라고 요청했습니다. 이번에는 chatGPT가 최종 형식과 템플릿을 이해하기 때문에, 생성되는 코드가 업로드 시 오류가 훨씬 적어 훨씬 잘 작동합니다.
3. Python에 대한 일반 지식이 도움이 됩니다
저는 Python에 있어서 매우 초보이므로 실제 코딩의 대부분을 chatGPT에 의존해야 합니다. 하지만 Python에 대한 일반 지식은 ChatGPT에게 무엇을 하라고 요청해야 하는지 알기 때문에 엄청나게 도움이 됩니다. 매우 강력하지만 여러분이 모르는 것과 개발 환경을 알지 못합니다.
예를 들어, chatGPT가 생성하는 Python 코드에는 종종 "shebang" 라인이 빠져있습니다. 이것에 대해 알고 있기 때문에, 자주 chatGPT에게 코드에 그 라인을 포함해 달라고 요청합니다. 또한 chatGPT가 명령줄을 사용하여 무언가를 하라고 요청할 때, 왜인지 대략적으로 알 수 있습니다.
4. 2023년 10월 업데이트
이 글을 게시한 후, OpenAI API를 사용하여 직접 챗봇을 구축했습니다. 이 챗봇은 2023년 9월 말까지의 블로그의 모든 역사적 콘텐츠와 상호작용할 수 있습니다. 가장 큰 장점은 같은 주제에 대한 여러 글의 콘텐츠를 종합할 수 있다는 것이며, 이것은 기성 솔루션에 대한 제 가장 큰 문제점이었습니다. 챗봇을 여기에서 직접 확인하거나 "코딩 경험 없이 나만의 챗봇을 만든 방법: 배운 교훈"에 대한 글을 확인해 보세요.
여기까지입니다. Gen AI로 챗봇을 만들어 본 적이 있으신가요? 여러분의 경험을 듣고 싶습니다 :)
감사합니다,
Chandler








