속임수를 썼습니다: Sydney가 이제 10-K 보고서의 서사를 읽을 수 있습니다
전략적으로 범위를 7개 기업으로 제한하여 Big Tech 연간 보고서의 10년간 서사 콘텐츠를 읽도록 Sydney를 확장했습니다 — 비용 대 기능의 균형을 맞춘 방법입니다.
업데이트 (2026): 이 기능은 폐기되었습니다. Sydney는 더 이상 S&P 500 또는 10-K 분석 기능을 갖추고 있지 않습니다. Sydney는 이제 블로그 콘텐츠와 제품에 집중합니다. 현재 Sydney 사용해보기 →
Sydney의 MVP 버전 출시 약 한 달 후, Sydney가 이제 "Magnificent 7" 기술 기업의 지난 10년간 연간 보고서(10-K)의 서면 콘텐츠에 깊이 뛰어들 수 있다는 것을 기쁘게 공유합니다! (Apple, Amazon, Alphabet, Facebook/Meta, Microsoft, Nvidia, Tesla입니다.) 이전에 Sydney는 전체 S&P 500에 대한 재무 사실과 숫자에만 답할 수 있었지만, 보고서의 서사 섹션을 해석할 수 없었습니다. 이번 업그레이드는 청크 크기, 임베딩 차원, 벡터 저장소에 포함된 보고서의 순전한 양의 균형을 맞추는 전략적 접근이 필요했습니다. 네, 이 버전에서는 약간 "속임수"를 쓴 것이 맞습니다 :P.
작동하게 만든 방법은 다음과 같습니다:
- 집중된 범위: S&P 500의 500개 기업 모두를 커버하는 대신, 벡터 저장소에 7개 핵심 기업만 추가했습니다.
- 10K 보고서만: 지난 10년간의 연간 보고서(10K)만 포함하고 분기별(10Q) 보고서는 건너뛰었습니다. 결과는? 벡터 저장소에 거의 700,000개의 데이터 객체입니다. 분기별 보고서를 추가하면 숫자가 급증할 것입니다 (그에 따라 월 비용도 증가합니다).
- 텍스트 임베딩: OpenAI의 "text-embedding-3-small" 모델, 512 차원으로 결정했습니다.
- 왜 "text-embedding-3-large"를 사용하지 않았나요? 비용 차이가 10배 이상입니다! 그리고 현재 설정으로 하이브리드 검색 품질이 충분히 좋아 보입니다.
- 왜 1024 또는 1536 차원으로 하지 않았나요? 역시 비용이 문제입니다. 512 차원으로 월 벡터 저장소 비용을 합리적으로 유지합니다.
- 이 작업을 위한 새로운 도구: Sydney에게 이 7개 기업의 연간 보고서의 서사 콘텐츠에 특화된 도구를 제공했습니다. 전체 S&P 500에 대한 실질적인 숫자를 원하시면 별도의 도구를 통해 여전히 얻을 수 있습니다.
새로운 도구로 Sydney는 이제 다음과 같은 질문에 답할 수 있습니다:
- "Nvidia가 지난해 칩 아키텍처에 대해 무엇을 논의했나요?"
- "Apple이 2022년에 주요 iPhone 경쟁사를 식별했나요?"
- "Microsoft가 지난 5년간 Azure 경쟁을 어떻게 설명해왔나요?"
모든 답변은 10K 보고서의 콘텐츠에 직접 기반합니다.
한번 사용해보시고 어떻게 생각하시는지 알려주세요. 어떤 기업의 10-K 서사가 가장 궁금하신가요?
감사합니다,
Chandler
다음에 한 일: 이 즈음에 멀티 에이전트 프레임워크도 탐색하기 시작했습니다 — CrewAI가 인상적이었으며 팟캐스트 생성에 사용되었고, 결국 DIALØGUE가 되었습니다.





