속임수를 썼습니다: Sydney가 이제 10-K 보고서의 서사를 읽을 수 있습니다

업데이트 (2026): 이 기능은 폐기되었습니다. Sydney는 더 이상 S&P 500 또는 10-K 분석 기능을 갖추고 있지 않습니다. Sydney는 이제 블로그 콘텐츠와 제품에 집중합니다. 현재 Sydney 사용해보기 →

Sydney의 MVP 버전 출시 약 한 달 후, Sydney가 이제 "Magnificent 7" 기술 기업의 지난 10년간 연간 보고서(10-K)의 서면 콘텐츠에 깊이 뛰어들 수 있다는 것을 기쁘게 공유합니다! (Apple, Amazon, Alphabet, Facebook/Meta, Microsoft, Nvidia, Tesla입니다.) 이전에 Sydney는 전체 S&P 500에 대한 재무 사실과 숫자에만 답할 수 있었지만, 보고서의 서사 섹션을 해석할 수 없었습니다. 이번 업그레이드는 청크 크기, 임베딩 차원, 벡터 저장소에 포함된 보고서의 순전한 양의 균형을 맞추는 전략적 접근이 필요했습니다. 네, 이 버전에서는 약간 "속임수"를 쓴 것이 맞습니다 :P.

작동하게 만든 방법은 다음과 같습니다:

집중된 범위: S&P 500의 500개 기업 모두를 커버하는 대신, 벡터 저장소에 7개 핵심 기업만 추가했습니다.
10K 보고서만: 지난 10년간의 연간 보고서(10K)만 포함하고 분기별(10Q) 보고서는 건너뛰었습니다. 결과는? 벡터 저장소에 거의 700,000개의 데이터 객체입니다. 분기별 보고서를 추가하면 숫자가 급증할 것입니다 (그에 따라 월 비용도 증가합니다).
텍스트 임베딩: OpenAI의 "text-embedding-3-small" 모델, 512 차원으로 결정했습니다.
- 왜 "text-embedding-3-large"를 사용하지 않았나요? 비용 차이가 10배 이상입니다! 그리고 현재 설정으로 하이브리드 검색 품질이 충분히 좋아 보입니다.
- 왜 1024 또는 1536 차원으로 하지 않았나요? 역시 비용이 문제입니다. 512 차원으로 월 벡터 저장소 비용을 합리적으로 유지합니다.
이 작업을 위한 새로운 도구: Sydney에게 이 7개 기업의 연간 보고서의 서사 콘텐츠에 특화된 도구를 제공했습니다. 전체 S&P 500에 대한 실질적인 숫자를 원하시면 별도의 도구를 통해 여전히 얻을 수 있습니다.

새로운 도구로 Sydney는 이제 다음과 같은 질문에 답할 수 있습니다:

"Nvidia가 지난해 칩 아키텍처에 대해 무엇을 논의했나요?"
"Apple이 2022년에 주요 iPhone 경쟁사를 식별했나요?"
"Microsoft가 지난 5년간 Azure 경쟁을 어떻게 설명해왔나요?"

모든 답변은 10K 보고서의 콘텐츠에 직접 기반합니다.

한번 사용해보시고 어떻게 생각하시는지 알려주세요. 어떤 기업의 10-K 서사가 가장 궁금하신가요?

감사합니다,

Chandler

다음에 한 일: 이 즈음에 멀티 에이전트 프레임워크도 탐색하기 시작했습니다 — CrewAI가 인상적이었으며 팟캐스트 생성에 사용되었고, 결국 DIALØGUE가 되었습니다.

속임수를 썼습니다: Sydney가 이제 10-K 보고서의 서사를 읽을 수 있습니다

계속 읽기

적은 것이 더 많은 것이다

CrewAI는 훌륭합니다! - 첫인상 정리

S&P500 에이전트 MVP 출시: SEC 데이터 기반 금융 질문 답변

현재 챗봇 업그레이드

챗봇 v2.10 공개: 향상된 속도, 확장성, 단순성으로 사용자 경험 한 단계 높이기

AI 에이전트로 코딩 수렁에서 빠져나온 방법