Skip to content
··1分で読めます

ズルしました:Sydneyが10-Kレポートのナラティブを読めるようになりました

戦略的にスコープを7社に限定することで、Big Techの年次報告書10年分のナラティブコンテンツをSydneyが読めるようにスケールさせました。コストと機能のバランスの取り方をご紹介します。

更新(2026年): この機能は廃止されました。SydneyにはS&P 500や10-K分析の機能はもうありません。Sydneyは現在、ブログコンテンツと製品にフォーカスしています。現在のSydneyを試す →


SydneyのMVP版をローンチしてから約1ヶ月後、Sydneyが「Magnificent 7」テック企業の過去10年分の年次報告書(10-K)の記述コンテンツを深く読み込めるようになったことをお知らせできてうれしいです!(Apple、Amazon、Alphabet、Facebook/Meta、Microsoft、Nvidia、Teslaです。) 以前、SydneyはS&P 500全体の財務ファクトと数値にのみ回答が限定されており、レポートのナラティブセクションを解釈できませんでした。このアップグレードには、チャンクサイズ、エンベディング次元、ベクトルストアに含まれるレポートの量のバランスを取るための戦略が必要でした。 そうです、このバージョンでは少し「ズル」をしました :P

以下がその方法です:

  1. スコープの絞り込み: S&P 500の全500社をカバーする代わりに、7つの主要企業のみをベクトルストアに追加しました。
  2. 10Kレポートのみ: 過去10年分の年次報告書(10K)のみを含め、四半期報告書(10Q)はスキップしました。結果は?ベクトルストアに約70万のデータオブジェクト。四半期報告書を追加すると数が急増します(月額コストもそれに応じて増加します)。
  3. テキストエンベディング: OpenAIの「text-embedding-3-small」モデル、512次元で落ち着きました。
    • なぜ「text-embedding-3-large」を使わないのか?コストの差は10倍以上です!現在の設定でハイブリッド検索の品質は十分に良さそうです。
    • なぜ1024や1536次元にしないのか?やはりコストの問題です。512次元なら月額のベクトルストア費用を合理的に保てます。
  4. このタスク専用の新しいツール: これら7社の年次報告書のナラティブコンテンツ専用のツールをSydneyに装備しました。S&P 500全体のハードデータが欲しい場合は、別のツールで引き続き取得できます。

新しいツールにより、Sydneyは以下のような質問に答えられるようになりました:

  • 「Nvidiaは昨年のチップアーキテクチャについて何を議論しましたか?」
  • 「Appleは2022年にiPhoneの主要な競合を特定しましたか?」
  • 「Microsoftは過去5年間でAzureの競争についてどのように説明してきましたか?」

すべての回答は10Kレポート自体のコンテンツに基づいています。

ぜひ試してみて、感想を聞かせてください。どの企業の10-Kナラティブが最も気になりますか?

よろしくお願いします、Chandler

次の展開: この頃、マルチエージェントフレームワークの探求も始めました。CrewAIにはポッドキャスト生成で感銘を受け、最終的にDIALOGUEになりました。

続きを読む

私の歩み
つながる
言語
設定