我出咗茅招:Sydney而家可以讀10-K Reports入面嘅Narrative
我scale咗Sydney嚟讀Big Tech過去十年年報嘅narrative content,策略性咁將scope限制喺7間公司——以下係我點平衡cost同capability。
更新(2026年): 呢個功能已經retired。Sydney已經冇S&P 500或10-K分析capabilities。Sydney而家專注於blog內容同產品。試而家嘅Sydney →
喺Sydney嘅MVP version launch咗大約一個月後,我好excited同大家分享Sydney而家可以deep dive入「Magnificent 7」科技公司過去十年嘅年報(10-K)嘅Written Content!(即係Apple、Amazon、Alphabet、Facebook/Meta、Microsoft、Nvidia同Tesla。) 之前,Sydney只能回答成個S&P 500嘅financial facts同numbers,但佢冇辦法interpret reports嘅narrative sections。呢次upgrade需要啲strategizing,平衡chunk size、embedding dimensions、同vector store入面包含嘅reports嘅sheer volume。 所以,係嘅,我喺呢個版本「出咗茅招」:P。
以下係我點做到:
- Focused Scope:唔cover所有500間S&P 500公司,我只加咗七間key players入vector store。
- 只有10K Reports:我只include過去10年嘅annual reports(10Ks),skip咗quarterly(10Q)reports。結果?Vector store入面接近700,000個data objects。如果我加埋quarterly reports,數字會飆升(monthly cost都會accordingly增加)。
- Text embedding:我settle on OpenAI嘅「text-embedding-3-small」model,512-dimension。
- 點解唔用「text-embedding-3-large」?Cost差距超過十倍!而且hybrid search quality用而家嘅setup似乎good enough。
- 點解唔用1024或1536 dimensions?同樣,costs嘅考慮。512 dimensions keep住monthly vector store expenses reasonable。
- 專為呢個Task嘅新Tool:我equip咗Sydney一個specific for呢七間公司annual reports narrative content嘅tool。所以如果你想要成個S&P 500嘅hard numbers,你仲可以透過另一個tool攞到。
有咗新tool,Sydney而家可以回答以下問題:
- 「Nvidia上年discuss咗乜關於佢哋嘅chip architecture?」
- 「Apple喺2022年有冇identify到key iPhone competitors?」
- 「Microsoft過去5年點describe Azure competition?」
所有答案都grounded喺10K reports本身嘅content。
所以試吓同話我知你點睇?你最curious邊間公司嘅10-K narrative?
祝好,
Chandler
之後發生咗乜: 大約呢個時間我仲開始explore multi-agent frameworks——CrewAI令我印象深刻用嚟做podcast generation,最終成為咗DIALOGUE。





