Nandaya Ako: Kaya Na Ni Sydney Basahin ang Narrative sa 10-K Reports
In-scale ko si Sydney para mabasa ang 10 taon ng narrative content mula sa mga annual reports ng Big Tech sa pamamagitan ng strategic na paglilimita ng saklaw sa 7 kumpanya—narito kung paano ko binalanse ang gastos vs kakayahan.
Update (2026): Ang feature na ito ay na-retire na. Wala nang S&P 500 o 10-K analysis capabilities si Sydney. Si Sydney ngayon ay nakatuon sa blog content at mga produkto. Subukan ang kasalukuyang Sydney →
Halos isang buwan pagkatapos i-launch ang MVP version ni Sydney, excited akong ibahagi na kaya na ngayon ni Sydney na sumisid nang malalim sa Written Content ng annual reports (10-K) ng "Magnificent 7" tech companies mula sa nakaraang dekada! (Iyon ay ang Apple, Amazon, Alphabet, Facebook/Meta, Microsoft, Nvidia at Tesla.) Dati, limitado lang si Sydney sa pagsagot tungkol sa financial facts at mga numero para sa buong S&P 500, pero hindi niya mai-interpret ang narrative sections ng mga reports. Ang upgrade na ito ay nangailangan ng kaunting strategizing, pagbabalanse ng chunk size, embedding dimensions, at ang dami ng mga reports na kasama sa vector store. Kaya, oo, medyo "nandaya" ako sa version na ito :P.
Narito kung paano ko ito ginawa:
- Nakatuon na Saklaw: Sa halip na saklawin ang lahat ng 500 S&P 500 companies, pitong key players lang ang idinagdag ko sa vector store.
- 10K Reports Lang: Annual reports (10Ks) lang sa nakaraang 10 taon ang isinama ko, nilaktawan ang quarterly (10Q) reports. Ang resulta? Halos 700,000 data objects sa vector store. Kung idinagdag ko ang quarterly reports, tataas nang husto ang bilang (at ang buwanang gastos ay tataas din).
- Text embedding: Nagsettle ako sa "text-embedding-3-small" model mula sa OpenAI, na may 512-dimension.
- Bakit hindi gumamit ng "text-embedding-3-large"? Mahigit sampung beses ang pagkakaiba ng gastos! At mukhang sapat na ang hybrid search quality sa kasalukuyang setup.
- Bakit hindi pumunta sa 1024 o 1536 dimensions? Muli, pumasok ang mga gastos. Ang 512 dimensions ay nagpapanatili ng makatuwirang buwanang gastos ng vector store.
- Isang Bagong Tool Para Sa Gawaing Ito: Nilagyan ko si Sydney ng tool na specific sa narrative content ng annual reports ng pitong kumpanyang ito. Kaya kung gusto mo ng mga hard numbers para sa buong S&P 500, maaari mo pa ring makuha ang mga ito sa pamamagitan ng hiwalay na tool.
Sa bagong tool, kaya na ni Sydney sumagot ng mga tanong tulad ng:
- "Ano ang tinalakay ng Nvidia tungkol sa kanilang chip architecture noong nakaraang taon?"
- "Natukoy ba ng Apple ang anumang key iPhone competitors noong 2022?"
- "Paano inilarawan ng Microsoft ang Azure competition sa nakaraang 5 taon?"
Lahat ng sagot ay naka-ground sa content direkta mula sa mismong 10K reports.
Kaya subukan mo at sabihin mo sa akin kung ano ang tingin mo? Anong 10-K narrative ng kumpanya ang pinaka-curious ka?
Maraming salamat,
Chandler
Ano ang sumunod: Sa panahon ding ito nagsimula akong mag-explore ng multi-agent frameworks — na-impress ako ng CrewAI para sa podcast generation, na kalaunan ay naging DIALOGUE.





