मैंने "चीट" किया: Sydney अब 10-K Reports में Narrative पढ़ सकती है
मैंने Sydney को scope को strategically 7 companies तक सीमित करके Big Tech की annual reports के 10 साल के narrative content पढ़ने के लिए scale किया — यहाँ बताता हूँ कि मैंने cost vs capability को कैसे balance किया।
Update (2026): यह feature retire हो गई है। Sydney के पास अब S&P 500 या 10-K analysis capabilities नहीं हैं। Sydney अब blog content और products पर focus करती है। Current Sydney को try करें →
Sydney का MVP version launch करने के लगभग एक महीने बाद, मुझे खुशी से share करना है कि Sydney अब पिछले एक दशक के "Magnificent 7" tech companies (Apple, Amazon, Alphabet, Facebook/Meta, Microsoft, Nvidia और Tesla) के annual reports (10-K) के Written Content में deep dive कर सकती है!
पहले, Sydney सिर्फ पूरे S&P 500 के financial facts और numbers पर answer दे सकती थी, लेकिन reports के narrative sections को interpret नहीं कर सकती थी। इस upgrade में कुछ strategizing लगी, chunk size, embedding dimensions और vector store में शामिल reports के volume को balance करते हुए।
तो, हाँ, मैंने इस version में थोड़ा "cheat" किया :P।
यहाँ बताता हूँ कि मैंने यह कैसे काम कराया:
- Focused Scope: सभी 500 S&P 500 companies cover करने के बजाय, मैंने सिर्फ सात key players को vector store में add किया।
- 10K Reports Only: मैंने सिर्फ पिछले 10 सालों के annual reports (10Ks) शामिल किए, quarterly (10Q) reports को skip करते हुए। नतीजा? Vector store में लगभग 700,000 data objects।
- Text embedding: मैंने OpenAI से "text-embedding-3-small" model settle किया, 512-dimension के साथ।
- "text-embedding-3-large" क्यों नहीं? Cost difference दस गुना से ज़्यादा है! और hybrid search quality current setup के साथ काफी good लगती है।
- 1024 या 1536 dimensions क्यों नहीं? फिर, costs play में आती हैं।
- इस Task के लिए एक New Tool: मैंने Sydney को इन सात companies के annual reports के narrative content के लिए specific tool से equipped किया।
नए tool के साथ, Sydney अब इन जैसे questions का जवाब दे सकती है:
- "Nvidia ने पिछले साल अपने chip architecture के बारे में क्या discuss किया?"
- "क्या Apple ने 2022 में कोई key iPhone competitors identify किए?"
- "पिछले 5 सालों में Microsoft ने Azure competition के बारे में कैसे describe किया?"
सभी answers 10K reports के content से directly grounded हैं।
तो इसे try करें और बताएं क्या लगा? आप किस company की 10-K narrative के बारे में सबसे ज़्यादा curious हैं?
शुभकामनाओं सहित, Chandler
आगे क्या आया: इसी समय के आसपास मैंने multi-agent frameworks explore करना भी शुरू किया — CrewAI ने मुझे impress किया podcast generation के लिए, जो eventually DIALØGUE बन गया।





