Ich habe geschummelt: Sydney kann jetzt die Erzählung in 10-K-Berichten lesen
Ich habe Sydney skaliert, um 10 Jahre Erzählinhalt aus den Jahresberichten der Tech-Giganten zu lesen, indem ich den Umfang strategisch auf 7 Unternehmen begrenzt habe – so habe ich Kosten gegen Leistungsfähigkeit abgewogen.
Update (2026): Diese Funktion wurde eingestellt. Sydney hat keine S&P 500- oder 10-K-Analysefähigkeiten mehr. Sydney konzentriert sich jetzt auf Blog-Inhalte und Produkte. Die aktuelle Sydney ausprobieren →
Etwa einen Monat nach dem Launch von Sydneys MVP-Version freue ich mich mitteilen zu können, dass Sydney nun tief in die schriftlichen Inhalte der Jahresberichte (10-K) der "Magnificent 7" Tech-Unternehmen aus dem letzten Jahrzehnt eintauchen kann! (Das sind Apple, Amazon, Alphabet, Facebook/Meta, Microsoft, Nvidia und Tesla.) Zuvor war Sydney darauf beschränkt, nur bei Finanzkennzahlen und -zahlen für den gesamten S&P 500 zu antworten, konnte aber die Erzählabschnitte der Berichte nicht interpretieren. Dieses Upgrade erforderte etwas Strategie, um Chunk-Größe, Embedding-Dimensionen und das schiere Volumen der im Vector Store enthaltenen Berichte abzuwägen. Also ja, ich habe in dieser Version ein bisschen "geschummelt" :P.
So habe ich es zum Laufen gebracht:
- Fokussierter Umfang: Anstatt alle 500 S&P 500-Unternehmen abzudecken, habe ich nur sieben Schlüsselakteure zum Vector Store hinzugefügt.
- Nur 10K-Berichte: Ich habe nur Jahresberichte (10Ks) der letzten 10 Jahre aufgenommen und Quartalsberichte (10Q) ausgelassen. Das Ergebnis? Fast 700.000 Datenobjekte im Vector Store. Wenn ich Quartalsberichte hinzufügen würde, würde die Zahl in die Höhe schießen (und die monatlichen Kosten würden entsprechend steigen).
- Text Embedding: Ich habe mich für das "text-embedding-3-small"-Modell von OpenAI mit einer 512-Dimension entschieden.
- Warum nicht "text-embedding-3-large" verwenden? Der Kostenunterschied ist über zehnmal so hoch! Und die Hybrid Search-Qualität scheint mit dem aktuellen Setup gut genug zu sein.
- Warum nicht für 1024 oder 1536 Dimensionen gehen? Auch hier spielen die Kosten eine Rolle. 512 Dimensionen halten die monatlichen Vector Store-Kosten in einem vertretbaren Rahmen.
- Ein neues Tool speziell für diese Aufgabe: Ich habe Sydney mit einem Tool ausgestattet, das spezifisch für den Erzählinhalt der Jahresberichte dieser sieben Unternehmen ist. Wenn du also harte Zahlen für den gesamten S&P 500 möchtest, kannst du sie weiterhin über ein separates Tool erhalten.
Mit dem neuen Tool kann Sydney jetzt Fragen beantworten wie:
- "What did Nvidia discuss about their chip architecture last year?"
- "Did Apple identify any key iPhone competitors in 2022?"
- "How has Microsoft described Azure competition over the past 5 years?"
Alle Antworten basieren auf Inhalten direkt aus den 10K-Berichten selbst.
Also probier es aus und lass mich wissen, was du denkst? Über welche Unternehmens-10-K-Erzählung bist du am neugierigsten?
Viele Grüße,
Chandler
Was als Nächstes kam: Rund um diese Zeit begann ich auch Multi-Agent-Frameworks zu erkunden – CrewAI beeindruckte mich für die Podcast-Generierung, was schließlich zu DIALØGUE wurde.





