J
J'ai mis Sydney à l'échelle pour lire 10 ans de contenu narratif des rapports annuels des grandes entreprises tech en limitant stratégiquement la portée à 7 entreprises — voici comment j'ai équilibré coût et capacité.
Mise à jour (2026) : Cette fonctionnalité a été retirée. Sydney n'a plus de capacités d'analyse du S&P 500 ou des rapports 10-K. Sydney se concentre maintenant sur le contenu du blog et les produits. Essaie le Sydney actuel →
Environ un mois après le lancement de la version MVP de Sydney, je suis ravi de partager que Sydney peut maintenant plonger en profondeur dans le contenu écrit des rapports annuels (10-K) des 7 entreprises tech "Magnifiques" de la dernière décennie ! (C'est Apple, Amazon, Alphabet, Facebook/Meta, Microsoft, Nvidia et Tesla.) Avant, Sydney était limité à répondre uniquement sur les faits et chiffres financiers pour l'ensemble du S&P 500, mais il ne pouvait pas interpréter les sections narratives des rapports. Cette mise à niveau a nécessité une certaine stratégie, équilibrant la taille des chunks, les dimensions d'embedding et le volume considérable de rapports inclus dans le magasin vectoriel. Alors, oui, j'ai un peu "triché" dans cette version :P.
Voici comment je l'ai fait fonctionner :
- Portée focalisée : Au lieu de couvrir toutes les 500 entreprises du S&P 500, j'ai ajouté seulement sept acteurs clés au magasin vectoriel.
- Rapports 10K uniquement : J'ai inclus uniquement les rapports annuels (10K) des 10 dernières années, en sautant les rapports trimestriels (10Q). Le résultat ? Près de 700 000 objets de données dans le magasin vectoriel. Si j'ajoutais les rapports trimestriels, le nombre monterait en flèche (et le coût mensuel augmenterait en conséquence).
- Embedding de texte : J'ai opté pour le modèle "text-embedding-3-small" d'OpenAI, avec une dimension de 512.
- Pourquoi ne pas utiliser "text-embedding-3-large" ? La différence de coût est plus de dix fois supérieure ! Et la qualité de la recherche hybride semble suffisamment bonne avec la configuration actuelle.
- Pourquoi ne pas opter pour 1024 ou 1536 dimensions ? Encore une fois, les coûts entrent en jeu. 512 dimensions maintiennent les dépenses mensuelles du magasin vectoriel raisonnables.
- Un nouvel outil spécifique à cette tâche : J'ai équipé Sydney d'un outil spécifique au contenu narratif des rapports annuels de ces sept entreprises. Donc si tu veux des chiffres précis pour l'ensemble du S&P 500, tu peux toujours les obtenir via un outil séparé.
Avec le nouvel outil, Sydney peut maintenant répondre à des questions comme :
- "Qu'est-ce que Nvidia a discuté concernant son architecture de puce l'année dernière ?"
- "Apple a-t-il identifié des concurrents clés pour l'iPhone en 2022 ?"
- "Comment Microsoft a-t-il décrit la concurrence d'Azure au cours des 5 dernières années ?"
Toutes les réponses sont ancrées dans le contenu directement issu des rapports 10K eux-mêmes.
Alors essaie-le et dis-moi ce que tu en penses ? Sur le récit du 10-K de quelle entreprise es-tu le plus curieux ?
Cordialement,
Chandler
Ce qui a suivi : À cette période, j'ai également commencé à explorer les frameworks multi-agents — CrewAI m'a impressionné pour la génération de podcasts, ce qui a finalement donné naissance à DIALØGUE.





