Hice trampa: Sydney ahora puede leer la narrativa en los informes 10-K
Escalé Sydney para leer 10 años de contenido narrativo de los informes anuales de las Big Tech limitando estratégicamente el alcance a 7 empresas — así es como equilibré coste vs. capacidad.
Actualización (2026): Esta función ha sido retirada. Sydney ya no tiene capacidades de análisis del S&P 500 o de informes 10-K. Sydney ahora se centra en el contenido del blog y los productos. Prueba el Sydney actual →
Aproximadamente un mes después de lanzar la versión MVP de Sydney, me alegra compartir que Sydney ahora puede sumergirse profundamente en el Contenido Escrito de los informes anuales (10-K) de las empresas tecnológicas "Magnificent 7" de la última década. (Eso es Apple, Amazon, Alphabet, Facebook/Meta, Microsoft, Nvidia y Tesla.) Antes, Sydney estaba limitado a responder solo sobre hechos y cifras financieras para todo el S&P 500, pero no podía interpretar las secciones narrativas de los informes. Esta mejora requirió algo de estrategia, equilibrando el tamaño del chunk, las dimensiones de embedding y el volumen total de informes incluidos en el vector store. Así que sí, hice "trampa" un poco en esta versión :P.
Así es como lo hice funcionar:
- Alcance enfocado: En lugar de cubrir las 500 empresas del S&P 500, agregué solo siete actores clave al vector store.
- Solo informes 10K: Incluí solo informes anuales (10K) de los últimos 10 años, omitiendo los informes trimestrales (10Q). ¿El resultado? Casi 700.000 objetos de datos en el vector store. Si agregara informes trimestrales, el número se dispararía (y el coste mensual aumentaría en consecuencia).
- Embedding de texto: Me decidí por el modelo "text-embedding-3-small" de OpenAI, con una dimensión de 512.
- ¿Por qué no usar "text-embedding-3-large"? ¡La diferencia de coste es de más de diez veces! Y la calidad de la búsqueda híbrida parece suficientemente buena con la configuración actual.
- ¿Por qué no ir a 1024 o 1536 dimensiones? De nuevo, entran en juego los costes. Las 512 dimensiones mantienen los gastos mensuales del vector store razonables.
- Una nueva herramienta específica para esta tarea: Equipé a Sydney con una herramienta específica para el contenido narrativo de los informes anuales de estas siete empresas. Así que si quieres cifras exactas para todo el S&P 500, puedes seguir obteniéndolas a través de una herramienta separada.
Con la nueva herramienta, Sydney ahora puede responder preguntas como:
- "¿Qué discutió Nvidia sobre su arquitectura de chips el año pasado?"
- "¿Identificó Apple algún competidor clave del iPhone en 2022?"
- "¿Cómo ha descrito Microsoft la competencia de Azure en los últimos 5 años?"
Todas las respuestas están fundamentadas en el contenido directamente de los propios informes 10K.
¿Lo pruebas y me dices qué piensas? ¿Sobre qué narrativa de 10-K de qué empresa tienes más curiosidad?
Un abrazo,
Chandler
Lo que vino después: Alrededor de esta época también empecé a explorar frameworks multi-agente — CrewAI me impresionó para la generación de podcasts, que eventualmente se convirtió en DIALØGUE.





