Eu trapaceei: Sydney agora consegue ler a narrativa nos relatórios 10-K
Escalei Sydney para ler 10 anos de conteúdo narrativo dos relatórios anuais das Big Techs limitando estrategicamente o escopo a 7 empresas — veja como equilibrei custo versus capacidade.
Atualização (2026): Este recurso foi encerrado. Sydney não tem mais capacidades de análise do S&P 500 ou de 10-K. Sydney agora foca em conteúdo de blog e produtos. Experimente a Sydney atual →
Cerca de um mês após lançar a versão MVP de Sydney, fico animado em compartilhar que Sydney agora pode mergulhar fundo no Conteúdo Escrito dos relatórios anuais (10-K) das "Magnificent 7" empresas de tecnologia da última década! (São Apple, Amazon, Alphabet, Facebook/Meta, Microsoft, Nvidia e Tesla.) Antes, Sydney estava limitada a responder apenas sobre fatos e números financeiros para todo o S&P 500, mas não conseguia interpretar as seções narrativas dos relatórios. Este upgrade exigiu alguma estratégia, equilibrando tamanho de chunk, dimensões de embedding e o volume enorme de relatórios incluídos no vector store. Então, sim, "trapaceei" um pouco nesta versão :P.
Veja como fiz funcionar:
- Escopo Focado: Em vez de cobrir todas as 500 empresas do S&P 500, adicionei apenas sete players principais ao vector store.
- Somente Relatórios 10K: Incluí apenas relatórios anuais (10Ks) dos últimos 10 anos, pulando relatórios trimestrais (10Q). O resultado? Quase 700.000 objetos de dados no vector store. Se eu adicionasse relatórios trimestrais, o número dispararia (e o custo mensal aumentaria proporcionalmente).
- Embedding de texto: Optei pelo modelo "text-embedding-3-small" da OpenAI, com dimensão 512.
- Por que não usar "text-embedding-3-large"? A diferença de custo é mais de dez vezes! E a qualidade da busca híbrida parece boa o suficiente com a configuração atual.
- Por que não ir para 1024 ou 1536 dimensões? Novamente, os custos entram em jogo. 512 dimensões mantêm as despesas mensais com vector store razoáveis.
- Uma Nova Ferramenta Específica Para Esta Tarefa: Equipei Sydney com uma ferramenta específica para o conteúdo narrativo dos relatórios anuais dessas sete empresas. Então, se você quiser números exatos para todo o S&P 500, ainda pode obtê-los por meio de uma ferramenta separada.
Com a nova ferramenta, Sydney agora pode responder perguntas como:
- "O que a Nvidia discutiu sobre sua arquitetura de chips no ano passado?"
- "A Apple identificou algum concorrente principal do iPhone em 2022?"
- "Como a Microsoft descreveu a concorrência do Azure nos últimos 5 anos?"
Todas as respostas são fundamentadas no conteúdo diretamente dos próprios relatórios 10K.
Então experimenta e me diz o que acha? Sobre qual narrativa de 10-K de empresa você tem mais curiosidade?
Abraços,
Chandler
O que veio a seguir: Por volta dessa época, também comecei a explorar frameworks multi-agente — o CrewAI me impressionou para geração de podcast, o que eventualmente se tornou DIALØGUE.





