Skip to content
··2 min de leitura

Eu trapaceei: Sydney agora consegue ler a narrativa nos relatórios 10-K

Escalei Sydney para ler 10 anos de conteúdo narrativo dos relatórios anuais das Big Techs limitando estrategicamente o escopo a 7 empresas — veja como equilibrei custo versus capacidade.

Atualização (2026): Este recurso foi encerrado. Sydney não tem mais capacidades de análise do S&P 500 ou de 10-K. Sydney agora foca em conteúdo de blog e produtos. Experimente a Sydney atual →


Cerca de um mês após lançar a versão MVP de Sydney, fico animado em compartilhar que Sydney agora pode mergulhar fundo no Conteúdo Escrito dos relatórios anuais (10-K) das "Magnificent 7" empresas de tecnologia da última década! (São Apple, Amazon, Alphabet, Facebook/Meta, Microsoft, Nvidia e Tesla.) Antes, Sydney estava limitada a responder apenas sobre fatos e números financeiros para todo o S&P 500, mas não conseguia interpretar as seções narrativas dos relatórios. Este upgrade exigiu alguma estratégia, equilibrando tamanho de chunk, dimensões de embedding e o volume enorme de relatórios incluídos no vector store. Então, sim, "trapaceei" um pouco nesta versão :P.

Veja como fiz funcionar:

  1. Escopo Focado: Em vez de cobrir todas as 500 empresas do S&P 500, adicionei apenas sete players principais ao vector store.
  2. Somente Relatórios 10K: Incluí apenas relatórios anuais (10Ks) dos últimos 10 anos, pulando relatórios trimestrais (10Q). O resultado? Quase 700.000 objetos de dados no vector store. Se eu adicionasse relatórios trimestrais, o número dispararia (e o custo mensal aumentaria proporcionalmente).
  3. Embedding de texto: Optei pelo modelo "text-embedding-3-small" da OpenAI, com dimensão 512.
    • Por que não usar "text-embedding-3-large"? A diferença de custo é mais de dez vezes! E a qualidade da busca híbrida parece boa o suficiente com a configuração atual.
    • Por que não ir para 1024 ou 1536 dimensões? Novamente, os custos entram em jogo. 512 dimensões mantêm as despesas mensais com vector store razoáveis.
  4. Uma Nova Ferramenta Específica Para Esta Tarefa: Equipei Sydney com uma ferramenta específica para o conteúdo narrativo dos relatórios anuais dessas sete empresas. Então, se você quiser números exatos para todo o S&P 500, ainda pode obtê-los por meio de uma ferramenta separada.

Com a nova ferramenta, Sydney agora pode responder perguntas como:

  • "O que a Nvidia discutiu sobre sua arquitetura de chips no ano passado?"
  • "A Apple identificou algum concorrente principal do iPhone em 2022?"
  • "Como a Microsoft descreveu a concorrência do Azure nos últimos 5 anos?"

Todas as respostas são fundamentadas no conteúdo diretamente dos próprios relatórios 10K.

Então experimenta e me diz o que acha? Sobre qual narrativa de 10-K de empresa você tem mais curiosidade?

Abraços,

Chandler

O que veio a seguir: Por volta dessa época, também comecei a explorar frameworks multi-agente — o CrewAI me impressionou para geração de podcast, o que eventualmente se tornou DIALØGUE.

Continuar Lendo

Minha Jornada
Conectar
Idioma
Preferências