Escrevo semanalmente para lhe ajudar a utilizar linguagem de programação na análise de dados financeiros, estratégias de investimento quantitativas e as melhores práticas para manipulação e visualização de dados. Para que você possa ter conhecimento e ferramentas quantitativas e reproduzir análises quantitativas de forma independente.
|
Olá, Reader! Bem-vindo(a) de volta à nossa jornada de exploração quantitativa! Na Edição #2 vimos como acessar um dataset utilizando a função Posto isso, para simplificar o acesso aos dados e para trazer um pouco de semântica para a utilização do pacote, foram criados algumas funções helpers para tornar a vida dos usuários menos miserável. Pra mim é inconveniente acessar diretamente o dataset e me preocupar em definir qual camada de dados deve ser utilizada. Com isso em mente, eu criei algumas funções que entregam de forma mais direta os dados que eu quero obter. Abaixo está uma tabela que associa alguns templates com suas respectivas funções helper: Todas as funções helper retornam um objeto Arrow que representa o dataset. Por exemplo, vamos ver o objeto retornado pela função Este objeto pode ser usado com os verbos do dplyr para a realização de operações de filtragem, seleção de colunas, agrupamentos, ordenação e outras mais. Na saída do código fica evidente que o objeto Arrow retornado gerado representa uma query que tem 4 colunas na saída. As colunas de saída são definidas pelo comando Essa operação ainda não carrega os dados na memória; é um exemplo da lazy evaluation utilizada pelo engine do Arrow. Para executar essa consulta e obter um dataset com todos preços de ajuste dos contratos futuros de DI1 para a data 10/10/2025 podemos utiliza as funções:
Vamos utilizar a função Uma vantagem da utilização de objetos Ao conectar templates a funções helper, o rb3 entrega um caminho mais direto entre “o que existe” e “o que você precisa analisar”. Em vez de navegar pelas camadas e schemas manualmente, você opera em uma API semântica — Os padrões mostrados aqui formam um “contrato” simples e eficiente: filtrar e projetar o mínimo necessário no lado do dataset; e coletar só na borda, quando for realmente preciso materializar resultados. Isso preserva performance, reduz acoplamento com detalhes de ingestão e mantém o foco onde importa: decisão quantitativa. Na próxima edição, vamos utilizar este dataset de contratos futuros para obter a estrutura a termo de taxas de juros implícitas nos preços de ajuste dos contratos futuros. A partir daqui você verá como seu data lake local vira um motor de pesquisa financeira: previsível, escalável e pronto para experimentação. |
Escrevo semanalmente para lhe ajudar a utilizar linguagem de programação na análise de dados financeiros, estratégias de investimento quantitativas e as melhores práticas para manipulação e visualização de dados. Para que você possa ter conhecimento e ferramentas quantitativas e reproduzir análises quantitativas de forma independente.