Esta é uma lista de recursos da qual estou sempre buscando informações, considero como materiais essenciais para meu trabalho profissional como pesquisador e analista de dados. Se você não puder ter acesso a nenhum deles, por favor, entre em contato comigo por e-mail para que eu possa tentar ajudá-lo.
Estatística
Statistical Rethinking (2019)
Este livro é escrito por Richard McElreath, fala sobre uma maneira diferente de interpretar a estatística e suas inferências. Seu site também é uma ótima fonte para palestras e posts.
The effect (2022)
O efeito é uma suave introdução à inferência causal, escrita por Nick Huntington-Klein. A primeira parte é uma introdução a toda a intuição que da base à inferência causal. A segunda parte é uma explicação de diferentes modelos estatísticos para a inferência causal. A linguagem utilizada é acessível e não há muita matemática, portanto, a leitura é mais fácil do que outros livros.
Statistical Inference as Severe Testing (2018)
Modern Statistics with R (2021)
Este é um livro que cobre muitos aspectos da aplicação de estatísticas em R. Há alguns capítulos com material básico (se você tem experiência com R, você pode ignorá-los). Após o capítulo 7, há uma grande variedade de tópicos sobre estatística, um dos meus favoritos são os capítulos que falam sobre questões éticas com inferências estatísticas. Este é um livro muito aplicado, com muitos exemplos de código em R.
Statistical Inference via Data Science (2022)
Outro livro prático, com muito código em R para aplicar técnicas de amostragem para inferências estatísticas. O que eu realmente gosto neste livro é que ele usa uma abordagem muito didática, e também aplica pacotes modernos (infer, de tidymodels) para realizar as inferências estatísticas.
Programação
R for Data Science
Este é o livro que me fez começar a prosperar em programação e análise de dados. Ele foi escrito por Hadley Wickham (uma grande referência na comunidade R). O livro é uma introdução ao uso de uma coleção de pacotes, chamada tidyverse.
Happy Git and GitHub for the useR
Este é um livro essencial para aprender controle de versão com R! É escrito por outra referência na comunidade R, Jennifer Bryan. Ela ensina como começar a integrar seus projetos de R com git e github, um recurso tão importante se você quiser produzir projetos de alta qualidade.
Advanced R
Outro livro de Hadley Wickham, mas diferente do R for Data Science, ensina habilidades específicas com R que ajuda especialmente no desenvolvimento de pacotes. Minha seção favorita é a Programação Funcional.
Mastering Spark with R
O Spark me ajudou muito quando eu precisava analisar um conjunto de dados grande, que não cabia na memória do meu computador. Embora eu tenha usado apenas uma pequena parte de toda a capacidade da Spark, foi uma grande solução para o meu problema. Espero trabalhar mais com essa ferramenta, e começar a usar conexões e aplicar algoritmos de aprendizagem da máquina com a Spark.
Visualização e comunicação de dados
Fundamentals of Data Visualization (2020)
ggplot2: Elegant Graphics for Data Analysis (2016)
Chartability
O autor de Chartability é Frank Elavsky, que é para mim uma referência na questão de acessibilidade na visualização de dados. Ele desenvolveu a Chartability que é uma metodologia para avaliar e desenvolver visualizações de dados mais acessíveis. Há também um documento que explica a criação e o uso da Chartability: How accessible is my visualization? Evaluating visualization accessibility with Chartability (2022).
Hands-On Data Visualization (2022)
Telling Stories with Data (2023)
Report Writing for Data Science in R (2019)
Modelagem
Modelling Mindsets (2022)
Este é um excelente panorama de diferentes abordagens de modelagem. Escrito por Christoph Molnar, de uma maneira muito fluida e pedagógica. Recomendo muito a leitura deste livro se você gosta de modelagem, e já tem familiaridade com estatística.
Interpretable Machine Learning (2022)
Esse é outro livro excepcional, também escrito por Christoph Molnar. Esse livro tem como objetivo apresentar formas de interpretar modelos. Alguns capítulos abordam modelos que são naturalmente mais fáceis de interpretar. Outros capitulos tratam de metodologias que podem ser aplicadas em qualquer modelo, até naqueles que são mais difíceis de serem interpretados. Uma leitura que recomendo para qualquer pessoa que trabalhe com modelagem.
The Art of Data Science (2018)
Modern Data Science with R (2021)
Tidy Modelling with R (2022)
Hands-On Machine Learning with R (2020)
Explanatory Model Analysis (2020)
Feature Engineering and Selection: A Practical Approach for Predictive Models (2019)
Interpretable Machine Learning (2022)
MLU-Explain
Análise espacial
Geocomputation with R (2023)
Satellite Image Time Series Analysis on Earth Observation Data Cubes (2022)
Spatial Data Science (2022)
Este é um livro escrito por Edzer Pebesma. Ele é uma referência para mim, no que diz respeito à manipulação de dados espaciais. Este é um livro excelente, com informações essenciais para qualquer pessoa interessada na análise de dados espaciais, e mesmo que seja focado na linguagem R, ele pode fornecer informações preciosas para usuários de qualquer tipo!