Livros, cursos e blogs nutritivos para cientistas de dados.

Adriano A. Santos
7 min readApr 3, 2021

--

https://www.datanami.com/2020/12/23/2021-predictions-data-science/

Olá, pessoal! Tudo bem? Eu espero que sim!

Primeiramente, eu gostaria de agradecer a vocês por todos os feedbacks do meu último post (Ciência de Dados e as coisas que não te contaram sobre migrar de área.). Inclusive este aqui é justamente por ter conversado com algumas pessoas sobre o que eu escrevi. Se você ainda não deu uma lida no anterior, passa lá! Eu acho que vale a pena conferir.

Vamos lá!

Vou compartilhar alguns livros, cursos e blogs que eu julgo fundamentais para quem deseja entrar na área de ciência de dados. E não! Eu não estou recebendo absolutamente nada para compartilhar os cursos, livros e blogs. Estou fazendo porque eu os julgos como ótimas fontes nutricionais para nós. :)

Começaremos, então, com os livros.

Quem me conhece sabe que eu adoro livros! Adoro mesmo! Sou do tipo de pessoa que compra livro por esporte. Faço uma lista de desejos, procuro novidades etc. E eu amo livros em papel. P.S: Você tem a mania de abrir o livro e cheirar? Sim? Que bom que eu não sou o único aqui…

Vou dividir as minhas dicas por fundamentos. Não é segredo para ninguém que o cientista de dados deve ter uma boa fundamentação em matemática, estatística e probabilidade, programação, inteligência artificial e conhecimentos específicos da área da qual você vai atuar — esse último aqui eu vou deixar por sua conta.

Matemática

Independentemente da atividade em que você está ou vai se inserir, existem conhecimentos de base que são importantes e comuns. Eu sempre ressalto a importância de revisar e avançar os seus conhecimentos em matemática. Eu mesmo sempre acho que minha base matemática precisa de reparos e sempre busco estudar e rever os mesmos conceitos…

  1. Linear Algebra: Um clássico. Muito elegante e com explicações precisas. https://www.amazon.com/gp/product/0536667470/ref=as_li_qf_sp_asin_il_tl?ie=UTF8&camp=1789&creative=9325&creativeASIN=0536667470&linkCode=as2&tag=theopesoudats-20&linkId=YLLIM4C4LJSOZIQR
  2. Mathematics for Machine Learning: Neste aqui, você vai desenvolver o seus conhecimentos em ML junto com os conceitos matemáticos necessários. https://www.amazon.com/Mathematics-Machine-Learning-Peter-Deisenroth/dp/110845514X/ref=as_li_ss_tl?dchild=1&keywords=calculus+machine+learning&qid=1606171788&s=books&sr=1-3&linkCode=sl1&tag=inspiredalgor-20&linkId=209ba69202a6cc0a9f2b07439b4376ca&language=en_US
  3. Deep Learning (Adaptive Computation and Machine Learning series): este aqui é lindo. Um dos meus prediletos. Acredito que você tenha que comprar este livro e ir degustando dia após dia. https://www.amazon.com/Deep-Learning-Adaptive-Computation-Machine/dp/0262035618/ref=as_li_ss_tl?dchild=1&keywords=deep+learning&qid=1606171954&s=books&sr=1-1&linkCode=sl1&tag=inspiredalgor-20&linkId=0a0c58945768a65548b639df6d1a98ed&language=en_US
  4. Schaum’s Outline of Theory and Problems of Vector Analysis and an Introduction to Tensor Analysis (Schaum’s Outlines): Como todo livro da série Schaum’s, ele é um pouco mais formal, porém vale muito a pena adquiri-lo. https://www.amazon.com/Schaums-Problems-Analysis-Introduction-Outlines/dp/0070990093
  5. How to Solve It: A New Aspect of Mathematical Method (Princeton Science Library): este livro ajudará no desenvolvimento do seu pensamento analítico e resolutivo. https://www.amazon.com/gp/product/069111966X/ref=as_li_qf_sp_asin_il_tl?ie=UTF8&camp=1789&creative=9325&creativeASIN=069111966X&linkCode=as2&tag=theopesoudats-20&linkId=L2UEM6YP3IMSDPTJ

Estatística e Probabilidade

Eu gosto muito de estatística e probabilidade. Inclusive já fui professor dessas disciplinas em cursos de graduação e pós-graduação. O que eu acho legal de verdade é o trabalho com as incertezas. E você, do que gosta na estatística e probabilidade?

  1. Como Mentir com Estatística: mesmo não sendo um livro técnico, eu o julgo como essencial para a formação do cientista de dados. https://www.amazon.com/Como-mentir-com-estat%C3%ADstica-Portuguese-ebook/dp/B01FIGE0S8
  2. Estatística: O que é, para que serve, como funciona: disparado o melhor livro para desmistificar o mundo da estatística! Eu o compraria 20x se fosse necessário. Ideal para quem está começando e para quem já tem base também. Uma linda obra. https://www.amazon.com.br/Estat%C3%ADstica-para-serve-como-funciona/dp/8537815128
  3. Think Stats: Probability and Statistics for Programmers. Como o próprio nome já revela, este é um livro muito bacana para quem está pensando em migrar da área de desenvolvimento para a área de ciência de dados. https://greenteapress.com/thinkstats/

Programação

Melhorar os seus skills sobre programação também é fundamental para o seu sucesso como cientista de dados. No seu dia-a-dia você se deparará com problemas que exigirão boa desenvoltura na programação. Então, mesmo que você não goste, saiba programar. E busque melhorar diariamente. Como posso melhorar isso? Programando todos os dias. Não tem segredo. Quanto mais você programar, melhor você ficará.

  1. Algorithm Design: os algoritmos são abordados com problemas reais. Isso facilitará o seu apropriamento do tema. https://www.amazon.com/gp/product/0321295358/ref=as_li_qf_sp_asin_il_tl?ie=UTF8&camp=1789&creative=9325&creativeASIN=0321295358&linkCode=as2&tag=theopesoudats-20&linkId=RWNF2NGYFXLBADS6
  2. Cracking the Coding Interview: 189 Programming Questions and Solutions 6th Edition. “mas Adriano… esse livro aí é para quem vai fazer entrevista de emprego para dev!”. Não, não, não. Este livro é para quem deseja se preparar para entrevistas sim, mas TAMBÉM te ajudará a entender melhor os algoritmos e as suas aplicações, sem contar que melhorará o seu skill analítico. https://www.amazon.com/Cracking-Coding-Interview-Programming-Questions/dp/0984782850
  3. Data Science do Zero Primeiras Regras com o Python: livro básico e bem estruturado sobre conceitos fundamentais para a nossa área. https://www.amazon.ca/-/fr/Science-Primeiras-Regras-Python-Portugal/dp/857608998X
  4. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython: mais um livro FUNDAMENTAL para quem almeja ser cientista de dados. Eu amo esse livro. https://www.amazon.com/Python-Data-Analysis-Wrangling-IPython-ebook/dp/B075X4LT6K
  5. Python Fluente: Programação Clara, Concisa e Eficaz: um livro antológico e escrito por um brasileiro (grande abraço, Luciano). Item indispensável para a sua biblioteca e vida. https://www.amazon.com.br/Python-Fluente-Programa%C3%A7%C3%A3o-Concisa-Eficaz/dp/857522462X

“Mas Adriano, você não colocou nada com R?”. Bem… vou colocar APENAS um e a minha motivação para o adicionar é: este livro é didaticamente fantástico! Inclusive, eu aconselho que os exemplos do mesmo sejam re-escritos em Python.

R é uma linguagem legal para análise de dados. Mas é uma linguagem (até então) limitada. Eu acho que você deve saber um pouco sobre, mas não deve investir tanto tanto tempo nela. Python é dominante por vários aspectos (isso merece um post, creio…) e, como a maioria de vocês estão começando, foque em algo que você pode evoluir com o tempo; evoluir é trabalhar desde dos aspectos de preparação dos dados até a publicação de um modelo complexo de deep learning.

Resumindo: não perca tempo com R. Podem me julgar.

Inteligência Artificial

Eu deixei o subtítulo mais genérico para ser mais prático. Tudo bem? Aqui, claro, vai depender da linha de atividade que você desejar seguir. Você quer trabalhar com processamento de linguagem natural? trabalhar com visão computacional? com sistemas preditivos? com TinyML? Então vamos lá.

  1. Introdução à Mineração de Dados — Com Aplicações em R: com Aplicações em RL. Este é o único livro em R que eu vou compartilhar. O motivo é simples: ele é MUITO didático.https://www.amazon.com.br/Introdu%C3%A7%C3%A3o-Minera%C3%A7%C3%A3o-Dados-Leandro-Augusto/dp/853528446X
  2. Redes Neurais Artificiais Para Engenharia E Ciências Aplicadas. Curso Prático. Sem dúvida um dos livros mais explicativos e didáticos que você poderá ler sobre o tema. https://www.amazon.com.br/Neurais-Artificiais-Engenharia-Ci%C3%AAncias-Aplicadas/dp/8588098539
  3. The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition (Springer Series in Statistics): Sabe aquele conceito de completo? Pronto. Ele se aplica a este livro. https://www.amazon.com/gp/product/0387848576/ref=as_li_qf_sp_asin_il_tl?ie=UTF8&camp=1789&creative=9325&creativeASIN=0387848576&linkCode=as2&tag=theopesoudats-20&linkId=JBAHDJH2SDYSVDPS
  4. Deep learning to Computer Vision: Adrian é um dos maiores nomes da área. Vale a pena conferir a sua obra: https://www.pyimagesearch.com/deep-learning-computer-vision-python-book/
  5. Data Science for Business: What You Need to Know about Data Mining and Data-Analytic: eu gosto deste livro. Gosto, principalmente, pelos exemplos práticos apresentados. https://www.amazon.ca/Data-Science-Business-Data-Analytic-Thinking/dp/1449361323
  6. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition: este aqui é bacana demais para a compreensão dos modelos clássicos. P.S: eu não gosto do TensorFlow. https://www.oreilly.com/library/view/hands-on-machine-learning/9781492032632/

Para terminar os exemplos de livros, eu gostaria de indicar um dos livros mais importantes para o desenvolvimento do meu pensamento científico:

The Design of Experiments: Statistical Principles for Practical Applications: https://www.amazon.ca/Design-Experiments-Statistical-Principles-Applications/dp/0521287626

Lembrem-se: vocês serão cientistas! Cientistas devem conhecer o método científico e ser capaz de projetar os seus experimentos assertivamente.

Vamos para os cursos? Serei mais sucinto, tudo bem?

Eu sei que existem diversos cursos legais em diversas plataformas. Hoje em dia, você não tem mais a desculpa de não aprender por falta de fonte de pesquisa. Facilmente encontramos excelentes canais no YouTube, cursos baratinhos no Udemy, Alura etc. até cursos mais caros e trabalhados no Coursera, EdX, Udacity.

Que curso escolher? Bem… vai depender do que você deseja e em qual mercado você deseja atuar. Por exemplo: por esses lados aqui, as empresas reconhecem os cursos da EdX, Coursera e Udacity. Então, se você deseja sair do Brasil, eu aconselho a investir em cursos dessas plataformas.

Matemática:

https://www.coursera.org/specializations/mathematics-machine-learning

Estatística e Probabilidade:

https://www.edx.org/course/probability-and-statistics-in-data-science-using-p

Machine Learning:

https://www.coursera.org/learn/machine-learning

Deep Learning:

https://pt.coursera.org/specializations/deep-learning

https://www.coursera.org/specializations/advanced-data-science-ibm

https://www.coursera.org/professional-certificates/ibm-data-science

https://course.fast.ai/index.html

E os blogs?

Isso aqui vai de cada área também. Eu vou dizer os que eu sigo. Essa galera sempre tem algo interessante para compartilhar e, inclusive, alguns deles vivem de gerar conteúdo! Um sonho, não? Vamos a eles:

  1. pyimagesearch: Eu admiro muito o conteúdo do Adrian e, pra mim, ele é um dos grandes influenciadores da nossa área. Seu conteúdo é de alta qualidade e bastante didático. https://www.pyimagesearch.com/
  2. Super Data Science: Eu gosto do material dessa galera também e eu indico os seus cursos também. https://www.superdatascience.com/
  3. Deeplearning.IA: sem dúvida, essa galera possui um dos melhores cursos sobre ML e DL do mercado. Além disso, eles possuem um drops bastante interessante chamado do The Batch. https://www.deeplearning.ai/the-batch/
  4. learnopencv.com: um lugar rico de informações e de exemplos práticos, em python e em C++. https://learnopencv.com/
  5. kdnuggets: portal com múltiplas atividades e que abrange diversos segmentos da área de ciência de dados. https://www.kdnuggets.com/
  6. Data Science Central: outro lugar extremamente rico em contribuicões e um dos primeiros a reconhecer os principais cientistas de dados no mundo. (eu estou lá :)). https://www.datasciencecentral.com/

Bem, galera, é isso. Eu espero que essas informações sejam ricas para a sua vida profissional e pessoal! Sucesso!

Ah! Se você também tiver dicas, compartilha aqui.

--

--

Adriano A. Santos

Senior Computer Vision Data Scientist at Conception Ro-Main (Quebec — CA). DSc in Computer Science. MTAC Brazil. https://github.com/adrianosantospb