Como aprenderia Ciência de Dados se pudesse recomeçar

Um rápido guia para aprender ciência de dados da forma mais eficiente possível

Quando comecei minha jornada de ciência de dados, passei um tempo descobrindo por onde começar, o que deveria aprender primeiro e quais recursos deveria usar.

Nos últimos tempos, aprendi várias coisas que gostaria que alguém pudesse ter me dito, como se focar em programação ou estatística primeiro, quais recursos eu deveria usar para aprender novas habilidades, como eu deveria abordar o aprendizado de novas habilidades, etc…

Conteúdo:

  1. Matemática e Estatística
  2. Fundamentos de programação
  3. Algoritmos e Conceitos de Aprendizagem de Máquina
  4. Projetos de Ciência de Dados

1. Matemática e Estatística

Como qualquer outra coisa, você tem que aprender os fundamentos antes de chegar às coisas divertidas. Eu teria tido um tempo muito mais fácil se eu começasse a aprender matemática e estatística antes de entrar em qualquer algoritmo de aprendizagem de máquina.

Os três tópicos gerais que recomendo que você revise são cálculos/integrais, estatísticas e álgebra linear (em nenhuma ordem específica).

a. Integrais

As integrais são essenciais quando se trata de distribuições de probabilidades e testes de hipóteses. Embora você não precise ser um especialista, é do seu interesse aprender os fundamentos das integrais.

Os dois primeiros artigos são para quem quer ter uma ideia do que é integral ou para aqueles que simplesmente precisam de uma atualização.

b. Estatística

Se havia um tópico em que você deveria focar a maior parte do seu tempo, são as estatísticas. Afinal, um cientista de dados é realmente um estatístico moderno e aprendizado de máquina é um termo moderno para estatística.

Se você tiver tempo, recomendo que você passe pelo curso da Georgia Tech chamado “Métodos Estatísticos”, que abrange fundamentos de probabilidade, variáveis aleatórias, distribuições de probabilidades, testes de hipóteses e muito mais.

c. Álgebra Linear

A álgebra linear é especialmente importante se você quiser entrar no deep learning, mesmo assim, é bom saber para outros conceitos fundamentais de aprendizado de máquina, como os principais sistemas de análise e recomendação de componentes.

2. Fundamentos de programação

Assim como ter uma compreensão fundamental da matemática e estatísticas é importante, ter uma compreensão fundamental da programação tornará sua vida muito mais fácil, especialmente quando se trata de implementação. Portanto, recomendo que você aproveite o tempo para aprender SQL básico e Python antes de mergulhar em algoritmos de aprendizado de máquina.

a.SQL

Depende inteiramente de você se você quer aprender Python ou SQL primeiro, mas se você me perguntar, eu começaria com SQL. Porque? É mais fácil de aprender e é útil saber se você trabalha para uma empresa que trabalha com dados, MESMO se você não é um cientista de dados.

Se você é completamente novo no SQL, recomendo passar pelos tutoriais SQL do Mode,pois é muito sucinto e completo. Se você quiser aprender conceitos mais avançados, eu verificaria minha lista de recursos onde você pode aprender SQL avançado.

Mais importante, abaixo estão um punhado de recursos que você pode usar para praticar SQL.

b. Python

Python está tão à frente em termos de contribuições de código aberto, e é simples aprender. Sinta-se livre para ir com R se você quiser. Pessoalmente, descobri que aprender Python ‘fazendo’ é muito mais útil, os cursos que fiz na Data Science Academy são sensacionais, e este curso de fundamentos Python é robusto e GRATUITO!

Python Fundamentos para Análise de Dados (datascienceacademy.com.br)

c. Pandas

Sem dúvida, a biblioteca mais importante a se explorar em Python é o Pandas, que é especificamente destinado à manipulação e análise de dados.

Abaixo temos o primeiro link de um tutorial sobre como manusear Pandas e o segundo link fornece dezenas e dezenas de problemas de prática que você pode usar para solidificar seus aprendizados!

3. Algoritmos e Conceitos de Aprendizagem de Máquina

Se você chegou a este ponto, isso significa que você construiu sua fundação e você está pronto para aprender as coisas divertidas. Esta parte é dividida em duas partes: algoritmos de aprendizagem de máquina e conceitos de aprendizado de máquina.

a. Algoritmos de Aprendizagem de Máquina

O próximo passo é aprender sobre os vários algoritmos de aprendizagem de máquina, como eles funcionam e quando usá-los. Abaixo está uma lista não exaustiva dos vários algoritmos e recursos de aprendizado de máquina que você pode usar para aprender sobre cada um.

b. Conceitos de Machine Learning

Da mesma forma, existem vários conceitos fundamentais de aprendizado de máquina que você vai querer passar por cima também. Abaixo está uma lista (não exaustiva) de conceitos que recomendo fortemente que você passe. Muitas perguntas de entrevista são baseadas nesses tópicos!

4. Projetos de Ciência de Dados

A essa altura, você não só terá uma base forte construída, mas também uma compreensão sólida dos fundamentos da aprendizagem de máquina. Agora é hora de trabalhar em alguns projetos pessoais, da mesma forma que os codificadores têm seus próprios projetos paralelos também.

Obrigado.

Composing a repository of books (i bought), authors (i follow) & blogs (direct ones) for my own understanding.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store