Desenvolvendo suas habilidades Python para Ciência de Dados em 30 Dias

“Informação é o petróleo do século 21, e a análise é o motor de combustão.” — Peter Sondergaard, Gartner.

Já se perguntou por que você vê anúncios no Youtube ou Facebook ou sites do Google relacionados às suas pesquisas atuais?

Você não acha que esses anúncios fazem você comprar produtos de luxo mais em vez dos necessários?

Assim como pegadas de carbono, todo mundo tem pegadas digitais. Essas pegadas digitais são usadas para reconhecer indivíduos e seus hábitos. Por exemplo, o Google coleta os dados sobre a localização de cada pessoa, fitness, histórico de navegação etc. Com base nestes dados, eles são capazes de decidir que tipo de anúncios se interessariam e fornecer anúncios e recomendações personalizadas. Da mesma forma, muitas empresas coletam dados sobre clientes, para ver como podem aumentar suas vendas ou diminuir suas perdas. Tudo isso é feito usando Ciência de Dados. Data Science é um termo amplo que usa métodos científicos, algoritmos e sistemas para extrair informações úteis e transformá-la em insights valiosos.

Com o aumento da coleta de dados, a análise de dados está se tornando muito importante. Mas para isso deve-se estar bem ciente das ferramentas disponíveis e como usá-las. Uma das linguagens de programação mais populares quando se trata de análise de dados, visualização de dados, machine learning e Data Science é python.

Por que usar Python?

Devido à grande quantidade de material disponível online, a maioria das vezes os alunos tendem a fazer muitos cursos e workshops online, mas ainda não são capazes de desenvolver confiança durante a codificação em Python. A razão por trás disso é a falta de prática e imaginação. Deve-se sempre lembrar que a imaginação é a chave para a codificação. Então, nunca se concentre em memorizar a sintaxe. Pode ser encontrado no Google. Concentre-se em expandir sua imaginação. Tente coisas novas. O primeiro passo deve ser idear, depois imaginar e finalmente implementá-lo.

Há cursos e avaliações mistas disponíveis que não se pode decidir qual se encaixa melhor.

O Caminho Inteligente para se destacar Python em 30 dias

Então, vamos mergulhar no roteiro:

Dia 1º: Faça o curso Kaggle Micro em Python (https://www.kaggle.com/learn/python). Isso vai ajudá-lo a começar e dar-lhe uma breve introdução sobre Python, seus tipos de dados e comandos básicos.

Dia 2 ao dia 4: Siga o Python 3 Day Challenge(https://github.com/Anjali001/Python3DayChallenge). Isso vai ajudá-lo a entender melhor o básico do python e começar com a programação python.

Dia 5 ao Dia 10: Siga o Desafio Python 6 Dias(https://github.com/Anjali001/Python6DayChallenge). Nestes 6 dias, você aprenderá a fundo sobre como usar vários tipos de dados e por que eles são importantes.

Agora aprendemos o básico do Python. Estes fundamentos ajudarão você a entender python e aprender vários pacotes disponíveis no Python. Em seguida, passamos a aprender dois pacotes importantes para análise e manipulação de dados: Pandas e Numpy. Na ciência de dados, esses pacotes são bibliotecas essenciais que todos devem conhecer.

Dia 11 ao dia 25: Siga o Python 15 Day Challenge(https://github.com/Anjali001/Python15DayChallenge). Este desafio prepara você bem para os conjuntos de dados que você verá no futuro. Importar pacotes, funcionalidades comumente usadas, carregar dados, trabalhar com quadros de dados, manusear valores perdidos, limpeza de dados etc. estão todos incluídos neste desafio. Uma vez que você fizer este desafio, você vai superar essas bibliotecas e se preparar para fazer problemas de Ciência de Dados.

Esses pequenos exercícios de conjuntos de dados para melhorar sua compreensão e desempenhar um papel importante para distinguir seus conhecimentos dos outros.

Agora temos uma forte base do Python para mudar para a parte de aprendizado de máquina.

Dia 26 ao dia 30: Faça Micro cursos de Machine Learning em Python (https://www.kaggle.com/learn/intro-to-machine-learning). Isso vai ajudá-lo a saber o que é e como fazê-lo.

Pessoalmente, também recomendo que você faça o curso gratuito de previsão de empréstimos da Analytics Vidhya(https://courses.analyticsvidhya.com/courses/loan-prediction-practice-problem-using-python).

Eu mesmo fiz isso e posso garantir que você terá muita ajuda sobre como abordar um problema de Machine Learning. Este curso irá guiá-lo através da elaboração de hipóteses, limpeza de dados, engenharia de dados, visualização de dados, análise univariada e bivariada e, finalmente, fazer um algoritmo ML.

Caminho a seguir: Para expandir ainda mais seus conhecimentos, recomendo que você faça problemas de prática disponíveis na Plataforma Analytics Vidhya. Tenho certeza de que isso vai ajudá-lo a praticar a parte de aprendizado de máquina.

Obrigado

Composing a repository of books (i bought), authors (i follow) & blogs (direct ones) for my own understanding.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store