5 projetos que todo Cientista de Dados deve ter em vista

Segmentação do cliente, classificação de texto, sentimento, séries temporativas e sistemas recomendados.

O objetivo deste breve artigo é delinear projetos que um cientista de dados profissional eventualmente desenvolve. Segmentação de clientes, classificação de texto, análise de sentimentos, previsão de séries temporais e sistemas recomendador podem ajudar as empresas que nos empregam.

Conteúdo

Segmentação de Clientes

A segmentação do cliente é uma forma de Ciência de Dados onde uma técnica de modelagem não supervisionada e de cluster é empregada para delimitar grupos ou segmentos de uma população humana ou observações em dados. O objetivo é criar grupos homogêneos, heterogêneos entre si intimamente relacionados a:

agrupamento k-means

Como você pode ver na imagem acima, esses grupos são bem separados — BGSS e estão intimamente centrados — WGSS. Este exemplo é ideal.

Pense em cada um dos clusters como aqueles grupos que você vai segmentar com um anúncio de marketing específico: ‘queremos apelar para recém-formados universitários, comercializando nosso produto da empresa como jovem-profissional centrado’. Alguns algoritmos de clustering úteis são:

DBSCANK-meansAgglomerative Hierarchical Clustering

O que acontece com os resultados da egmentação de clientes?

Esse tipo de projeto de Ciência de Dados é amplamente utilizado, sendo mais útil na indústria de marketing.

Classificação de texto

Características do texto e alvo do exemplo de classificação para o algoritmo

2. Procesamento de Linguagem Natural

A classificação de texto está sob o guarda-chuva do Processamento de Linguagem Natural (PNL), que utiliza técnicas para ingerir dados não-estruturados de texto. Podemos pensar neste algoritmo ou projeto como uma forma de categorizar rótulos de texto usando recursos de texto (juntamente com recursos numéricos também).

Aqui há um exemplo simples de utilização de recursos de texto e numéricos para classificação de texto. Em vez de ter uma palavra para o seu recurso de texto, poderíamos, talvez, ter centenas e precisaríamosexecutar técnicas de processamento de linguagem, como marcação parte da fala, remoção de palavras de parada, vetorização de contagem, etc.

Biblioteca nltk

Uma biblioteca comum que os cientistas de dados usam em Python é nltk. O objetivo dessas técnicas é limpar seus dados de texto e criar a melhor representação de si mesmo, de modo a eliminar o ruído.

O que acontece com os resultados da classificação de texto?

Também podemos categorizar automaticamente documentos de texto que levariam horas após horas para ler manualmente.

Esse tipo de projeto é útil na indústria financeira ou historiador/bibliotecária.

3. Análise de Sentimento de Usuários e Clientes

A análise do sentimento também está sob o guarda-chuva do Processamentode Linguagem. É uma maneira de atribuir pontuações de sentimento do texto, ou mais especificamente, polaridade e subjetividade.

É benéfico usar a análise de sentimentos quando você tem muitos dados de texto e quer digeri-los para criar níveis de sentimento bom ou ruim. Se você tem um sistema de classificação já em vigor em sua empresa, pode parecer redundante, mas muitas vezes as pessoas podem deixar comentários com texto que não correspondem à sua pontuação numérica.

Outro benefício da análise de sentimentos é que você pode sinalizar certas palavras-chave ou frases que você gostaria de destacar para tornar seu produto melhor. Alinhar palavras-chave com sentimentos-chave pode ser usado para agregar métricas que você pode visualizar o que seu produto está faltando e onde possíveis melhorias poderiam ser feitas.

O que acontece com os resultados da análise de sentimentos?

Esse tipo de projeto é útil em muitas indústrias, especialmente e-commerce, entretenimento ou em qualquer lugar que inclua avaliações de texto.

4. Previsão com Séries Temporais (ARIMA e LSTM)

Séries temporais estão presentes em todos os setores e áreas da vida. Na maioria das vezes, a previsão de séries temporâneais pode ser usada em última instância para alocar fundos ou recursos para o futuro. Se você tem uma equipe de vendas, eles se beneficiariam da sua previsão, assim como os investidores, pois eles vêem para qual caminho a empresa está seguindo.

Um exemplo popular seria a Amazon ou qualquer empresa semelhante onde os consumidores têm comportamentos frequentes e precisam de uma alocação de fábricas, motoristas e diferentes locais que se fundirão para desenvolver uma distribuição mais assertiva.

O que acontece fazemos com os resultados da análise de sentimentos?

Esse tipo de projeto também é útil em muitas indústrias, mas geralmente em vendas ou gestão de suprimentos.

5. Sistemas recomendadores

Embora você possa ou não estar projetando o próximo algoritmo do sistema de recomendação da Netflix, você pode encontrar-se aplicando técnicas semelhantes a várias partes do seu negócio.

Pense em usar esse tipo de projeto para, finalmente, conseguir a venda de mais produtos dos usuários.

Como consumidor, se você está comprando certos produtos ou mantimentos, mas você vê algumas recomendações no final do seu checkout, você pode estar inclinado a comprar rapidamente por impulso algumas dessas recomendações.

Expanda esse resultado para todos os usuários e você pode fazer de suas empresas milhões.

Esse tipo de projeto também é útil em muitas indústrias, mas geralmente no e-commerce e entretenimento.

Finalizando

O foco na aplicação de Machine Learning é focar em obter a melhor precisão das predições, melhor a eficiêcia dos projetos, gerar novos insights, ajudar a empresa a desenvolver seus produtos, ajudar as pessoas e economizar, gastar melhor e ganhar mais dinheiro.

Resumindo, aqui estão cinco projetos principiais e mais populares a se praticar:

- customer segmentation
- text classification
- sentiment analysis
- time series forecasting
- recommender systems

Obrigado

Composing a repository of books (i bought), authors (i follow) & blogs (direct ones) for my own understanding.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store