2017

Café com Código #05: Processamento de Linguagem Natural com NLTK

Café com Código #05: Processamento de Linguagem Natural com NLTK

Salve Minerador!!, no Café com Código #05 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…Processamento de Linguagem Natural com NLTK. Na rapidinha de hoje usaremos a biblioteca para processamento de linguagem natural NLTK, se você não conhece, veja como instalar e baixar os corpus de amostra no artigo Mineração de Textos: 7 Técnicas e Aplicações para Você Extrair Valor dos Dados e Alavancar Suas Análises. A NLTK que significa Natural Language Continue lendo

Café com Código #04: Nuvem de Tags com Python

Café com Código #04: Nuvem de Tags com Python

Salve Minerador!!, no Café com Código #04 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…”Nuvem de Tags com Python” Nuvem de Tags ou Tagcloud é basicamente uma representação visual de dados no formato texto livre, onde podemos observar rapidamente a relevância de uma palavra em uma base de dados através do seu tamanho na nuvem. É como se quanto maior for a ocorrência daquela palavra no texto maior ela será na Continue lendo

Café com Código #03: Normalização de Dados com Weka

Café com Código #03: Normalização de Dados com Weka

Salve Minerador!!. No Café com Código #03 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. o Tema de hoje é “Normalização de Dados com Weka“. Como sempre de forma rápida e objetiva… Antes de qualquer coisa, se você não conhece o Weka recomendo fortemente que veja o artigo Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código. Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código Normalizar Continue lendo

Café com Código #02: Scatter Plot – Visualizando a Dispersão dos Dados

Café com Código #02: Scatter Plot – Visualizando a Dispersão dos Dados

Salve Minerador! No Café com Código #02 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva… “Scatter Plot – Visualizando a Dispersão dos Dados” Quando precisamos visualizar a dispersão dos dados ou a sua variabilidade um bom ponto de partida é o gráfico de dispersão ou Scatter Plot. Normalmente usado também como uma forma rápida e fácil para identificar correlação entre atributos. A correlação seria basicamente verificar se o aumento ou diminuição Continue lendo

Café com Código #01: Tratando Valores Faltantes com Pandas e Python

Café com Código #01: Tratando Valores Faltantes com Pandas e Python

Salve Minerador!!, nesse Café com Código #01 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…como Tratar Valores Faltantes com o Pandas ? Sabemos que o Pandas é uma biblioteca Python muito utilizada para trabalhar com análise de dados. Se você não conhece não deixe de conferir esta e outras Ferramentas e Bibliotecas Fundamentais para Trabalhar com Data Science (Ferramentas Essenciais para Mineração de Dados e Big Data) . Quando precisamos trabalhar Continue lendo

Mineração de Textos: 7 Técnicas e Aplicações para Você Extrair Valor dos Dados e Alavancar Suas Análises.

Mineração de Textos: 7 Técnicas e Aplicações para Você Extrair Valor dos Dados e Alavancar Suas Análises.

Mineração de textos ou Text Mining, é uma técnica usada para tirar valiosas informações de bases de dados de textos. Onde podemos usar isso ? Imagine extrair as palavras mais usadas em uma notícia de um jornal? Quais são os principais termos usados em um tópico de discussão no Facebook? Ou ainda, um político que tem milhares de seguidores nas suas redes sociais, como saber se as pessoas estão falando bem ou mal com relação as suas postagens? O fato é que existem muitas pessoas Continue lendo

7 Tipos de Gráficos que Todo Cientista de Dados Deve Conhecer

7 Tipos de Gráficos que Todo Cientista de Dados Deve Conhecer

Conseguir identificar tendências ou a distribuição dos dados normalmente exigem técnicas avançadas de Data Science, e saber plotar gráficos é uma habilidade fundamental para qualquer Cientista de dados. A simples listagem dos registros em uma tabela não revela quase nada além de valores brutos. Através de ferramentas gráficas conseguimos visualizar melhor a informação escondida nos dados. Informações que às vezes nem sabemos que existem ou que podem se revelar com a correta representação dos dados. A visualização da informação de forma dinâmica não apenas facilita Continue lendo

Como Utilizar Machine Learning para Prever Preços de Ações da Bolsa de Valores – O Estudo de Caso Completo.

Como Utilizar Machine Learning para Prever Preços de Ações da Bolsa de Valores – O Estudo de Caso Completo.

Você gostaria de ganhar dinheiro com ações na Bolsa ? Já pensou como Machine Learning poderia te ajudar nessa empreitada? O fato é que o mercado de ações é algo bem complexo,pois, existem diversos fatores que influenciam no preço dos ativos Fatores estes que sao difíceis de prever, ou ainda, que estão fora do controle até mesmo de profissionais da área. Esse assunto tem interessado muita gente e existem vários estudos que buscam criar estratégias vencedoras na bolsa. Como por exemplo, robôs que automatizam as Continue lendo

Exploratory Data Analysis (EDA): Aprenda Definitivamente como Extrair Valiosos Insights de Bases de Dados Reais

Exploratory Data Analysis (EDA): Aprenda Definitivamente como Extrair Valiosos Insights de Bases de Dados Reais

Exploratory Data Analysis (EDA) que significa Análise Exploratória de Dados é definido como uma abordagem para a exploração minuciosa dos dados que se deseja analisar. Tambem conhecida como EDA, essa técnica vem sendo algo essencial no dia a dia do Cientista de dados Você já deu de cara com uma base de dados superinteressante e pensou como poderia explorar seus dados? Já ficou inquieto com uma ideia que gostaria de validar mas não sabe por onde começar? Ou mesmo após rascunhar uma análise ainda não consegue Continue lendo

Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código

Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código

O Weka é sem dúvidas uma das melhores ferramentas para se trabalhar com Data Science. Não é atoa que abordamos sua instalação aqui. 🙂 O cientista de dados precisa ser produtivo devido a diversas tarefas que lhe são atribuídas. Mas como ser produtivo com diversas bases para analisar, processar, e testar soluções? Por exemplo… Você precisa testar diferentes algoritmos de machine learning para saber qual funcionará melhor para o seu sistema? Ou ainda, você quer testar algumas técnicas de pré-processamento de dados e ver como Continue lendo