setembro 2017

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados (Parte 1)

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados (Parte 1)

Para fazer Data Science com Python o Pandas talvez seja uma biblioteca obrigatória 🙂 (eu realmente gosto dessa biblioteca). Já falamos sobre o Pandas aqui neste blog várias vezes, mas não dedicamos nenhum artigo todo a essa lib. Neste vamos abordar alguns recursos bem interessantes. O Pandas é um biblioteca open source amplamente utilizada na comunidade acadêmica. Esta se tornou extremamente útil pelo seu desempenho e pela sua capacidade de simplificar tarefas complicadas de manipulação de dados (complexo isso hein?) Resumo da ópera: Scripts e Continue lendo

Café com Código #06: Introdução a Machine Learning com Scikit-Learn

Café com Código #06: Introdução a Machine Learning com Scikit-Learn

Salve Minerador!!, no Café com Código #06 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…Introdução a Machine Learning com Scikit-Learn. Na rapidinha de hoje faremos uma introdução a biblioteca Python de Machine Learning chamada Scikit-Learn. A Scikit-Learn é uma biblioteca Python para trabalhar com Machine Learning, com ela já estão implementados diversos métodos, algoritmos e técnicas bem interessantes que simplificam a vida do desenvolvedor. Se você já tem instalado as bibliotecas Continue lendo

Café com Código #05: Processamento de Linguagem Natural com NLTK

Café com Código #05: Processamento de Linguagem Natural com NLTK

Salve Minerador!!, no Café com Código #05 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…Processamento de Linguagem Natural com NLTK. Na rapidinha de hoje usaremos a biblioteca para processamento de linguagem natural NLTK, se você não conhece, veja como instalar e baixar os corpus de amostra no artigo Mineração de Textos: 7 Técnicas e Aplicações para Você Extrair Valor dos Dados e Alavancar Suas Análises. A NLTK que significa Natural Language Continue lendo

Café com Código #04: Nuvem de Tags com Python

Café com Código #04: Nuvem de Tags com Python

Salve Minerador!!, no Café com Código #04 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…”Nuvem de Tags com Python” Nuvem de Tags ou Tagcloud é basicamente uma representação visual de dados no formato texto livre, onde podemos observar rapidamente a relevância de uma palavra em uma base de dados através do seu tamanho na nuvem. É como se quanto maior for a ocorrência daquela palavra no texto maior ela será na Continue lendo

Café com Código #03: Normalização de Dados com Weka

Café com Código #03: Normalização de Dados com Weka

Salve Minerador!!. No Café com Código #03 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. o Tema de hoje é “Normalização de Dados com Weka“. Como sempre de forma rápida e objetiva… Antes de qualquer coisa, se você não conhece o Weka recomendo fortemente que veja o artigo Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código. Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código Normalizar Continue lendo

Café com Código #02: Scatter Plot – Visualizando a Dispersão dos Dados

Café com Código #02: Scatter Plot – Visualizando a Dispersão dos Dados

Salve Minerador! No Café com Código #02 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva… “Scatter Plot – Visualizando a Dispersão dos Dados” Quando precisamos visualizar a dispersão dos dados ou a sua variabilidade um bom ponto de partida é o gráfico de dispersão ou Scatter Plot. Normalmente usado também como uma forma rápida e fácil para identificar correlação entre atributos. A correlação seria basicamente verificar se o aumento ou diminuição Continue lendo

Café com Código #01: Tratando Valores Faltantes com Pandas e Python

Café com Código #01: Tratando Valores Faltantes com Pandas e Python

Salve Minerador!!, nesse Café com Código #01 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…como Tratar Valores Faltantes com o Pandas ? Sabemos que o Pandas é uma biblioteca Python muito utilizada para trabalhar com análise de dados. Se você não conhece não deixe de conferir esta e outras Ferramentas e Bibliotecas Fundamentais para Trabalhar com Data Science (Ferramentas Essenciais para Mineração de Dados e Big Data) . Quando precisamos trabalhar Continue lendo