2017

Café Com Código #09: Entendendo Métricas de Avaliação de Modelos

Café Com Código #09: Entendendo Métricas de Avaliação de Modelos

Entendendo Métricas de Avaliação de Modelos Salve Minerador!, No Café com Código #09 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…Entendendo Métricas de Avaliação de Modelos. Na rapidinha de hoje mostraremos como entender algumas métricas de avaliação de modelos de classificação quando trabalhamos com Machine Learning. As métricas de avaliação são fundamentais para verificar se o nosso modelo está com bons resultados e como podemos melhorar. Com as métricas precision (precisão), Continue lendo

Café Com Código #08: Weka – Consultando um Banco de Dados MySQL

Café Com Código #08: Weka – Consultando um Banco de Dados MySQL

Salve Minerador!  o tema de hoje é: “Weka: Consultando um Banco de Dados MySQL”. Nesse Café com Código vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Na rapidinha de hoje mostraremos um exemplo de como consultar um banco de dados MySQL a partir do Weka. Caso você ainda não conheça o Weka não deixe de conferir o artigo Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código. Abordamos técnicas desde o carregamento de bases Continue lendo

Café com Código #07: RapidMiner: Data Science sem escrever uma linha de código

Café com Código #07: RapidMiner: Data Science sem escrever uma linha de código

Salve Minerador! No Café com Código #07 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…RapidMiner: Data Science sem escrever uma linha de código. 🙂 Na rapidinha de hoje mostraremos um exemplo simples de como utilizar a plataforma de Data Science chamada RapidMiner. RapidMiner é uma ferramenta para trabalhar com Data Science e como o nome já diz, voltada para a rápida implementação de aplicações devido a grande produtividade proporcionada e por Continue lendo

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados (Parte 1)

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados (Parte 1)

Para fazer Data Science com Python o Pandas talvez seja uma biblioteca obrigatória 🙂 (eu realmente gosto dessa biblioteca). Já falamos sobre o Pandas aqui neste blog várias vezes, mas não dedicamos nenhum artigo todo a essa lib. Neste vamos abordar alguns recursos bem interessantes. O Pandas é um biblioteca open source amplamente utilizada na comunidade acadêmica. Esta se tornou extremamente útil pelo seu desempenho e pela sua capacidade de simplificar tarefas complicadas de manipulação de dados (complexo isso hein?) Resumo da ópera: Scripts e Continue lendo

Café com Código #06: Introdução a Machine Learning com Scikit-Learn

Café com Código #06: Introdução a Machine Learning com Scikit-Learn

Salve Minerador!!, no Café com Código #06 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…Introdução a Machine Learning com Scikit-Learn. Na rapidinha de hoje faremos uma introdução a biblioteca Python de Machine Learning chamada Scikit-Learn. A Scikit-Learn é uma biblioteca Python para trabalhar com Machine Learning, com ela já estão implementados diversos métodos, algoritmos e técnicas bem interessantes que simplificam a vida do desenvolvedor. Se você já tem instalado as bibliotecas Continue lendo

Café com Código #05: Processamento de Linguagem Natural com NLTK

Café com Código #05: Processamento de Linguagem Natural com NLTK

Salve Minerador!!, no Café com Código #05 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…Processamento de Linguagem Natural com NLTK. Na rapidinha de hoje usaremos a biblioteca para processamento de linguagem natural NLTK, se você não conhece, veja como instalar e baixar os corpus de amostra no artigo Mineração de Textos: 7 Técnicas e Aplicações para Você Extrair Valor dos Dados e Alavancar Suas Análises. A NLTK que significa Natural Language Continue lendo

Café com Código #04: Nuvem de Tags com Python

Café com Código #04: Nuvem de Tags com Python

Salve Minerador!!, no Café com Código #04 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…”Nuvem de Tags com Python” Nuvem de Tags ou Tagcloud é basicamente uma representação visual de dados no formato texto livre, onde podemos observar rapidamente a relevância de uma palavra em uma base de dados através do seu tamanho na nuvem. É como se quanto maior for a ocorrência daquela palavra no texto maior ela será na Continue lendo

Café com Código #03: Normalização de Dados com Weka

Café com Código #03: Normalização de Dados com Weka

Salve Minerador!!. No Café com Código #03 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. o Tema de hoje é “Normalização de Dados com Weka“. Como sempre de forma rápida e objetiva… Antes de qualquer coisa, se você não conhece o Weka recomendo fortemente que veja o artigo Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código. Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código Normalizar Continue lendo

Café com Código #02: Scatter Plot – Visualizando a Dispersão dos Dados

Café com Código #02: Scatter Plot – Visualizando a Dispersão dos Dados

Salve Minerador! No Café com Código #02 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva… “Scatter Plot – Visualizando a Dispersão dos Dados” Quando precisamos visualizar a dispersão dos dados ou a sua variabilidade um bom ponto de partida é o gráfico de dispersão ou Scatter Plot. Normalmente usado também como uma forma rápida e fácil para identificar correlação entre atributos. A correlação seria basicamente verificar se o aumento ou diminuição Continue lendo

Café com Código #01: Tratando Valores Faltantes com Pandas e Python

Café com Código #01: Tratando Valores Faltantes com Pandas e Python

Salve Minerador!!, nesse Café com Código #01 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…como Tratar Valores Faltantes com o Pandas ? Sabemos que o Pandas é uma biblioteca Python muito utilizada para trabalhar com análise de dados. Se você não conhece não deixe de conferir esta e outras Ferramentas e Bibliotecas Fundamentais para Trabalhar com Data Science (Ferramentas Essenciais para Mineração de Dados e Big Data) . Quando precisamos trabalhar Continue lendo