Felipe Santana

Analista e Desenvolvedor de Software especialista em Data Science e Machine Learning.
Escritor da SQL Magazine e Certificado Microsoft em Bancos de Dados SQL Server.

Café Com Código #08: Weka – Consultando um Banco de Dados MySQL

Café Com Código #08: Weka – Consultando um Banco de Dados MySQL

Salve Minerador!  o tema de hoje é: “Weka: Consultando um Banco de Dados MySQL”. Nesse Café com Código vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Na rapidinha de hoje mostraremos um exemplo de como consultar um banco de dados MySQL a partir do Weka. Caso você ainda não conheça o Weka não deixe de conferir o artigo Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código. Abordamos técnicas desde o carregamento de bases Continue lendo

Café com Código #06: Introdução a Machine Learning com Scikit-Learn

Café com Código #06: Introdução a Machine Learning com Scikit-Learn

Salve Minerador!!, no Café com Código #06 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…Introdução a Machine Learning com Scikit-Learn. Na rapidinha de hoje faremos uma introdução a biblioteca Python de Machine Learning chamada Scikit-Learn. A Scikit-Learn é uma biblioteca Python para trabalhar com Machine Learning, com ela já estão implementados diversos métodos, algoritmos e técnicas bem interessantes que simplificam a vida do desenvolvedor. Se você já tem instalado as bibliotecas Continue lendo

Café com Código #05: Processamento de Linguagem Natural com NLTK

Café com Código #05: Processamento de Linguagem Natural com NLTK

Salve Minerador!!, no Café com Código #05 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…Processamento de Linguagem Natural com NLTK. Na rapidinha de hoje usaremos a biblioteca para processamento de linguagem natural NLTK, se você não conhece, veja como instalar e baixar os corpus de amostra no artigo Mineração de Textos: 7 Técnicas e Aplicações para Você Extrair Valor dos Dados e Alavancar Suas Análises. A NLTK que significa Natural Language Continue lendo

Café com Código #04: Nuvem de Tags com Python

Café com Código #04: Nuvem de Tags com Python

Salve Minerador!!, no Café com Código #04 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…”Nuvem de Tags com Python” Nuvem de Tags ou Tagcloud é basicamente uma representação visual de dados no formato texto livre, onde podemos observar rapidamente a relevância de uma palavra em uma base de dados através do seu tamanho na nuvem. É como se quanto maior for a ocorrência daquela palavra no texto maior ela será na Continue lendo

Café com Código #02: Scatter Plot – Visualizando a Dispersão dos Dados

Café com Código #02: Scatter Plot – Visualizando a Dispersão dos Dados

Salve Minerador! No Café com Código #02 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva… “Scatter Plot – Visualizando a Dispersão dos Dados” Quando precisamos visualizar a dispersão dos dados ou a sua variabilidade um bom ponto de partida é o gráfico de dispersão ou Scatter Plot. Normalmente usado também como uma forma rápida e fácil para identificar correlação entre atributos. A correlação seria basicamente verificar se o aumento ou diminuição Continue lendo

7 Tipos de Gráficos que Todo Cientista de Dados Deve Conhecer

7 Tipos de Gráficos que Todo Cientista de Dados Deve Conhecer

Conseguir identificar tendências ou a distribuição dos dados normalmente exigem técnicas avançadas de Data Science, e saber plotar gráficos é uma habilidade fundamental para qualquer Cientista de dados. A simples listagem dos registros em uma tabela não revela quase nada além de valores brutos. Através de ferramentas gráficas conseguimos visualizar melhor a informação escondida nos dados. Informações que às vezes nem sabemos que existem ou que podem se revelar com a correta representação dos dados. A visualização da informação de forma dinâmica não apenas facilita Continue lendo

Exploratory Data Analysis (EDA): Aprenda Definitivamente como Extrair Valiosos Insights de Bases de Dados Reais

Exploratory Data Analysis (EDA): Aprenda Definitivamente como Extrair Valiosos Insights de Bases de Dados Reais

Exploratory Data Analysis (EDA) que significa Análise Exploratória de Dados é definido como uma abordagem para a exploração minuciosa dos dados que se deseja analisar. Tambem conhecida como EDA, essa técnica vem sendo algo essencial no dia a dia do Cientista de dados Você já deu de cara com uma base de dados superinteressante e pensou como poderia explorar seus dados? Já ficou inquieto com uma ideia que gostaria de validar mas não sabe por onde começar? Ou mesmo após rascunhar uma análise ainda não consegue Continue lendo

Afinal, o que é Big Data e Mineração de dados? – Aprenda definitivamente

Afinal, o que é Big Data e Mineração de dados? – Aprenda definitivamente

Antes de falarmos de Mineração de dados e Big data, leia a seguinte história e imagine como essas tecnologias podem resolver sérios problemas.. Todos os anos, produtores de leite da Nova Zelândia têm que tomar uma dura decisão de negócios: quais vacas devem reter no seu rebanho e quais vender para um matadouro. Normalmente, um quinto das vacas em um rebanho leiteiro são abatidas a cada ano perto do final da época de ordenha, quando reservas de alimentação diminuem. O histórico de  criação e a Continue lendo