Rodrigo Santana

Mestrando em Ciência da Computação, interessado em Machine Learning, NLP e Data Science.

Café Com Código #09: Entendendo Métricas de Avaliação de Modelos

Café Com Código #09: Entendendo Métricas de Avaliação de Modelos

Entendendo Métricas de Avaliação de Modelos Salve Minerador!, No Café com Código #09 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…Entendendo Métricas de Avaliação de Modelos. Na rapidinha de hoje mostraremos como entender algumas métricas de avaliação de modelos de classificação quando trabalhamos com Machine Learning. As métricas de avaliação são fundamentais para verificar se o nosso modelo está com bons resultados e como podemos melhorar. Com as métricas precision (precisão), Continue lendo

Café com Código #07: RapidMiner: Data Science sem escrever uma linha de código

Café com Código #07: RapidMiner: Data Science sem escrever uma linha de código

Salve Minerador! No Café com Código #07 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…RapidMiner: Data Science sem escrever uma linha de código. 🙂 Na rapidinha de hoje mostraremos um exemplo simples de como utilizar a plataforma de Data Science chamada RapidMiner. RapidMiner é uma ferramenta para trabalhar com Data Science e como o nome já diz, voltada para a rápida implementação de aplicações devido a grande produtividade proporcionada e por Continue lendo

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados (Parte 1)

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados (Parte 1)

Para fazer Data Science com Python o Pandas talvez seja uma biblioteca obrigatória 🙂 (eu realmente gosto dessa biblioteca). Já falamos sobre o Pandas aqui neste blog várias vezes, mas não dedicamos nenhum artigo todo a essa lib. Neste vamos abordar alguns recursos bem interessantes. O Pandas é um biblioteca open source amplamente utilizada na comunidade acadêmica. Esta se tornou extremamente útil pelo seu desempenho e pela sua capacidade de simplificar tarefas complicadas de manipulação de dados (complexo isso hein?) Resumo da ópera: Scripts e Continue lendo

Café com Código #03: Normalização de Dados com Weka

Café com Código #03: Normalização de Dados com Weka

Salve Minerador!!. No Café com Código #03 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. o Tema de hoje é “Normalização de Dados com Weka“. Como sempre de forma rápida e objetiva… Antes de qualquer coisa, se você não conhece o Weka recomendo fortemente que veja o artigo Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código. Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código Normalizar Continue lendo

Café com Código #01: Tratando Valores Faltantes com Pandas e Python

Café com Código #01: Tratando Valores Faltantes com Pandas e Python

Salve Minerador!!, nesse Café com Código #01 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…como Tratar Valores Faltantes com o Pandas ? Sabemos que o Pandas é uma biblioteca Python muito utilizada para trabalhar com análise de dados. Se você não conhece não deixe de conferir esta e outras Ferramentas e Bibliotecas Fundamentais para Trabalhar com Data Science (Ferramentas Essenciais para Mineração de Dados e Big Data) . Quando precisamos trabalhar Continue lendo

Mineração de Textos: 7 Técnicas e Aplicações para Você Extrair Valor dos Dados e Alavancar Suas Análises.

Mineração de Textos: 7 Técnicas e Aplicações para Você Extrair Valor dos Dados e Alavancar Suas Análises.

Mineração de textos ou Text Mining, é uma técnica usada para tirar valiosas informações de bases de dados de textos. Onde podemos usar isso ? Imagine extrair as palavras mais usadas em uma notícia de um jornal? Quais são os principais termos usados em um tópico de discussão no Facebook? Ou ainda, um político que tem milhares de seguidores nas suas redes sociais, como saber se as pessoas estão falando bem ou mal com relação as suas postagens? O fato é que existem muitas pessoas Continue lendo

Como Utilizar Machine Learning para Prever Preços de Ações da Bolsa de Valores – O Estudo de Caso Completo.

Como Utilizar Machine Learning para Prever Preços de Ações da Bolsa de Valores – O Estudo de Caso Completo.

Você gostaria de ganhar dinheiro com ações na Bolsa ? Já pensou como Machine Learning poderia te ajudar nessa empreitada? O fato é que o mercado de ações é algo bem complexo,pois, existem diversos fatores que influenciam no preço dos ativos Fatores estes que sao difíceis de prever, ou ainda, que estão fora do controle até mesmo de profissionais da área. Esse assunto tem interessado muita gente e existem vários estudos que buscam criar estratégias vencedoras na bolsa. Como por exemplo, robôs que automatizam as Continue lendo

Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código

Ciência dos Dados com Weka: Domine 7 Técnicas Essênciais sem Escrever uma Linha de Código

O Weka é sem dúvidas uma das melhores ferramentas para se trabalhar com Data Science. Não é atoa que abordamos sua instalação aqui. 🙂 O cientista de dados precisa ser produtivo devido a diversas tarefas que lhe são atribuídas. Mas como ser produtivo com diversas bases para analisar, processar, e testar soluções? Por exemplo… Você precisa testar diferentes algoritmos de machine learning para saber qual funcionará melhor para o seu sistema? Ou ainda, você quer testar algumas técnicas de pré-processamento de dados e ver como Continue lendo

Análise de Sentimentos – Aprenda de uma vez por todas como funciona utilizando dados do Twitter

Análise de Sentimentos – Aprenda de uma vez por todas como funciona utilizando dados do Twitter

Você sabe o que é Análise de Sentimentos ?  Imagine uma empresa que quer saber sobre a reputação do seu produto que foi lançado no mercado. É possível usar as redes sociais para buscar informações, mas como saber se estão falando bem ou mau desse produto? Ler, entender e tirar uma conclusão de centenas de comentários de usuários sobre um produto pode ser uma tarefa inviável. Análise de Sentimentos é uma técnica que consiste em extrair informações de textos em linguagem natural. O objetivo dessa Continue lendo

10 Melhores Ferramentas e Bibliotecas para Trabalhar com Mineração de Dados e Big Data

10 Melhores Ferramentas e Bibliotecas para Trabalhar com Mineração de Dados e Big Data

Olá , hoje vamos conhecer sobre as ferramentas e bibliotecas essenciais para trabalhar com Mineração de Dados e Big Data. Esse assunto geralmente é bem polêmico, visto que cada profissional tem uma opinião e até mesmo paixão por algumas ferramentas. 🙂 Uma pesquisa em maio de 2015 revelou as ferramentas mais usadas pela comunidade de Mineração de dados do site KDnuggets. Quer saber quais são as ferramentas essenciais para se trabalhar como Mineração de dados? Então continue lendo este artigo. Nele, você vai aprender mais Continue lendo