Rodrigo Santana

Mestrando em Ciência da Computação, interessado em Machine Learning, NLP e Data Science.

Café com Código #12: Parts of Speech, O que é isso ?

Café com Código #12: Parts of Speech, O que é isso ?

No Café com Código de hoje vamos de Parts of Speech,  o que é isso? Salve Minerador, No Café com Código #12 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Na rapidinha de hoje mostraremos uma técnica bem interessante para projetos envolvendo Mineração de textos. Se quiser receber um conteúdo de Data Science toda semana no seu e-mail, se cadastre na lista VIP Imagine um chatboot que precisa entender e interagir com um usuário através de texto O chatboot precisará saber quem é o sujeito da frase, (sujeito aqui Continue lendo

Café com Código #11: Outliers, Como identifica-los?

Café com Código #11: Outliers, Como identifica-los?

No Café com Código de hoje vamos de Outliers, como identifica-los ? Neste Café com Código #11 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Se quiser receber um conteúdo de Data Science toda semana no seu e-mail, se cadastre na lista VIP 🙂 Na rapidinha de hoje mostraremos uma técnica bem interessante para detectar outliers no nosso dado. Mas o que seria um Outlier ? um outlier ou uma anomalia, seria um valor atípico, ou seja, uma observação que se apresenta bastante distante dos Continue lendo

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados  (Parte 2)

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados (Parte 2)

Neste artigo daremos sequência na série Dominando o Pandas Falar do Pandas nunca é demais, aliás daria um livro se fôssemos mostrar todo o potencial dessa biblioteca. Mais interessante que mostrar diversas funcionalidades é mostrar suas aplicações. Assim além do leitor aprender sobre a biblioteca, também aprende sobre como aplicar seus recursos. Na artigo anterior exploramos uma base de dados e vimos como o Pandas é útil para análise de dados. Vamos continuar explorando essa base usando os recursos que o Pandas nos oferece. Sempre Continue lendo

Café Com Código #09: Entendendo Métricas de Avaliação de Modelos

Café Com Código #09: Entendendo Métricas de Avaliação de Modelos

Entendendo Métricas de Avaliação de Modelos Salve Minerador!, No Café com Código #09 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…Entendendo Métricas de Avaliação de Modelos. Na rapidinha de hoje mostraremos como entender algumas métricas de avaliação de modelos de classificação quando trabalhamos com Machine Learning. As métricas de avaliação são fundamentais para verificar se o nosso modelo está com bons resultados e como podemos melhorar. Com as métricas precision (precisão), Continue lendo

Café com Código #07: RapidMiner: Data Science sem escrever uma linha de código

Café com Código #07: RapidMiner: Data Science sem escrever uma linha de código

Salve Minerador! No Café com Código #07 vai mais um dica para você aprender Data Science na pausa para o sagrado cafezinho. Como sempre de forma rápida e objetiva…RapidMiner: Data Science sem escrever uma linha de código. 🙂 Na rapidinha de hoje mostraremos um exemplo simples de como utilizar a plataforma de Data Science chamada RapidMiner. RapidMiner é uma ferramenta para trabalhar com Data Science e como o nome já diz, voltada para a rápida implementação de aplicações devido a grande produtividade proporcionada e por Continue lendo

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados (Parte 1)

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados (Parte 1)

Para fazer Data Science com Python o Pandas talvez seja uma biblioteca obrigatória 🙂 (eu realmente gosto dessa biblioteca). Já falamos sobre o Pandas aqui neste blog várias vezes, mas não dedicamos nenhum artigo todo a essa lib. Neste vamos abordar alguns recursos bem interessantes. O Pandas é um biblioteca open source amplamente utilizada na comunidade acadêmica. Esta se tornou extremamente útil pelo seu desempenho e pela sua capacidade de simplificar tarefas complicadas de manipulação de dados (complexo isso hein?) Resumo da ópera: Scripts e Continue lendo

Mineração de Textos: 7 Técnicas e Aplicações para Você Extrair Valor dos Dados e Alavancar Suas Análises.

Mineração de Textos: 7 Técnicas e Aplicações para Você Extrair Valor dos Dados e Alavancar Suas Análises.

Mineração de textos ou Text Mining, é uma técnica usada para tirar valiosas informações de bases de dados de textos. Onde podemos usar isso ? Imagine extrair as palavras mais usadas em uma notícia de um jornal? Quais são os principais termos usados em um tópico de discussão no Facebook? Ou ainda, um político que tem milhares de seguidores nas suas redes sociais, como saber se as pessoas estão falando bem ou mal com relação as suas postagens? O fato é que existem muitas pessoas Continue lendo

Como Utilizar Machine Learning para Prever Preços de Ações da Bolsa de Valores – O Estudo de Caso Completo.

Como Utilizar Machine Learning para Prever Preços de Ações da Bolsa de Valores – O Estudo de Caso Completo.

Você gostaria de ganhar dinheiro com ações na Bolsa ? Já pensou como Machine Learning poderia te ajudar nessa empreitada? O fato é que o mercado de ações é algo bem complexo,pois, existem diversos fatores que influenciam no preço dos ativos Fatores estes que sao difíceis de prever, ou ainda, que estão fora do controle até mesmo de profissionais da área. Esse assunto tem interessado muita gente e existem vários estudos que buscam criar estratégias vencedoras na bolsa. Como por exemplo, robôs que automatizam as Continue lendo

Análise de Sentimentos – Aprenda de uma vez por todas como funciona utilizando dados do Twitter

Análise de Sentimentos – Aprenda de uma vez por todas como funciona utilizando dados do Twitter

Você sabe o que é Análise de Sentimentos ?  Imagine uma empresa que quer saber sobre a reputação do seu produto que foi lançado no mercado. É possível usar as redes sociais para buscar informações, mas como saber se estão falando bem ou mau desse produto? Ler, entender e tirar uma conclusão de centenas de comentários de usuários sobre um produto pode ser uma tarefa inviável. Análise de Sentimentos é uma técnica que consiste em extrair informações de textos em linguagem natural. O objetivo dessa Continue lendo

10 Melhores Ferramentas e Bibliotecas para Trabalhar com Mineração de Dados e Big Data

10 Melhores Ferramentas e Bibliotecas para Trabalhar com Mineração de Dados e Big Data

Olá , hoje vamos conhecer sobre as ferramentas e bibliotecas essenciais para trabalhar com Mineração de Dados e Big Data. Esse assunto geralmente é bem polêmico, visto que cada profissional tem uma opinião e até mesmo paixão por algumas ferramentas. 🙂 Uma pesquisa em maio de 2015 revelou as ferramentas mais usadas pela comunidade de Mineração de dados do site KDnuggets. Quer saber quais são as ferramentas essenciais para se trabalhar como Mineração de dados? Então continue lendo este artigo. Nele, você vai aprender mais Continue lendo