One Hot Encoding? Entenda como Funciona com Exemplos em Python

One Hot Encoding? Entenda como Funciona com Exemplos em Python

One Hot Encoding : Entenda porque você precisa transformar dados categóricos. As vezes o sucesso de um projeto de Data Science está na capacidade de trabalhar nos dados. Muitas vezes ficamos presos em como um algoritmo de Machine Learning funciona, ou ainda, em como fazer um tunning deste. Mas, muitas vezes, o que realmente faz a diferença é o pré-processamento dos dados. É o famoso pulo do gato. Saber como processar seus dados conforme o problema que você quer resolver vai (com toda certeza) ser um Continue lendo

Algoritmo K-means: Aprenda essa Técnica Essêncial através de Exemplos Passo a Passo com Python

Algoritmo K-means: Aprenda essa Técnica Essêncial através de Exemplos Passo a Passo com Python

Olá, nesse artigo veremos como usar o algoritmo k-means com Python. Já falamos o quanto o agrupamento de dados é uma tarefa extremamente importante se tratando de Análise de Dados e Machine Learning. No artigo Agrupamento de Dados com K-means: Aprenda seus Conceitos, Definições e Aplicações passei por todas as fases do algoritmo K-Means e a definição de agrupamento. Podemos entender como funciona todo o processo de agrupamento, seus benefícios e desafios. Neste artigo veremos na prática como aplicar os conceitos aprendidos, executando o algoritmo K-means Continue lendo

Pipelines: Como Automatizar Seus Processos de Machine Learning

Pipelines: Como Automatizar Seus Processos de Machine Learning

Olá Mineradores, hoje vamos de Pipelines: Como Automatizar Seus Processos de Machine Learning Quando estamos trabalhando com dados, é muito comum precisarmos executar vários processos para chegar em um resultado desejado. Com Data Science não é diferente, normalmente não é só pegar o dado e rodar um algoritmo de Machine Learning.. Muitas vezes precisamos fazer um pré-processamento nos dados, rodar um algoritmo, validar, ajustar, e por ai vai.. A famosa frase cabe aqui (novamente): NO PAIN, NO GAIN!  Para ter resultados interessantes é preciso suar Continue lendo

Entenda o Algoritmo K-means e Saiba como Aplicar essa Técnica.

Entenda o Algoritmo K-means e Saiba como Aplicar essa Técnica.

Olá, nesse artigo queremos que você entenda o algoritmo K-means Você sabe realmente como funciona o algoritmo de agrupamento de dados K-means? Vejo que é difícil achar alguma documentação de como funcionam os algoritmos de Machine Learning. Normalmente os pacotes de implementação, apenas contém alguma documentação de como executar os algoritmos, mas nada sobre conceitos. Ao invés de ensinar você apenas como implementar esse algoritmo, queremos que você entenda como funciona realmente o esse famoso algoritmo de agrupamento de dados. Assim, você vai saber como ajustar Continue lendo

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados  (Parte 2)

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados (Parte 2)

Neste artigo daremos sequência na série Dominando o Pandas Falar do Pandas nunca é demais, aliás daria um livro se fôssemos mostrar todo o potencial dessa biblioteca. Mais interessante que mostrar diversas funcionalidades é mostrar suas aplicações. Assim além do leitor aprender sobre a biblioteca, também aprende sobre como aplicar seus recursos. Na artigo anterior exploramos uma base de dados e vimos como o Pandas é útil para análise de dados. Vamos continuar explorando essa base usando os recursos que o Pandas nos oferece. Sempre Continue lendo

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados (Parte 1)

Dominando o Pandas: A Biblioteca para Análise de Dados preferida entre os Cientistas de Dados (Parte 1)

O pandas sem dúvidas é a melhor biblioteca Python para Análise de Dados. Eu diria que o Pandas talvez seja uma biblioteca obrigatória em projetos de Data Analysis 🙂 (eu realmente gosto dessa biblioteca). Já falamos sobre o Pandas aqui neste blog várias vezes, mas não dedicamos nenhum artigo todo a essa lib. Neste vamos abordar alguns recursos bem interessantes. O Pandas é um biblioteca open source amplamente utilizada na comunidade acadêmica. Esta se tornou extremamente útil pelo seu desempenho e pela sua capacidade de simplificar Continue lendo

Mineração de Textos: 7 Técnicas e Aplicações para Você Extrair Valor dos Dados e Alavancar Suas Análises.

Mineração de Textos: 7 Técnicas e Aplicações para Você Extrair Valor dos Dados e Alavancar Suas Análises.

Mineração de textos ou Text Mining, é uma técnica usada para tirar valiosas informações de bases de dados de textos. Onde podemos usar isso ? Imagine extrair as palavras mais usadas em uma notícia de um jornal? Quais são os principais termos usados em um tópico de discussão no Facebook? Ou ainda, um político que tem milhares de seguidores nas suas redes sociais, como saber se as pessoas estão falando bem ou mal com relação as suas postagens? O fato é que existem muitas pessoas Continue lendo

7 Tipos de Gráficos que Todo Cientista de Dados Deve Conhecer

7 Tipos de Gráficos que Todo Cientista de Dados Deve Conhecer

Conseguir identificar tendências ou a distribuição dos dados normalmente exigem técnicas avançadas de Data Science, e saber plotar gráficos é uma habilidade fundamental para qualquer Cientista de dados. A simples listagem dos registros em uma tabela não revela quase nada além de valores brutos. Através de ferramentas gráficas conseguimos visualizar melhor a informação escondida nos dados. Informações que às vezes nem sabemos que existem ou que podem se revelar com a correta representação dos dados. A visualização da informação de forma dinâmica não apenas facilita Continue lendo

Como Utilizar Machine Learning para Prever Preços de Ações da Bolsa de Valores – O Estudo de Caso Completo.

Como Utilizar Machine Learning para Prever Preços de Ações da Bolsa de Valores – O Estudo de Caso Completo.

Você gostaria de ganhar dinheiro com ações na Bolsa ? Já pensou como Machine Learning poderia te ajudar nessa empreitada? O fato é que o mercado de ações é algo bem complexo,pois, existem diversos fatores que influenciam no preço dos ativos Fatores estes que sao difíceis de prever, ou ainda, que estão fora do controle até mesmo de profissionais da área. Esse assunto tem interessado muita gente e existem vários estudos que buscam criar estratégias vencedoras na bolsa. Como por exemplo, robôs que automatizam as Continue lendo

Exploratory Data Analysis (EDA): Aprenda Definitivamente como Extrair Valiosos Insights de Bases de Dados Reais

Exploratory Data Analysis (EDA): Aprenda Definitivamente como Extrair Valiosos Insights de Bases de Dados Reais

Exploratory Data Analysis (EDA) que significa Análise Exploratória de Dados é definido como uma abordagem para a exploração minuciosa dos dados que se deseja analisar. Tambem conhecida como EDA, essa técnica vem sendo algo essencial no dia a dia do Cientista de dados Você já deu de cara com uma base de dados superinteressante e pensou como poderia explorar seus dados? Já ficou inquieto com uma ideia que gostaria de validar mas não sabe por onde começar? Ou mesmo após rascunhar uma análise ainda não consegue Continue lendo