Diferença entre mineração de dados e OLAP

Diferença entre mineração de dados e OLAP
Diferença entre mineração de dados e OLAP

Vídeo: Diferença entre mineração de dados e OLAP

Vídeo: Diferença entre mineração de dados e OLAP
Vídeo: qual ÓCULOS DE SOL MASCULINO é o PERFEITO pra você? | Moda Masculina 2024, Novembro
Anonim

Data Mining vs OLAP

A mineração de dados e o OLAP são duas das tecnologias comuns de Business Intelligence (BI). Business intelligence refere-se a métodos baseados em computador para identificar e extrair informações úteis de dados de negócios. A mineração de dados é o campo da ciência da computação que trata da extração de padrões interessantes de grandes conjuntos de dados. Ele combina muitos métodos de inteligência artificial, estatísticas e gerenciamento de banco de dados. OLAP (processamento analítico online), como o nome sugere, é uma compilação de maneiras de consultar bancos de dados multidimensionais.

Data mining também é conhecido como Knowledge Discovery in data (KDD). Como mencionado acima, é um campo da ciência da computação, que lida com a extração de informações anteriormente desconhecidas e interessantes de dados brutos. Devido ao crescimento exponencial de dados, especialmente em áreas como negócios, a mineração de dados tornou-se uma ferramenta muito importante para converter essa grande riqueza de dados em inteligência de negócios, pois a extração manual de padrões se tornou aparentemente impossível nas últimas décadas. Por exemplo, atualmente é usado para várias aplicações, como análise de redes sociais, detecção de fraudes e marketing. A mineração de dados geralmente lida com as seguintes quatro tarefas: agrupamento, classificação, regressão e associação. Clustering é identificar grupos semelhantes a partir de dados não estruturados. Classificação são regras de aprendizado que podem ser aplicadas a novos dados e normalmente incluem as seguintes etapas: pré-processamento de dados, modelagem de projeto, aprendizado/seleção de recursos e avaliação/validação. A regressão é encontrar funções com erro mínimo para modelar dados. E associação está procurando relacionamentos entre variáveis. A mineração de dados geralmente é usada para responder a perguntas como quais são os principais produtos que podem ajudar a obter alto lucro no próximo ano no Wal-Mart.

OLAP é uma classe de sistemas, que fornece respostas a consultas multidimensionais. Normalmente, o OLAP é usado para marketing, orçamento, previsão e aplicativos semelhantes. Escusado será dizer que os bancos de dados usados para OLAP são configurados para consultas complexas e ad-hoc com um desempenho rápido em mente. Normalmente, uma matriz é usada para exibir a saída de um OLAP. As linhas e colunas são formadas pelas dimensões da consulta. Eles costumam usar métodos de agregação em várias tabelas para obter resumos. Por exemplo, ele pode ser usado para saber sobre as vendas deste ano no Wal-Mart em relação ao ano passado? Qual é a previsão sobre as vendas no próximo trimestre? O que pode ser dito sobre a tendência observando a variação percentual?

Embora seja óbvio que mineração de dados e OLAP são semelhantes porque operam em dados para obter inteligência, a principal diferença vem de como eles operam em dados. As ferramentas OLAP fornecem análise de dados multidimensional e fornecem resumos dos dados, mas, ao contrário, a mineração de dados se concentra em proporções, padrões e influências no conjunto de dados. Esse é um acordo OLAP com agregação, que se resume à operação de dados via “adição”, mas a mineração de dados corresponde à “divisão”. Outra diferença notável é que, enquanto as ferramentas de mineração de dados modelam dados e retornam regras acionáveis, o OLAP conduzirá técnicas de comparação e contraste ao longo da dimensão de negócios em tempo real.

Recomendado: