Diferença entre mineração de dados e armazenamento de dados

Diferença entre mineração de dados e armazenamento de dados
Diferença entre mineração de dados e armazenamento de dados

Vídeo: Diferença entre mineração de dados e armazenamento de dados

Vídeo: Diferença entre mineração de dados e armazenamento de dados
Vídeo: I have this 65 inch HUAWEI IdeaHub in my Home OFFICE! 2024, Julho
Anonim

Mineração de dados versus armazenamento de dados

Data Mining e Data Warehousing são técnicas muito poderosas e populares para analisar dados. Os usuários que gostam de estatísticas usam Data Mining. Eles utilizam modelos estatísticos para procurar padrões ocultos nos dados. Os mineradores de dados estão interessados em encontrar relacionamentos úteis entre diferentes elementos de dados, o que acaba sendo lucrativo para as empresas. Mas, por outro lado, especialistas em dados que podem analisar diretamente as dimensões do negócio tendem a usar data warehouses.

Data mining também é conhecido como Knowledge Discovery in data (KDD). Como mencionado acima, é um campo da ciência da computação, que lida com a extração de informações anteriormente desconhecidas e interessantes de dados brutos. Devido ao crescimento exponencial de dados, especialmente em áreas como negócios, a mineração de dados tornou-se uma ferramenta muito importante para converter essa grande riqueza de dados em inteligência de negócios, pois a extração manual de padrões se tornou aparentemente impossível nas últimas décadas. Por exemplo, atualmente é usado para várias aplicações, como análise de redes sociais, detecção de fraudes e marketing. A mineração de dados geralmente lida com as seguintes quatro tarefas: agrupamento, classificação, regressão e associação. Clustering é identificar grupos semelhantes a partir de dados não estruturados. Classificação são regras de aprendizado que podem ser aplicadas a novos dados e normalmente incluem as seguintes etapas: pré-processamento de dados, modelagem de projeto, aprendizado/seleção de recursos e avaliação/validação. A regressão é encontrar funções com erro mínimo para modelar dados. E associação está procurando relacionamentos entre variáveis. A mineração de dados geralmente é usada para responder a perguntas como quais são os principais produtos que podem ajudar a obter alto lucro no próximo ano no Wal-Mart?

Como mencionado acima, Data warehousing também é usado para analisar dados, mas por diferentes conjuntos de usuários e um objetivo ligeiramente diferente em mente. Por exemplo, quando se trata do setor de varejo, os usuários de data warehousing estão mais preocupados com quais tipos de compras são populares entre os clientes, portanto, os resultados da análise podem ajudar o cliente, melhorando a experiência do cliente. Mas os mineradores de dados primeiro conjecturam uma hipótese, como quais clientes compram um determinado tipo de produto e analisam os dados para testar a hipótese. O armazenamento de dados pode ser realizado por um grande varejista que inicialmente estoca suas lojas com os mesmos tamanhos de produtos para depois descobrir que as lojas de Nova York vendem estoques menores muito mais rápido do que nas lojas de Chicago. Assim, olhando para este resultado, o varejista pode estocar a loja de Nova York com tamanhos menores em comparação com as lojas de Chicago.

Então, como você pode ver claramente, esses dois tipos de análise parecem ser da mesma natureza a olho nu. Ambos se preocupam em aumentar os lucros com base nos dados históricos. Mas é claro que existem diferenças importantes. Em termos simples, Data Mining e Data Warehousing são dedicados a fornecer diferentes tipos de análises, mas definitivamente para diferentes tipos de usuários. Em outras palavras, Data Mining procura correlações, padrões para apoiar uma hipótese estatística. Mas, Data Warehousing responde a uma pergunta comparativamente mais ampla e corta e corta os dados a partir daí para reconhecer formas de melhoria no futuro.

Recomendado: