Data Mining - O que é, definição e conceito

Índice:

Anonim

A mineração de dados é o processo de pesquisa de grandes bancos de dados para encontrar informações úteis que podem ser usadas para a tomada de decisões. O termo inglês "data mining" também é usado.

Pode ser entendido como a tecnologia e o software usados ​​para encontrar padrões de comportamento no banco de dados. A base fundamental para isso é que esses padrões ajudam na tomada de decisões. Por exemplo, pode ajudar as empresas a compreender os padrões de comportamento de seus clientes. De forma a facilitar o estabelecimento de estratégias para aumentar as vendas ou reduzir custos.

Vantagens da mineração de dados

A vantagem fundamental deste processo de análise de dados é o grande número de cenários de negócios aos quais pode ser aplicado, como exemplo temos:

  • Predição: Previsão de vendas da empresa.
  • Probabilidade: Seleção dos melhores clientes para contato direto por telefone ou e-mail.
  • Análise de sequência: Análise dos produtos que os clientes compraram e verificar a inter-relação entre eles.

Estágios de mineração de dados

Dentro de um processo de mineração de dados, podemos encontrar cinco fases:

  • Objetivo e coleta de dados: Em primeiro lugar, devemos nos concentrar no tipo de informação que queremos obter. Vamos imaginar o exemplo em que um supermercado deseja saber em que hora do dia ocorre mais atendimento. Esse seria o objetivo e a informação que o trade deseja obter neste caso.
  • Processamento e gestão de dados: Assim que conhecemos os dados que queremos coletar, colocamos os dados para funcionar. Esta é talvez a fase mais difícil do processo. Bem, isso requer a seleção da amostra representativa na qual a análise será realizada. Uma vez escolhida a amostra, deve-se analisar que tipo de variáveis ​​ou modelo de regressão se vai realizar na amostra.
  • Seleção de modelo: Está intimamente relacionado com a fase anterior. Trata-se de criar um modelo ou algoritmo que nos dê o melhor resultado possível. Para tanto, deve ser realizada uma análise exaustiva das variáveis ​​a serem incluídas no modelo. Isso se torna uma tarefa complicada, pois vai depender do tipo de informação a ser analisada. Portanto, os mineradores de dados realizam diferentes testes do algoritmo, como: regressão linear, árvore de decisão, série temporal, rede neural, etc.
  • Análise e revisão dos resultados: Basicamente, é para analisar os resultados para ver se eles fornecem uma explicação lógica. Explicação que facilita a tomada de decisão com base nas informações fornecidas pelos resultados.
  • Atualização de modelo: A última etapa do processo seria a atualização do modelo. É muito importante que seja feito ao longo do tempo para que não se torne obsoleto. As variáveis ​​do modelo podem se tornar insignificantes e, portanto, é necessário um controle periódico do modelo.