terça-feira, 12 de maio de 2015

Data Warehouse, OLAP e Data Mining

O Data warehouse é um armazém de dados que tem como função armazenar informações detalhadas relativas a uma empresa, criar e organizar relatórios através de históricos que são depois usados pela empresa para ajudar a tomar decisões importantes com base nos fatos apresentados.

O data warehouse ajuda a extrair informações de uma empresa para que ela essa possa controlar melhor um determinado processo. Além de manter um histórico de informações, o Data Warehouse cria padrões melhorando os dados analisados de todos os sistemas, corrigindo os erros e restruturando os dados sem afetar o sistema de operação, apresentando somente um modelo final e organizado para a análise. Os dados que estão no data warehouse são disponíveis somente para leitura e não podem ser alterados.

A ferramenta mais popular para exploração de um data warehouse é a Online Analytical Processing (OLAP) ou Processo Analítico em Tempo Real, mas muitas outras podem ser usadas.

Por sua capacidade de analisar e armazenar grandes volumes de dados,o data warehouse é o núcleo dos sistemas de informações gerenciais e apoio à decisão das principais soluções de business intelligence do mercado.

O data warehouse foi criado com o objetivo de armazenar e acessar dados de forma que não seja limitados por tabelas e linhas, sua função é tornar as informações mais simples de serem administradas. 


Vantagens


  • Inconsistências são identificadas e solucionadas antes dos dados serem carregados, o que facilita a execução da análise e de relatórios;
  • Contribuem para o processo de tomar decisões, através de relatórios de tendências, de exceção e relatórios que revelam os objetivos versus desempenho real.


Desvantagens


  • Não são uma solução adequada para dados não-estruturados;
  • Podem ter custos elevados e podem ficar ultrapassados com alguma rapidez.

Data warehouse e Data mart


Um data mart é uma subdivisão ou subconjunto de um data warehouse. Os data marts são como pequenas fatias de data warehouse, que armazenam subconjuntos de dados.


Empresas com Data Warehouse


A Sabesp (Companhia de Saneamento Básico do Estado de São Paulo) já tinha seu data warehouse, porém, visando uma maior otimização de seus serviços ela decidiu por reformular seu banco de dados, investindo em infra-estrutura, software e consultoria. O novo data warehouse começou a rodar em 2006.
A Sears é a maior rede de lojas de departamentos e terceira maior varejista dos EUA e possuía 18 bancos de dados, um para cada região geográfica atendida pela empresa, e um para cada departamento.

A Coca-Cola precisava garantir o recebimento de dados diários de vendas enviados pelos fabricantes da Coca-Cola de acordo com o SLA acordado com a área de negócios e usou o SQL Server para criar uma solução que fornece visão global das vendas, com informações de 39 fábricas e suas franqueadas em todo o país.

A US West é uma empresa, sediada em Denver (EUA), provedora de serviços de telecomunicações, atendendo a 25 milhões de clientes em 14 estados, com 51.000 funcionários e 14,5 milhões de linhas de serviços. Com o tempo, os profissionais de sistemas de informação concluíram que era necessário renovação na área tecnológica da empresa para facilitar e otimizar o trabalho dos funcionários, que, até então, utilizavam tecnologias já obsoletas, além de uma forma de gerenciar quais produtos estavam sendo adquiridos pelos clientes e porquê, visando o processo de tomada de decisão.

Data Mining


Data mining ou mineração de dados consiste em uma funcionalidade que agrega e organiza dados, encontrando neles padrões,associações, mudanças e anomalias relevantes.



O papel de mineração de dados nos datawarehouse é realizar descobertas importantes, guiar um processo de decisão e prever o efeito dessas escolhas utilizando um grande volume de dados. São independentes um do outro, mas é possível obter melhores resultados quando aplicados em conjunto. Devido a essas características, Data Warehouses tendem a se tornar grandes repositórios de dados extremamente organizados, facilitando a aplicação do Data Mining.


OLAP


O OLAP (Online Analytical Processing - Processo Analítico em Tempo Real), é uma das ferramentas mais usadas para a exploração de um data warehouse. O OLAP possibilita alterar e analisar grandes quantidades de dados em várias perspectivas diferentes, pois usa múltiplas dimensões.

Cada aspecto de informação - preço, produto, custo, tempo, região - representa uma dimensão dos dados.




Referências

  • LAUDON, K. C e LAUDON, J. P. Sistemas de Informação Gerenciais. 9ª. Edição. Pearson, 2011
  • http://www.devmedia.com.br/a-tecnologia-de-data-warehouse-nas-organizacoes/5939#ixzz3ZyFT4Ysa
  • http://www.microsoft.com/brasil/servidores/sql/2005/evaluation/bi/casos.mspx
  • http://www.significados.com.br/data-warehouse/
  • http://www.significados.com.br/data-mining/
  • http://datawarehousedataminning2010.blogspot.com.br/

Nenhum comentário:

Postar um comentário