Arquivo por tag: business intelligence

ago 08 2011

Modelagem Dimensional (Parte 03)

Pessoal, para terminarmos essa série de artigos sobre modelagem gostaria de deixar aqui algumas dicas valiosas que devemos considerar antes de começarmos a desenhar o modelo. Antes de mais nada é bom deixar claro que o objetivo desses artigos não é ensinar a modelar e sim a identificarmos pontos críticos em nossos projetos a fim de que possamos ter uma boa base para tomar a melhor decisão em relação a projetos de BI.

Devemos considerar no processo de modelagem, o negócio a ser modelado, aspectos da modelagem conceitual e modelagem lógica.

1 – O negócio

• Definir Área(s) de Negócio.

– Prioridades? Mercado? …

• Quais processos na área de negócio vai ser contemplado no modelo.

• Decidir Granularidades.

– Volume? Performance?

• Definir Dimensões, Atributos e Hierarquias.

• Definir métricas dos Fatos
– Valores Aditivos? Semi-Aditivos? Não-Aditivos?

2 -Modelagem Conceitual

– Esboce um modelo dimensional antes de efetivamente construir um modelo em alguma ferramenta de mercado, para nos auxiliar nessa atividade vale fazer uso de um modelo ER, caso o mesmo exista.

– Analisando o modelo ER poderemos identificar alguns Candidatos a Dimensões se observarmos essas regras simples:

• Entidades, relacionamentos 1:n.

– Candidatos a Fatos:

• Entidades que expressam documentos: NF, OC..

• Relacionamentos n:m com atributos numéricos.

– Atributos de dimensões com hierarquias ou relacionamento n:m entre eles sugerem agregados.

– Métricas de Fatos devem ser aditivas…

3 -Modelagem no Nível Lógico

No modelo logico devemos considerar as seguintes dicas:

– Tabelas fato são (em geral) normalizadas.

– Tabelas dimensão são desnormalizadas (ou
eventuamente normalizadas em Snowflakes).

– A granularidade do DW é em geral maior que a dos
DMs, portanto devemos ter cuidado de não transgredir essa regra.

Observando essas regras poderemos construir modelos de melhor qualidade e que atendam aos requisitos de negócio.

Espero que tenham gostado.

jul 19 2011

Modelagem Dimensional (Parte 02)

Junk Dimensions

Continuando nosso estudo sobre modelagem, hoje falaremos sobre uma dimensão em particular chamada de Junk Dimensions.

Vale sempre lembrar que o tipo de tabela utilizada em uma modelagem dimensional vai depender do tipo de negócio que estaremos modelando, ou seja, o conhecimento do negócio é primordial para que se faça uma modelagem coerente.

Uma das principais razões para que se construa uma dimensão Lixo se dá ao fato de encontrarmos ambientes transacionais complexos com uma variedade grande de atributos e dados (textos e flags). Esses dados muita das vezes não estão organizados de forma coerente e seu significado é obscuro.

A criação dessa dimensão Lixo em um ambiente de BI deve ser feita com muito cuidado para evitarmos erros de projeto.

Abaixo apresentamos um exemplo de uma dimensão Lixo.

Soluções que devem ser evitadas:

  • Deixar os flags e os atributos inalterados na tabela fato, pois a mesmo pode crescer muito;
  • Criar uma dimensão para cada flag ou atributo, pois poderá existir um número muito grande de dimensões no modelo construído;
  • Excluir todos os flags e atributos da modelagem, pois poderemos excluir algum item importante para o negócio.

 

Ao se analisar o dado para se construir uma dimensão dessas, devemos levar em consideração todos os flags e atributos textuais com o objetivo de criarmos uma ou mais dimensões Lixo. Abaixo seguem algumas dicas do que se deve fazer na hora de modelar uma dimensão Junk.

Cuidados na hora da modelagem:

 

  • Retirar os vários indicadores sim/não da tabela fato e levar todos para uma dimensão única
  • Cada um dos indicadores pode não estar correlacionado com os outros ou com as outras dimensões.
  • Quando estamos analisando um negócio onde encontramos muitas flags, devemos ter em mente que a dimensão lixo é um ótimo lugar para se armazenar todos esses flags.

 

Resumidamente podemos definir uma Dimensão Lixo como sendo um agrupamento de flags e atributos randômicos retirados da tabela fato e inseridos em uma dimensão.

Uma boa prática em desenvolvimento de projetos BI é reavaliar sempre a modelagem escolhida. O ajuste faz parte da evolução do modelo e dos projetos em si.

jul 18 2011

Modelagem Dimensional (Parte 01)

Hoje vamos começar uma série de dicas sobre um aspecto de muita relevância em um projeto de BI, que é a modelagem dimensional.

Como uma boa prática em projetos de BI é de extrema importância se conhecer o negócio no qual se está propondo atender.  A partir do conhecimento do negócio, métricas utilizadas, como são usadas as informações, etc. Conseguiremos elaborar uma arquitetura de BI que atenda aos requisitos de negócio e proporcione um crescimento do BI de forma organizada e estruturada.

O objetivo desse artigo é trazer alguns conceitos de modelagem dimensional que proporcione ao leitor um rápido entendimento do conceito tratado e ajude no dia a dia profissional de todos.

Slowly Changing Dimensions

Começaremos a nossa série de estudos analisando características dessa dimensão tão peculiar.

Vejamos:

  • Dimensões que mudam lentamente ao longo do tempo.
  • Dimensões que mudam ocasionalmente e esporadicamente, como produto e cliente.
  • As chaves dessas dimensões não mudam, porém os atributos que o descrevem mudam.

Exemplo: descrição de um produto ou de um cliente.

Existem algumas formas de se tratar essa dimensão vejamos alguns tipos:

Forma 1: Sobrescrever o registro da dimensão com os novos valores, perdendo o histórico.

Adequado para os casos em que o valor antigo do atributo não tem importância ou pode ser descartado.

Forma 2: Criar um novo registro na dimensão, com uma nova chave de identificação.

  • Técnica básica para rastrear as mudanças de um atributo em uma dimensão.
  • É necessária uma chave surrogada. A chave da dimensão não pode ser alterada.
  • Avaliar o uso de atributos do tipo data de início e fim para documentar o período em que aquele registro permaneceu válido.

Existem algumas outras formas de se tratar uma dimensão Slow Change mas as duas formas principais são essas apresentadas.

Devemos ter muito cuidado ao adotar esse tipo de dimensão em nosso projetos  para não gerarmos confusão entre os usuários finais.

Espero que tenham gostado desse primeiro artigo, estaremos voltando com outros aspectos da modelagem dimensional que nos ajudará também tecnicamente a elaborar um Universo adequado quando utilizamos em nossos projetos a ferramenta SAP BO.