miércoles, mayo 30, 2007

La Guerra de las Galaxias – Episodio 0 – Introducción

Bajo tan sugerente titular, manía habitual del humilde autor, se esconde una serie de episodios que voy a ir tratando de narrar sobre tipos de modelos de datos de aplicación en Data Warehouse, lo cual implica que trataremos de dar un repaso a toda la familia OLAP al completo, desgranando algunos de sus secretos, misterios y curiosidades. He elegido este titulo por pura similitud con algunos de los conceptos (estrellas, copos de nieve) y otras tonterías que uno ha ido leyendo en estos años (universos, constelaciones, etc.) .

Tal vez y en función de vuestras peticiones, continuaremos con temas más avanzados relacionados con tipos de claves (simples, compuestas, operacionales, especificas dw, etc.), continuando con las trampas de abismo y las trampas de abanico (de aparición casi por un mal diseño del DW), uso y soluciones para gestionar tablas de relación dentro de las dimensiones de negocio y un sin fin de temas que normalmente nadie quiere contar, como el Data Warehouse y la conveniencia o no del tiempo real, uso de la integridad referencial, el versioning, efectos de los cambios según tipos de modelos, etc.


Tal vez sería interesante antes de empezar, intentar poner alguna convención común a un mar de siglas, habitualmente mal usadas.

Una solución de BI debería llevar por debajo un DW, los DW residen en bases de datos. Las bases de datos de DW son siempre enfocadas a negocio (OLAP) y no al proceso, por ello su forma de ser diseñadas son diferentes a las bases de datos transacionales u operacionales (OLTP).

OLAP- es el acrónimo en inglés de procesamiento analítico en línea
OLTP- es el acrónimo en inglés de procesamiento de transacciones en línea

Dentro de la familia OLAP podemos encontrar dos tipos de almacenamientos reales:

· MOLAP: Son bases de datos multidimensionales PROPIETARIAS (MDDB de SAS Institute, Oracle Express, Essbase Hyperion, etc.).
· ROLAP: Es un diseño multidimensional sobre un gestor relacional. Pudiendo tener diferentes tipos de modelos, tema del cual ya hablaremos.
· HOLAP: Solución Hibrida que combina ambas técnicas en una única solución, habitualmente o preferiblemente de forma transparente para el usuario final.

Existen otros términos usados en el mercado, pero suelen obedecer más a características aisladas de los fabricantes que a tipos reales de almacenamiento:

· DOLAP, la “D” de Desktop indica que la información, según fabricante, se “deposita” en nuestro propio PC mientras es requerida y consultada (más o menos).
· JOLAP, estupidez usada hace unos pocos años para indicar que el acceso a los datos era mediante JAVA… todavía no entiendo a que venia esto, pero bueno podeis encontraros esta maravillosa terminología por algún sitio.

Una vez, matizados de forma muy breve estos conceptos, seguiremos poco a poco con nuestra particular serie de “La Guerra de Las Galaxias”, que la disfrutéis.

José María Arce. 30/05/2007

4 comentarios:

Jorge Fernández González dijo...

Perfecto, al fin te has decidido.
Podrias empezar el episodio 1 con un titular así: "OLAP y MULTIDIMENSIONAL ¿SON LO MISMO?"
Seguro que generas debate :-D

Jose Maria Arce dijo...

Hola a todos, la pregunta que nos hace Jorge es muy interesante, pues como mostrare un día de estos, Jorge y yo hemos intercambiado muchos correos privados sobre este punto.

A petición de Jorge Publicare casi integramente nuestras "conversaciones", para que podais evaluar a dos zumbados y apasionados del BI.

Anónimo dijo...

Hola Jose María,

Una consulta sobre tu artículo.

¿Puede considerarse ROLAP un modelo en estrella sobre una base de datos Oracle relacional?.

Ejemplo:

Tablas de hechos: ventas
Dimensiones en estrella: pais, divisa, etc…

Cada tabla de hechos y dimensiones es una tabla típica de Oracle. Cruzan hechos y dimensiones por el campo dimensión.
Ej: en la tabla de ventas tenemos el campos país que cruza con la dimensión país.

¿Esto es ROLAP?.

Te lo pregunto, porque he oído utilizar ROLAP para muchas cosas y me termina pareciendo un termino confuso.

Un saludo y gracias.

Juan V.

Jose Maria Arce dijo...

Amigo Juan V.,

En primer lugar bienvenido y gracias por participar. Después comentarte que posiblemente voy a montar una sección de preguntas, pues me parece interesante y muy positivo dar a conocer respuestas. Es decir, cuando tenga algo de tiempo empezare por la tuya.

Sobre tu pregunta:
En teoria y siendo purista, en el momento que montas un modelos OLAP bajo una base de datos relacional, lo podriamos denominar ROLAP.

¿Qué entiende el mercado por ROLAP? lo habitual son modelos copo de nieve bajo base de datos relacionales. Uno de los pioneros en este concepto fue Microstrategy, muy castigado y criticado por la competencia. Pero la realidad es que sus diseños y capacidades bajo este tipo de modelos supera con creces a todos sus oponentes, gracias especialmente a un motor propio de genración de Querys y bla, bla, bla.

En terminos de la calle:
MOLAP - > BBDD multidimensional propietaria.
OLAP -> Aplicado a BBDD relacionales y con modelos estrella.
ROLAP -> Aplicado a BBDD relacionales y con modelos copo de nieve.

Al final, estrella y copo de nieve es lo mismo, y se puede demostrar. Ambos modelos son o se usan en OLAP y por estar bajo gestor relacional deberían llevar la R por delante, es decir, ROLAP, pero se impone la nomenclatura de la calle que antes he mencionado.

¿Aclarado?
Saludos,
Chema Arce.

Seguidores