jueves, octubre 18, 2007

¿Qué modelo propones tú? (1ª Parte)

Hola amigos, hoy os propongo leer menos y participar más !!!!!!!.

A continuación os voy a poner un supuesto fichero de entrada, supongamos que procede del sistema operacional, y desde él vamos a ir generando diversas estructuras de datos, las cuales debeis explicar...


¿Qué crees que contiene el fichero? ¿Podrías obtener más información que la incluida "a primera vista"?

No os preocupeis, por el momento no existe mucha trampa o truco, solamente pretendo que todos seamos capaces de comprender el contenido del fichero.

Supongamos que deseamos montar un pequeñito modelo OLAP tomando como punto de partida ese fichero.

¿Qué diseño propones? Espero tus comentarios y la descripción o explicación de tu modelo.

Para todos aquellos que quieran participar en este ejercicio público e ir avanzado en las diversas técnicas de modelización entre lo dos... espero vuestros correos en jmarce@movistar.net

Todos los modelos propuestos serán incluidos, valorados, analizados y explicados.

Os espero.

24/10/2007

Hola a todos y gracias por vuestros correos y modelos propuestos. Os pediria que para ser exactos y no dar lugar a esquemas erroneos, me paseis el modelo ya representado a través de cualquier herramienta, solamente necesito el dibujo del modelo y con sus campos y claves identificados. Algunos ya me los habeis enviado, vale perfectamente en formato .jpg, simplemente es para incluir todos y ver la diversidad de vuestros planteamientos.

A continuacion os pongo los nombres o nick de los participantes, tampoco estaria mal tener vuestros e-mails para montar nuestro mini foro, pues algunos habeis contestado exclusivamente por la opcion de comentarios. Lista de participantes:

* Toad

* Juan Vidal

* Diego Arenas

* Alvaro Galan

* Jordi Isidro Llobet

Quedan dos personas de confirmar... pero podemos ir empezando. Según reciba los jpg de cada uno, lo pondremos en el blog y discutiremos las ventajas e inconvenientes. Tal y como os adelante, ire introduciendo nuevas necesiadades y conceptos para ir subiendo la dificultad.

Nota, ojo a los puristas de Kimball pues al final espero que podamos demostrar las limitaciones de las estrellas puras y otros trucos para hacer versionning y controlar los cambios sobre datos de dimensión, sin "putear" al usuario final con mil criterios temporales... ya veremos que conseguimos entre todos.

Una cosa más, habeis conseguido que cambie cierta percepción sobre el nivel en técnicas de diseño, pues algunos teneis un nivel muy bueno.



7 comentarios:

Diego Arenas C. dijo...

Hola,

En lo personal me gustaría un modelo ROLAP, en el modelo multidimensional separaría todas las descripciones como parte de las dimensiones y dejaría lo que queda en la fact table.

Con esos datos tenemos 4 dimensiones inmediatamente y cualquier jefatura quedaría impresionada con la información que se puede generar a partir de esos indicadores y los que se pueden crear como: Relacion Unidades vendidas sobre el volumen de descuento que se hace sobre el producto, o porcentajes de descuento por centros de venta, o el margen de costo por ventas, o analizar unidades mas vendidas por centro y seccion y comparlos con las demás y determinar la relacion con el coste y el descuento, además de todos los rankings que podemos hacer con esas dimensiones y cruces.

Para hacer el OLAP no habría mayor problema ya que el detalle es adecuado, ahora si queremos saber quiénes fueron esos compradores el modelo ROLAP u HOLAP nos daría una mejor aproximación al detalle.

Muy bueno tu blog (está en mi Google Reader) te cuento que me encanta el tema de BI y estoy aprendiendolo desde hace algún tiempo :D,
Saludos desde Chile,
Diego.

J.Mª Arce - Experto BI & Data Warehouse dijo...

Lo vamos a pasar bien, este fin de semana he recibido varios correos de colegas que estan rompiendose la cabeza y buscando soluciones.

Ojo algunos de ellos muy buenos. Lo cual me anima a ir complicando el "juego".

Tengo la seguridad de un par de personas más que quieren apuntarse, por lo tanto las vamos a esperar y seremos una familia más grande.

Os pasare en breve más indicaciones y algunos datos para ir mejorando los modelos. A cada uno se enviare un correo personal con lo bueno y lo "malo" detectado, para que las neuronas continuen trabajando a tope.

Posteriormente colgaremos todos los modelos y realizaremos una sana comparación...

Gracias a todos y os animo a seguir en el ajo, pues vamos a disfrutarlo.

Salu2,

toad dijo...

Yo diria que el fichero de input es básicamente un sistema de facturación de una gran superficie, aunque casi seguro que estoy equivocado...

Yo montaría un estrella Puro, lo siento pero me pierde Kimball...

Dimensiones:
Articulo - Con una slowly changing dimension
id_articulo Clave surrogada

Fecha_inicio
Fecha_fin
cod_articulo Clave Natural
desc_articulo

precio_unidad
coste_unidad
Son los campos que me obligan a implementar la slowly en la dimensión, ya que precio y coste son fluctuantes en el tiempo con respecto al código de producto

Dimension Tiempo
fecha_id Surrogate key
fecha_venta Clave natural
También implementaría los niveles año, mes, semana etc...

Dimension Punto de venta
Punto_venta Surrogate key
Cod_centro
cod_seccion Clave natural
+ descripciones
desc_centro
desc_seccion

Fact TAble
indicadores:
Unidades vendidas
Importe descuento
Total venta
La fact table tendra una Surrogate KEY de clave.
La clave natural será el conjunto de las FK de las dimensiones.

Haber que te parece.

Saludos,


TOAD

Alvaro dijo...

¿Que pasó con ese prost prometido de continuación?

Anónimo dijo...

Yo también tengo ganas....

Croac Croac

TOAD

J.Mª Arce - Experto BI & Data Warehouse dijo...

Hola a todos,

Simplemente estoy a la espera de recibir vuestras propuesta a través de E-mail y con el modelo en formato JPG para poder incluir en el blog, pues ciertamente tenemos limitaciones.

Ya tengo preparados algunos de los trabajos, están en borrador y pendientes intencionadamente de su publicación.

Por otra parte, antes de colgar vuestras respuestas, las cuales están muy bien, creo que para el resto de lectores les podria interesar ver una cierta evolución de estos modelos hasta llegar a las estructuras actuales, que en definitiva son algunas de vuestras propuestas.

Tambien algunos de vosotros os habeis adelantado un poco bastante son suposiciones que a priori no son necesarias, como claves arrastradas de los operacionales, etc... pues con la información facilitada, la cual casi es nula, no es correcto, pues ¿Que pasa si las claves del operacional son Alfanumericas? seguramente cambiariais de criterio... ya llegaremos.

Por favor, mandar vuestros emilios para dar actividad al Chema.

Saludos,

Jose Zarate dijo...

Te mande mi modelito a tu correo a ver que opinas....

Coloque algunas locuras para hacerlo mas discutible...

Saludos
Jose Zarate
www.blobgle.com

Seguidores