jueves, abril 20, 2006

MENSAJE EN UNA BOTELLA

No crean que vamos a hablar de bebidas, ni tampoco de cine (pues existe una maravillosa película con dicho titulo), simplemente es casi un reclamo de atención dirigido a ustedes, y que al final de mi reflexión dejo a su audaz interpretación.

Hoy querría compartir con todos una reflexión, casi en voz alta, estando seguro de que lamentablemente muchos se podrán ver reflejados, pero nada más lejos de mi intención el incomodar a alguien, como les digo se trata de una reflexión tras 10 años involucrado exclusivamente en proyectos de Business Intelligence.

Hace unos pocos años, éramos pocos los que predicábamos hablando sobre la necesidad de integrar la información, la dificultad en encontrar el dato apropiado, la falta de estrategia (más allá de la meramente financiera), de los inconvenientes de las islas de información en las organizaciones, de la multitud de datos existentes y ocultos en los equipos personales de nuestros empleados, de la perdida de tiempo en la búsqueda de la información y del poco tiempo para analizarla, etc.

Aparecía en España, el termino “Data Warehouse”. Era una cosa maravillosa, casi algo mágico, pues era meter datos y sacar información, algunos incluso decían sabiduría. Algunos comerciales muy “espabilados” vendían que era un sistema para preguntar todo, de todo y por todo. Es decir, gran expectación igual a mayor fracaso.

En aquellos años era muy sencillo “vender” este tipo de soluciones, pues eran y son realmente espectaculares. Pero muy pocas compañías ofrecían este tipo de servicios y menos aun tenían recursos medianamente preparados, por cierto, que en este punto tampoco hemos mejorado mucho, tenemos conocimientos asociados a producto y falta mucho conocimiento alineado con el negocio.

Entre los cientos de argumentos que se empleaban, uno de ellos era la integración en un único repositorio, almacén central y/o Data Warehouse. Después llegaban las guerras de cómo implementar este tipo de sistemas, las famosas visiones monolíticas en contrapartida con los sistemas departamentales. Cada uno defendía, a capa y espada, que su alternativa era la más adecuada, eso sin entrar en temas de siglas como; OLAP, MOLAP, ROLAP, HOLAP, DOLAP, etc.. o en temas de tipos de modelos de datos (modelos en estrella y modelos copo de nieve). En fin, una bonita confusión provocada y casi promovida por nosotros mismos, los consultores, eso sí también con estimable ayuda de algunos fabricantes de software.

Hoy en día, aunque parezca mentira, el escenario ha cambiado muy poco. Los mismos argumentos que se daban de integración están aun más vigentes, para solucionar los mismos problemas o enmascarados en otros, a través de nuevas siglas. Nos hablan, y se les llena la boca, de la calidad de datos, pues bien eso ya se decía a mediados de los 90 y además con una frase que posiblemente a dado la vuelta al mundo unas cuantas veces, “Sí metes basura, sacaras basura”.

Antes disponíamos de un sin fin de aplicaciones operacionales con sus correspondientes almacenamientos.

Pues hoy también disponemos de una gran variedad de almacenamientos, de supuestos Data Mart e incluso Data Warehouse. Hemos pasado de la pesadilla en la búsqueda de la información en los almacenamientos operacionales (figura 1),


Figura 1: La pesadilla en búsqueda del dato.

al caos bajo supuestos almacenamientos de negocio con estructuras multidimensionales, tanto implementadas sobre almacenamientos relacionales como a través de bases de datos multidimensionales propietarias.


Como podrán observar he dicho intencionadamente la palabra “supuestamente”, pues en estos últimos he tenido la oportunidad de estudiar diversas soluciones in situ en mis clientes, detectando la precariedad de los modelos de datos, el parcheado físico de los mismos, la falta de conocimiento real en su diseño, el incorrecto uso de las claves y de sus tipos, la escasa lógica en la creación de agregaciones de información, etc…

Todo ello termina por provocar el plantearse nuevas necesidades y soluciones. Llegando a este punto, algunos clientes culpan a sus herramientas de explotación de sus males, otros piensan que la solución es poner nuevas estructuras de información, lo cual añade mayor complejidad al sistema y unos mayores costes en mantenimiento, licencias, consultoría, etc…

Son muy pocos los que se cuestionan si su Data Warehouse esta correctamente diseñado, y menos aún los que recurren a nosotros para realizar un análisis en profundidad de su almacenamiento. Sabiendo de antemano que la siguiente afirmación no es políticamente correcta e incluso poco respaldada, me atrevería a decir que en un porcentaje elevadísimo, sus supuestos Data Warehouse son básicamente un “bonito” saco de información más o menos estructurada. Esta afirmación es fruto de mis experiencias personales y acreditadas a través de diversas sesiones que he realizado, de forma gratuita, con varios de mis clientes, y ellos bien lo saben.

Simplemente y para terminar mi reflexión, les invito a analizar y contrastar la adecuación de su Data Warehouse o Data Mart a sus necesidades, resaltando que es fundamental tener unos buenos cimientos antes de seguir construyendo la casa de nuestros sueños. Una casa llena de “Customer Intelligence”, preciosos cuadros de mando, excepcionales Balanced Scorecard, BPM y demás soluciones, las cuales fomento, desarrollo, creo y defiendo, pero también creo que el planteamiento actual, o mejor dicho, el como llevarlas a la practica, de forma independiente las unas de las otras y sin una fuente única e integrada de la información es un error de libro, llegando a ocasionar el efecto contrario, por la disparidad de la información obtenida, ocasionando que el exceso de análisis conduzca a la parálisis.

Aquí les dejo mi reflexión, en forma metáfora, les dejo la botella para que cada uno la vea como quiera. Algunos dirán medio llena y otros medio vacía.

Simplemente asegúrense de que por lo menos tienen una botella, es decir, un correcto Data Warehouse.

José María Arce
jmarce@movistar.net

4 comentarios:

Favia dijo...

Hola, me parece familiar toda tu reflexión. Nosotros estamos en esa etapa que ustedes pasaron en los 90 y que por lo visto no cambia como tú dices. Todos quieren información para tomar decisiones y piensan que comprar un software será la solución mágica. Desde el año pasado estoy tratando de empaparme de estos nuevos conceptos y es todo tan relativo. Nosotros partimos haciendo cubos con ms sqlserver (
analisys services), para explotarlos con excel. Ha sido un arduo trabajo pero siempre quedo con la sensación de que no es lo que estamos buscando. ¿Cómo me podré ordenar en este mundillo de las BI?

Unknown dijo...

Hola Favec,

Con independencia de mi opinion sobre las soluciones de Microsoft, lo que me parece más preocupante es que a estas alturas del siglo se continue con la filosofia de diseñar "cubos", en lugar de un correcto Data Warehouse y desde este DW crear de forma sincronizada los necesarios "cubos".

Creo que podeis llegar al caos bajo soluciones multidimensionales. He tenido clientes que empezaron con un "cubo", luego otro, otro... hasta llegar a 114 "cubos", esto es un error imperdonable.

Por aqui me tienes,
Un saludo,
José María Arce

josearceargos@hotmail.com

Anónimo dijo...

Hola Jose María,

Trabajo también en este mundillo , antes trabajé con aplicaciones operacionales y he podido ver la diferencia entre unas y otras.

En el mundillo Data Waraehouse me he movido siempre con bases de datos Oracle, Microstrategy y como herramienta ETL SAS.

Conozco más la parte de base de datos y ETL que la de informes y explotación de datos. Quería preguntarte por SAS, ¿qué te parece SAS como herramienta ETL?, me refiero a módulos tales como SAS/WA, SAS/BASE, SAS/ACCESS, etc..., he oido hablar de otras herramientas tipo Data Stage, Powercenter, Oracle Warehouse Builder, pero nunca he llegado a conocerlas a fondo.

Un saludo

Juan

Unknown dijo...

Buenos días Juan,

Hombre comprar abiertamente herramientas ETL es complejo y posiblemente algo injusto.

Cada una tiene sus ventajas e inconvenientes. Normalmente hacemos Benchmarking para clientes para ver cual se adapta mejor a sus necesidades reales, a sus problemas, tipos de fuentes, tipos de ficheros, tambien en función de la dificultad de los procesos (ojos no todas tienen las mismas potencias) y sobre todo los precios y/o costes de alquiler (pensando en SAS).

Sobre SAS te podria hablar bastante pues trabaje casi 3 años en SAS.

Powercenter, me gusta mucho, esta teniendo mucho exito y grandes compañías han optado por ella... cuando el rio suena... Ojo es una alternativa seria y comparando precios, no esta nada mal.

De todas formas para evitar comentarios erroneos y evitar comparaciones injustas, seria mas adecuado ver este tema más detenidamente y fuera del blog.

En cualquier caso, mi consejo es: ponte en contacto con los fabricantes del software de tu interes, ellos estaran encantados de hacerte sus demos y demostrarte (sin coste) lo mejor de sus productos.

Si tienes dudas y quieres un estudio serio y más objetivo, simpre puedes pedir ayuda a empresas o profesionales como nosotros.

Un cordial saludo,
José María Arce.
josearceargos@hotmail.com

Seguidores