Descubre el mundo de las Tablas de Dimensión en Power BI, desglosaremos conceptos clave y aplicaciones prácticas de manera visual e intuitiva.
En esta ocasión vamos a sumergirnos en uno de los conceptos esenciales del modelado de datos utilizando Power BI las: Tablas e Dimensión.
Es importante mencionar, que este vídeo y artículo proviene de una lección clave de nuestro curso sobre Modelamiento de Datos con Power BI, abordando conceptos cruciales en el modelado y cómo estos son fundamentales para los analistas de Power BI. Nuestro objetivo es tanto reforzar tu conocimiento existente como aclarar estos conceptos si son nuevos para ti.
Tablas de Dimensión
Una tabla de dimensión en el modelado dimensional es una estructura que se utiliza en el ámbito de las bases de datos, especialmente en el diseño de almacenes de datos (data warehouses) y en la inteligencia empresarial (business intelligence), para organizar y describir las características del negocio o entidades sobre las cuales se realiza el análisis de datos.
Imagine que está analizando las ventas de una tienda. La tabla de dimensión podría compararse con un archivo detallado de tarjetas de índice, donde cada tarjeta representa un aspecto único de la información de venta, como la tarjeta de un cliente, que contiene nombre, edad, dirección; o la tarjeta de un producto, que tiene información como el nombre del producto, categoría, y precio. Estas “tarjetas” permiten clasificar y filtrar las ventas basándose en estos detalles, facilitando comprender y descubrir tendencias, como qué productos son populares entre ciertos grupos de edad o en diferentes regiones geográficas.
Al igual que las tarjetas de índice le ayudan a buscar información específica en una biblioteca, las tablas de dimensión ayudan a los analistas a explorar y entender grandes volúmenes de datos en un data warehouse, proporcionando contexto y significado a los números que se encuentran en las tablas de hechos.
Existen diversos tipos de tablas de dimensión, aquí un vistazo global:
Dimensión de Copo de Nueve
Dentro de los distinto tipos de Tablas de Dimensión tenemos la dimensión en copo de nieve.
La dimensión copo de nieve en modelado dimensional es una versión más compleja y detallada de una tabla de dimensión. En lugar de tener toda la información en una sola tabla grande, como en una dimensión estrella, la información se desglosa en múltiples tablas interconectadas, formando una estructura que se ramifica y parece un copo de nieve.
Utilizando una analogía simple, si una dimensión estrella es como un resumen directo de un libro, la dimensión copo de nieve sería como tener el mismo resumen con anexos detallados que profundizan en cada capítulo, personaje o tema, proporcionando una descripción más detallada y organizada.
La siguiente imagen lo ilustra:
Dimensión Lentamente Cambiante
Dentro e las tablas de dimensión también tenemos las dimensiones lentamente cambiante.
En el modelado dimensional se refiere a las técnicas utilizadas para gestionar y rastrear los cambios en los datos de dimensión a lo largo del tiempo. Estas dimensiones reconocen y preservan el historial de datos, incluso cuando la realidad empresarial que representan cambia.
La analogía más simple sería pensar en una dimensión lentamente cambiante como un álbum de fotografías de un paisaje a través de las estaciones. Aunque el lugar es el mismo, las fotos muestran cómo cambia su aspecto con el tiempo. De manera similar, una dimensión lentamente cambiante permite ver y analizar cómo eran los datos (como la dirección de un cliente o el precio de un producto) en diferentes puntos en el tiempo, no solo cómo son en el presente.
Aquí una ilustración:
Dimensión no Deseada
En los tipos de tablas de dimensión también tenemos las: dimensiones no deseadas.
Aquí una ilustración:
Dimensión Degenerada
Una dimensión degenerada en el modelado dimensional es un término técnico para indicar un tipo de tabla de dimensión que se refiere a un atributo de datos que funciona como una dimensión pero que en realidad se almacena en la tabla de hechos, en lugar de en su propia tabla de dimensión separada. No tiene su propia tabla de dimensión porque los valores son únicos para cada fila (transacción) y no tienen atributos descriptivos adicionales.
Imagina que tienes un recibo de compra con un número de pedido único. Ese número de pedido se puede considerar una dimensión degenerada. Es importante para rastrear y analizar las transacciones individuales, pero no tiene sentido crear una tabla de dimensión completa alrededor del número de pedido, ya que el único dato relevante es el número en sí, y no hay otros atributos descriptivos que necesiten ser almacenados o analizados.
Aquí una ilustración:
Dimensión de Rol
Una dimensión de rol en el modelado dimensional es una dimensión que se utiliza para diferentes propósitos dentro del mismo modelo de datos. Básicamente, es la misma tabla de dimensión que se reutiliza para múltiples roles o contextos, pero cada uso representa un aspecto diferente de los datos.
Pensemos en una analogía sencilla: es como un actor en una obra de teatro que interpreta varios personajes. El actor es el mismo, pero el papel que desempeña varía según la escena. Del mismo modo, una dimensión de fecha puede utilizarse para representar la fecha de venta, la fecha de envío y la fecha de recepción en un modelo de ventas. Aunque la estructura subyacente de la dimensión de fecha es la misma (año, trimestre, mes, día, etc.), su “rol” cambia según el hecho que está describiendo.
Aquí una ilustración:
Conclusiones
Las tablas de dimensión y sus distintos tipos son elementos críticos en la arquitectura del modelado dimensional, proporcionando el marco necesario para un análisis de datos efectivo y eficiente. Aquí hay algunas conclusiones clave sobre su importancia: