EL MODELO COMO PUNTO DE PARTIDA DEL ANÁLISIS
Una de las claves antes de analizar datos a través de cualquier herramienta de Business Intelligence es la de tener el modelo correctamente acotado y ordenado.
En el lenguaje de un controller, esto es similar a tener bien diseñado un modelo de costes. Muchas veces nos encontramos con empresas que toman decisiones basadas en modelos que, aunque puedan no ser incorrectos del todo, están lejos de su potencial analítico.
CUÁNDO TIENE SENTIDO ACOTAR EL MODELO
En la práctica es muy común que nos encontremos con grandes bases de datos que pretenden alimentar nuestras herramientas de análisis. Sin embargo, desde mi punto de vista, cuando hacemos excesivamente complejo nuestro modelo, dificultamos tanto nuestro trabajo de análisis e interpretación de los resultados como el de entendimiento por los departamentos que han de tomar las decisiones correspondientes.
Por todo ello, en herramientas como Power BI, recomiendo acotar el modelo en la fase de transformación de datos (Power Query), en función de los siguientes criterios:
- Eficiencia del modelo para responder rápido y de forma ágil al análisis. Esto tiene sentido cuando:
- Tenemos datasets muy grandes
- Sabemos que nunca usaremos ciertos datos para el análisis
- Necesidad de un modelo específico. Es decir, estamos buscando informes dedicados a una línea de negocio, por ejemplo.
- Mejora de la estructura y calidad del modelo. En general, un mayor orden y estructura son sinónimos de mayor calidad del modelo.
EJEMPLO DE ACOTAMIENTO DEL MODELO: DIFERENTES CONSULTAS EN POWER QUERY
Un ejemplo en el que este acotamiento tiene sentido es una empresa que tiene diferentes líneas de negocio. Es decir, intentar segmentar el análisis de los diferentes productos (capa inferior a línea de negocio) en queries independientes nos haría perder capacidad de análisis o, incluso, paradójicamente, empeorar el rendimiento al generar un modelo fragmentado y menos eficiente desde el punto de vista analítico (fragmentar no equivale a acotar el modelo).
Por el contrario, cuando nos encontramos con líneas de negocio claramente diferenciadas, el uso de consultas independientes en Power Query permite estructurar el modelo de forma más eficiente y orientada al análisis. Lo importante no es dividir por dividir, sino hacerlo únicamente cuando aporte valor al modelo y, en consecuencia, a la calidad de nuestro trabajo.
Para ilustrar este post, utilizamos una empresa que cuenta con tres líneas de negocio, a la que denominamos CICLADA.
Estas líneas de negocio son las siguientes:
- Venta de bicicletas
- Venta de componentes
- Venta de recambios
A continuación, se muestra un ejemplo de cómo se estructuraría este modelo en Power Query:
Ilustración 1

Para construir este modelo, partimos de una única base de datos común (BD CICLADA), desde la que hemos generado una consulta por cada línea de negocio en Power Query. Posteriormente, deshabilitamos la carga de esta base de datos, para que no vaya a nuestro informe de Power BI.
Cada una de estas consultas se estructura siguiendo los mismos campos clave (categoría, subcategoría y nombre del producto), filtrando la información en función de la línea de negocio que queremos analizar.
De este modo, conseguimos separar el modelo en bloques independientes, sin perder coherencia en la estructura de los datos, lo que facilita tanto el análisis como la interpretación de los resultados.
A continuación, una vez estructurado el modelo en Power Query, el siguiente paso es facilitar su explotación en Power BI. A partir de ahí, un pequeño apoyo puede ser la creación de jerarquías que permitan analizar la información de forma progresiva
Ilustración 2

LIMITACIONES DEL MODELO EN ENTORNOS CON LÍNEAS DE NEGOCIO INTERRELACIONADAS
En el caso concreto de CICLADA, nos encontramos con una empresa con líneas de negocio separadas, aunque en algunos casos pueden incluir productos complementarios. Es decir, un incremento de la venta de bicicletas, puede implicar un aumento de la venta de componentes.
En este caso, puede quedar en duda la utilidad de la segmentación en queries independientes de las distintas líneas de negocio. No obstante, lo que determinará esta decisión no será tanto la relación comercial de los productos como el objetivo analítico del modelo, que será en última instancia subjetivo.
Por tanto, en los casos de líneas de negocio distintas, pero con productos complementarios, interesaría tener consultas separadas si:
- Buscamos específicamente informes independientes por línea de negocio
- Existen responsables diferenciados para cada línea
- Se gestionan cuentas de resultados analíticas separadas
- No consideramos necesario analizar la interrelación entre las líneas de negocio
- El volumen de datos justifica una segmentación del modelo
En cambio, resultará más conveniente no separar las consultas si:
- Queremos analizar el comportamiento conjunto del negocio
- Existe interdependencia relevante entre productos o líneas de negocio
- Se requiere explotar relaciones entre los datos, en línea con un modelo relacional de tipo estrella.
