Ir al contenido principal

Business Intelligence: Cuáles son los datos que se deben almacenar?

Antes de poder iniciar la construcción del mismo se debe tener muy claro cuales son los datos que se deben almacenar:
·         Metadata.
·         Tablas de negocio para usuarios
·         Tablas de Datos
·         Tablas de datos concentrados


METADATA (REGLAS DE EXTRACCIÓN Y TRANSFORMACIÓN DE DATOS)

El  Metadata de la Extracción de datos es importante para el sistema de Business Intelligence. Este es un mapa que muestra el cómo existe el dato en el sistema fuente, los procedimientos que se tienen que llevar a cabo para transformarlo y finalmente donde residirá en el sistema de Business Intelligence. Es un término que hace referencia a datos acerca de los datos, contiene una descripción detallada de la estructura, conteniendo, llaves e índices de los datos y es usado en todo el sistema de Business Intelligence desde la extracción hasta el acceso.

Es necesario decidir si el proceso de limpieza, transformación y sumarización se llevará a cabo en el ambiente fuente o en el ambiente del sistema de Business Intelligence, tomando en cuenta el impacto que esto podría tener en la operación cotidiana de la empresa.

Además:
·         El Metadata de la extracción y transformación hace un mapeo de la estructura de los datos fuente y define como el dato es transformado dentro del nuevo formato para el sistema de Business Intelligence.
·         El Metadata para el usuario final, describe la localización y estructura de los datos para el acceso del usuario.


El Metadata es mantenido por los procesos de extracción, transformación y trasportación (o productos específicos para ETL y son accesados por el usuario final sujetándose a estas aplicaciones.

EL Metadata puede ser usado por administradores de bases de datos que necesitan ver las fuentes de valores de datos específicos y administradores que dan mantenimiento al contexto de la información.

Las definiciones de algunos datos pueden cambiar con el tiempo, por ello Metadata mantiene un registro de esos cambios, permitiendo a los usuarios analizar los datos en el contexto correcto

Administración del Metadata.

Normalmente el Metadata reside en el Servidor sobre la plataforma del sistema de Business Intelligence, debe tenerse actualizado todo el tiempo a fin de garantizar que el proceso y los usuarios siempre estén viendo información actual y exacta. Hay muchos tipos de metadata  en una aplicación de un sistema de Business Intelligence, por eso se debe considerar como será la comunicación entre ellos.

Información acerca de un sistema de Business Intelligence completo
 

Nota: El Metadata se mantiene comúnmente en el servidor del sistema de Business Intelligence.



DIMENSIONES (TABLAS DE NEGOCIOS PARA USUARIOS)

Una dimensión es el dato más importante a considerar en el desarrollo, pues este es el dato por el cual se realizará la consulta de análisis.

Por ejemplo, en un modelo de ventas el dato de hecho es una cifra de ventas y se desea analizar por cliente, ubicación, proveedor o producto. En este caso el modelo se construye incluyendo dimensiones para cliente, ubicación, proveedor y producto. El elemento tiempo, permite ver los datos de manera histórica.

El número de dimensiones disponibles en el modelo estará determinado por los requerimientos de consulta del usuario.

Datos de Referencia.
Los datos de referencia son significativos en el ambiente de un sistema de Business Intelligence por que pueden reducir el volumen de los datos en el mismo. Esto proporciona una vista de la información con más detalle en la descripción de los valores llave.




 Tablas de Hechos (Tablas de Datos).

Los datos de hechos comprenden la mayoría de los datos en el sistema de Business Intelligence, y representan las medidas que pueden ser de interés. Estas tablas, típicamente contienen:

·         Datos numéricos, como unidades de venta, número de llamadas, etc.
·         Muchos millones de reglones y pueden crecer rápidamente con cada refresco de los datos
·         Muchos componentes para el valor de llave primaria. Cada parte de la llave hace referencia a una dimensión por la cual se tiene acceso al dato.
·         Sumario de datos


Los datos de hechos pueden estar contenidos en más de una tabla. Un sistema de Business Intelligence podría tener muchas tablas de hechos conteniendo métricas.

Granularidad.

Determinando la granularidad de los datos (nivel de detalle) se puede realizar un mejor diseño. Una mayor cantidad de datos disminuyen la granularidad, y a menor cantidad de datos se aumenta la granularidad. La forma en que los datos están almacenados pueden afectar el tamaño del sistema de Business Intelligence y los tipos de consulta que podrían ejecutarse, por lo que este punto debe ser analizado detalladamente..

Particiones.

Los datos en el sistema de Business Intelligence a menudo están particionados para romper los largos volúmenes de datos en unidades pequeñas a fin de hacerlo más manejable y funcional. Estas divisiones pueden ser verticales u horizontales.

q  Horizontal
La división horizontal permite almacenar una tabla muy grande en pequeñas tablas. El administrador de la base de datos controla los reglones que irán a cada unidad. Por ejemplo pueden almacenarse 12 meses en 12 tablas, una por cada mes. La ventaja que ofrece este tipo de particiones es el acelerar las consultas que se realicen.

q  Vertical
La división vertical  hace posible cortar una tabla en columnas, permitiendo el acceso a los usuarios solo a las columnas que requieren. Esta característica es usada si la consulta se refiere específicamente a un pequeño número de reglones, más que a un reglón completo.







Sumarios (Tablas de datos concentrados).

Los sumarios de datos contienen hechos resumidos. Los sumarios proporcionan respuestas inmediatas a consultas de información por combinación de dimensiones.


Estos  sumarios se obtienen a partir del detalle de la información, almacenado sobre una unidad de tiempo (como cifras de ventas por región por mes). También se puede obtener un sumario de datos de más alto nivel, este es comúnmente creado usando antiguos datos históricos, y se construyen cuando solo se requieren cifras generales y los detalles son irrelevantes.

Un buen desarrollo de las tablas de sumario beneficia la ejecución de las consultas usando sumarios precalculados y vistas predefinidas de la información. Los sumarios contienen todos los hechos que pueden preguntarse en una consulta. Un número de hechos puede ser combinado dentro de la misma tabla de sumario, por ejemplo, existencias almacenadas y ventas proyectadas de estas existencias.

Administración de Sumarios.

Los requerimientos de las tablas de sumario pueden cambiar de acuerdo al tiempo. Las consultas pueden ser estaciónales, por ejemplo pueden hacerse consultas específicas para primavera, verano, otoño e invierno.

El administrador del proceso de consultas debe ser capaz de identificar:

·         Los sumarios que son usados
·         Los sumarios que necesitan ser creados
·         Los sumarios que deben ser removidos


Comentarios

Entradas más populares de este blog

Desarrollo de Software: EDT (Estructura de desglose de trabajo) o WBS (Work Breakdown Structure)

Definición La EDT es una descomposición jerárquica-orientada a los entregables del proyecto- de los trabajos que ejecutara  el equipo de trabajo, para crear los productos requeridos. Es un paso muy importante en la definición del alcance de un proyecto. La EDT organiza y define el alcance total del proyecto, mediante la subdivisión de trabajo en piezas más pequeñas y manejables. En cada nivel inferior de la estructura se tiene un incremento en el detalle de los trabajos del proyecto. El trabajo incluido en el nivel más bajo de la WBS se le denomina paquetes de trabajo, los cuales pueden ser programados, monitoreados y supervisados. Principios Básicos de una EDT Una unidad de trabajo deberá aparecer en un solo lugar en la EDT . El contenido del trabajo de un elemento de la EDT es la suma de los elementos inferiores. Un elemento de la EDT es responsabilidad de una sola persona , a pesar de que muchas personas pueden estar trabajando en él. El EDT debe ser coherent

AMS (Application Management Services)

Definición Soporte de Aplicaciones y Mantenimiento (AMS). AMS (Application Management Services) es la tercerización de los servicios de gestión, soporte y mantenimiento de aplicaciones capaz de proporcionar a los clientes mejoras operacionales relevantes . El modelo AMS (Application Management System) representa un enfoque avanzado de servicios TI mediante el cual Tasisoft asume la responsabilidad a medio/largo plazo del conjunto de tareas y actividades relativas tanto al desarrollo y mantenimiento de aplicaciones como al soporte y evolución de las mismas. Bajo el concepto de Tasi software ofrece servicios dedicados y compartidos para outsourcing de aplicaciones con desarrolladores altamente calificados y experiencia en las más variadas tecnologías del mercado. Las líneas de servicios ofrecidas dentro del Desarrollo y Mantenimiento de Aplicaciones (AMS), son: Mantenimiento Preventivo y Normativo Mantenimiento Correctivo Mantenimiento Evolutivo / Nuevos De

Arquitectura Básica de un Data Warehouse

Concepto Data Warehousing Data warehousing soporta el procesamiento informático al proveer una plataforma sólida, a partir de los datos históricos para hacer el análisis. Facilita la integración de sistemas de aplicación no integrados. Organiza y almacena los datos que se necesitan para el procesamiento analítico, informático sobre una amplia perspectiva de tiempo. Un Data Warehouse o Depósito de Datos es una colección de datos orientado a temas, integrado, no volátil, de tiempo variante, que se usa para el soporte del proceso de toma de decisiones gerenciales. Se puede caracterizar un data warehouse haciendo un contraste de cómo los datos de un negocio almacenados en un data warehouse, difieren de los datos operacionales usados por las aplicaciones de producción. Base de Datos Operacional Data Warehouse Datos Operacionales Datos del negocio para Información Orientado a la aplicación Orientado al sujeto