Antes de poder iniciar la construcción
del mismo se debe tener muy claro cuales son los datos que se deben almacenar:
·
Metadata.
·
Tablas de negocio para usuarios
·
Tablas de Datos
·
Tablas de datos concentrados
METADATA (REGLAS DE EXTRACCIÓN Y
TRANSFORMACIÓN DE DATOS)
El
Metadata de la Extracción de
datos es importante para el sistema de Business Intelligence. Este es un mapa que muestra el cómo existe el dato en el
sistema fuente, los procedimientos que se tienen que llevar a cabo para
transformarlo y finalmente donde residirá en el sistema de
Business Intelligence.
Es un término que hace referencia a datos acerca de
los datos, contiene una descripción detallada de la estructura, conteniendo,
llaves e índices de los datos y es usado en todo el sistema de Business
Intelligence desde la extracción hasta el acceso.
Es necesario decidir si el proceso de
limpieza, transformación y sumarización se llevará a cabo en el ambiente fuente
o en el ambiente del sistema de Business Intelligence, tomando en cuenta el impacto que esto
podría tener en la operación cotidiana de la empresa.
Además:
·
El Metadata de la extracción y
transformación hace un mapeo de la estructura de los datos fuente y define como
el dato es transformado dentro del nuevo formato para el sistema de Business
Intelligence.
·
El Metadata para el usuario final,
describe la localización y estructura de los datos para el acceso del usuario.
El Metadata es mantenido por los procesos de extracción,
transformación y trasportación (o productos específicos para ETL y son
accesados por el usuario final sujetándose a estas aplicaciones.
EL Metadata puede ser usado por administradores de bases de datos que
necesitan ver las fuentes de valores de datos específicos y administradores que
dan mantenimiento al contexto de la información.
Las definiciones de algunos datos pueden cambiar con el tiempo, por
ello Metadata mantiene un registro de esos cambios, permitiendo a los usuarios
analizar los datos en el contexto correcto
Administración del Metadata.
Normalmente el Metadata reside en el Servidor sobre la plataforma del
sistema de Business Intelligence, debe tenerse actualizado todo el tiempo a fin
de garantizar que el proceso y los usuarios siempre estén viendo información
actual y exacta. Hay muchos tipos de metadata
en una aplicación de un sistema de Business Intelligence, por eso se
debe considerar como será la comunicación entre ellos.
|
Nota: El Metadata se mantiene comúnmente en el servidor del sistema de
Business Intelligence.
DIMENSIONES (TABLAS DE NEGOCIOS
PARA USUARIOS)
Una dimensión es el dato más importante a considerar en el desarrollo,
pues este es el dato por el cual se realizará la consulta de análisis.
Por ejemplo, en un modelo de ventas el dato de hecho es una cifra de
ventas y se desea analizar por cliente, ubicación, proveedor o producto. En
este caso el modelo se construye incluyendo dimensiones para cliente,
ubicación, proveedor y producto. El elemento tiempo, permite ver los datos de
manera histórica.
El número de dimensiones disponibles en el modelo estará determinado
por los requerimientos de consulta del usuario.
Datos de Referencia.
Los datos de referencia son significativos en el ambiente de un
sistema de Business Intelligence por que pueden reducir el volumen de los datos
en el mismo. Esto proporciona una vista de la información con más detalle en la
descripción de los valores llave.
Tablas de Hechos (Tablas de
Datos).
Los datos de hechos comprenden la mayoría de los datos en el sistema
de Business Intelligence, y representan las medidas que pueden ser de interés.
Estas tablas, típicamente contienen:
·
Datos numéricos, como unidades de
venta, número de llamadas, etc.
·
Muchos millones de reglones y
pueden crecer rápidamente con cada refresco de los datos
·
Muchos componentes para el valor
de llave primaria. Cada parte de la llave hace referencia a una dimensión por
la cual se tiene acceso al dato.
·
Sumario de datos
Los datos de hechos pueden estar contenidos en más de una tabla. Un
sistema de Business Intelligence podría tener muchas tablas de hechos
conteniendo métricas.
Granularidad.
Determinando la granularidad de los datos (nivel de detalle) se puede
realizar un mejor diseño. Una mayor cantidad de datos disminuyen la
granularidad, y a menor cantidad de datos se aumenta la granularidad. La forma
en que los datos están almacenados pueden afectar el tamaño del sistema de
Business Intelligence y los tipos de consulta que podrían ejecutarse, por lo
que este punto debe ser analizado detalladamente..
Particiones.
Los datos en el sistema de Business Intelligence a menudo están
particionados para romper los largos volúmenes de datos en unidades pequeñas a
fin de hacerlo más manejable y funcional. Estas divisiones pueden ser
verticales u horizontales.
q
Horizontal
La división horizontal permite almacenar una tabla muy grande en
pequeñas tablas. El administrador de la base de datos controla los reglones que
irán a cada unidad. Por ejemplo pueden almacenarse 12 meses en 12 tablas, una
por cada mes. La ventaja que ofrece este tipo de particiones es el acelerar las
consultas que se realicen.
q
Vertical
La división vertical hace
posible cortar una tabla en columnas, permitiendo el acceso a los usuarios solo
a las columnas que requieren. Esta característica es usada si la consulta se
refiere específicamente a un pequeño número de reglones, más que a un reglón
completo.
Sumarios (Tablas de datos
concentrados).
Los sumarios de datos contienen hechos resumidos. Los sumarios
proporcionan respuestas inmediatas a consultas de información por combinación
de dimensiones.
Estos sumarios se obtienen a
partir del detalle de la información, almacenado sobre una unidad de tiempo
(como cifras de ventas por región por mes). También se puede obtener un sumario
de datos de más alto nivel, este es comúnmente creado usando antiguos datos
históricos, y se construyen cuando solo se requieren cifras generales y los
detalles son irrelevantes.
Un buen desarrollo de las tablas de sumario beneficia la ejecución de
las consultas usando sumarios precalculados y vistas predefinidas de la
información. Los sumarios contienen todos los hechos que pueden preguntarse en
una consulta. Un número de hechos puede ser combinado dentro de la misma tabla
de sumario, por ejemplo, existencias almacenadas y ventas proyectadas de estas
existencias.
Administración de Sumarios.
Los requerimientos de las tablas de sumario pueden cambiar de acuerdo
al tiempo. Las consultas pueden ser estaciónales, por ejemplo pueden hacerse
consultas específicas para primavera, verano, otoño e invierno.
El administrador del proceso de consultas debe ser capaz de
identificar:
·
Los sumarios que son usados
·
Los sumarios que necesitan ser
creados
·
Los sumarios que deben ser
removidos
Comentarios