¿Qué es un Data Mart?
A almacén de datos Es un almacén que recopila datos de datos operativos y otras fuentes de datos que sirven a un grupo específico de profesionales. En términos de alcance, los datos se extraen de una base de datos empresarial o de una más especializada. almacén de datosEl objetivo de un centro de datos es satisfacer las necesidades específicas de los grupos de usuarios profesionales en términos de análisis, contenido, rendimiento y facilidad de uso. Los usuarios de los centros de datos esperan que los datos se representen en términos con los que están familiarizados.
Almacén de datos vs. almacén de datos:
Un almacén de datos es una colección de datos integrada y temática, diseñada para respaldar la función DSS (Sistema de Soporte de Decisiones). En un almacén de datos, cada unidad de datos está asociada a un tiempo específico. Un almacén de datos, compuesto por datos atómicos y ligeramente agregados, es una colección de datos temática, integrada, no actualizable (estable) y variable en el tiempo, que respalda el proceso de toma de decisiones en la gestión empresarial.

Data Mart vs. Data Warehouse
El data mart es un subconjunto del almacén de datos empresarial, orientado principalmente a negocios departamentales y enfocado únicamente en un tema específico. Para resolver la contradicción entre flexibilidad y rendimiento, un data mart es un pequeño almacén de datos departamental o de grupo de trabajo que se incorpora a la arquitectura del almacén de datos. Los data marts almacenan datos precalculados para usuarios específicos con el fin de satisfacer sus necesidades de rendimiento. Pueden aliviar en cierta medida los cuellos de botella en el acceso a los almacenes de datos.
Características del Data Mart:
- pequeño en tamaño;
- tienen aplicaciones específicas;
- orientado al departamento;
- definido, diseñado y desarrollado por unidades de negocio;
- gestionados y mantenidos por unidades de negocio;
- se puede implementar rápidamente;
- más barato para comprar;
- rápida recuperación de la inversión;
- integración estrecha de conjuntos de herramientas;
- proporciona un subconjunto resumido, preexistente y más detallado del almacén de datos;
- actualizable a un almacén de datos completo;
La estructura de datos de un Data Mart:
La estructura de datos en un data mart se suele describir como una estructura en estrella o en copo de nieve. Una estructura en estrella consta de dos partes básicas: una tabla de hechos y varias tablas de dimensiones complementarias.
1.FTabla de actos
La tabla de hechos describe los datos más densos del almacén de datos. En una compañía telefónica, los datos utilizados para las llamadas suelen ser los más densos. En los bancos, los datos relacionados con la conciliación y los cajeros automáticos suelen ser los más intensivos. En el sector minorista, los datos de ventas e inventario son los más densos, y así sucesivamente.
Una tabla de hechos es una combinación de varios tipos de datos que se unen previamente entre sí, incluidos: una clave principal de la entidad que refleja el propósito de la tabla de hechos, como un pedido, una venta, una llamada telefónica, etc., información de clave principal, claves externas que conectan la tabla de hechos con la tabla de dimensiones y datos externos no clave transportados por las claves externas.
Si estos datos externos no clave se utilizan con frecuencia para análisis de datos En la tabla de hechos, se incluye en su alcance. Las tablas de hechos tienen un alto índice. Es muy común tener de 30 a 40 índices. A veces, cada columna de la tabla de hechos está indexada, lo que facilita la lectura de los datos. Sin embargo, el número de... recursos Para importar el índice, es necesario tenerlo en cuenta en la ecuación. Normalmente, los datos de la tabla de hechos no se pueden modificar, pero sí se pueden introducir. Una vez introducido correctamente un registro, no se puede modificar nada.
2. Tabla de dimensiones
Las tablas de dimensiones se construyen en torno a tablas de hechos. La tabla de dimensiones contiene datos no intensivos vinculados a la tabla de hechos mediante una clave externa. Las tablas de dimensiones típicas se basan en data marts, como catálogos de productos, listas de clientes, listas de proveedores, etc.
Los datos del data mart provienen del almacén de datos empresarial. Todos los datos, con una excepción, deben pasar por un almacén de datos empresarial antes de ser importados a un data mart. La excepción son los datos específicos utilizados en el data mart, que no pueden utilizarse en ninguna otra parte del almacén de datos. Los datos externos suelen incluirse en esta categoría. De no ser así, y los datos se utilizan en otra parte del sistema de soporte de decisiones, deben pasar por el almacén de datos empresarial.
Los depósitos de datos contienen dos tipos de datos, normalmente datos detallados y datos agregados.
1. Datos detallados
Como se describió anteriormente, los datos detallados del data mart se encuentran en una estructura en estrella. Cabe mencionar que este esquema en estrella se agrega correctamente a medida que los datos pasan por el almacén de datos empresarial. En este caso, el almacén de datos empresarial contiene los datos básicos necesarios, mientras que el data mart contiene los datos con intervalos más amplios. Sin embargo, para los usuarios del data mart, los datos con estructura en estrella conservan el mismo nivel de detalle que al momento de su adquisición.
2. Datos agregados
El segundo tipo de datos que contiene un data mart son los datos agregados. Los analistas suelen crear diversos datos agregados a partir de datos en un esquema en estrella. Un resumen típico podría ser el total de ventas mensuales de los territorios de venta. Dado que la base de la agregación está en constante evolución, los datos históricos se encuentran en el data mart. Sin embargo, la ventaja de estos datos históricos reside en el nivel de generalización que almacenan. En el esquema en estrella se conservan muy pocos datos históricos.
Los data marts se actualizan según los almacenes de datos empresariales. Es habitual que se actualicen aproximadamente una vez por semana. Sin embargo, el tiempo de actualización puede ser inferior o superior a una semana, lo cual depende principalmente de las necesidades del departamento al que pertenece.
Tipos de Data Mart:
1. Independiente
Los datos del data mart independiente provienen de la base de datos operativa, que es un entorno analítico diseñado para satisfacer las necesidades de usuarios específicos. El ciclo de desarrollo de este tipo de data mart suele ser corto y flexible, pero al estar separado del almacén de datos, un data mart independiente puede generar islas de información, impidiendo el análisis global de los datos.
2. Subordinado
Los datos del almacén de datos subordinado provienen del almacén de datos de la empresa, lo que prolongará el ciclo de desarrollo, pero el almacén de datos subordinado es más estable en arquitectura que el almacén de datos independiente, lo que puede mejorar la calidad de los datos analizar y garantizar la consistencia de los datos.
Ventajas del Data Mart:
- Es una de las alternativas más rentables para los almacenes de datos donde solo es necesario procesar un pequeño subconjunto de datos.
- Separar los datos de las fuentes hará que los almacenes de datos sean eficientes porque un grupo específico de personas puede trabajar con datos de una fuente específica, en lugar de que todos usen el almacén de datos.
- Si sabemos a qué subconjunto necesitamos acceder, podemos utilizar almacenes de datos para acceder a los datos más rápidamente.
- Más fácil de usar para que los usuarios finales puedan consultarlo fácilmente.
- Debido a que los datos están segregados en grupos, lleva menos tiempo ingresar al almacén de datos en tiempo de implementación que a un almacén de datos.
- Los datos históricos de temas específicos se pueden utilizar para facilitar el análisis de tendencias.
Pasos para implementar un Data Mart:
Paso 1. Diseño:
Este será el primer paso de la implementación, en el que se identifican todas las tareas y fuentes necesarias para recopilar información técnica y comercial. Posteriormente, se implementa un plan lógico que, tras su revisión, se convierte en un plan físico. Además, aquí se decide la estructura lógica y física de los datos, así como la partición de los datos y de campos como la fecha o cualquier otro archivo.
Paso 2. Construcción:
Esta es la segunda etapa de la implementación. La generación de la base de datos física con la ayuda del RDBMS se determina como parte del proceso de diseño y la estructura lógica. Se crean todos los objetos como esquemas, índices, tablas, vistas, etc.
Paso 3. Relleno:
Esta es la tercera etapa, donde se rellenan los datos a medida que se obtienen. Todas las transformaciones necesarias se implementan antes de rellenarlos.
Paso 4. Acceso:
Este es el siguiente paso de la implementación: usaremos los datos completados para realizar consultas y crear un informe. Los usuarios finales utilizan este paso para comprender los datos mediante la consulta.
Paso 5. Gestión:
Esta es la etapa final de la implementación del almacén de datos, donde se manejan tareas como administración de acceso, optimización y ajuste del sistema, administración y adición de nuevos datos al almacén de datos y planificación de escenarios de recuperación para manejar cualquier escenario de falla.
Conclusión
Gracias por leer nuestro artículo y esperamos que lo hayas disfrutado. Si quieres saber más sobre... gobernanza de datosNos gustaría aconsejarle que visite Flujo de SQL de Gudu Para más información.
Como uno de los Las mejores herramientas de linaje de datos Disponible en el mercado hoy en día, Gudu SQLFlow no solo puede analizar archivos de script SQL, obtener linaje de datos, y realizar una visualización, pero también permitir a los usuarios proporcionar el linaje de datos en formato CSV y realizar una visualización. (Publicado por Ryan el 22 de junio de 2022)
Un comentario
Deja un comentario
Si te gusta leer esto, explora nuestros otros artículos a continuación:
[…] y los departamentos de marketing utilizan almacenes de datos para recopilar datos de fuentes como clientes y […]