Gestión de metadatos empresariales

Actualmente, muchas empresas se han dado cuenta de la dificultad de mejorar la capacidad de innovación empresarial mediante el big data, ya que el personal no puede comprender los datos almacenados en el sistema. Este artículo analizará la solución a este problema. negocio gestión de metadatos.

Tabla de contenido:

  •  Aparece una “barrera semántica” entre las computadoras y los humanos;
  •  Metadatos comerciales: el contexto comercial detrás de los datos;
  • Práctica de gestión de metadatos empresariales basada en ontología;
  • Resumen y perspectivas.
Gestión de metadatos empresariales

Gestión de metadatos empresariales

1. Aparece una “barrera semántica” entre las computadoras y los humanos.

Hace unos 70 años, el Día de San Valentín, nació ENIAC en la Universidad de Pensilvania. Desde entonces, la humanidad ha comenzado a explorar la "inteligencia" de las computadoras. Diversas tecnologías, como el "reconocimiento de lenguaje", el "reconocimiento de imágenes" y el "procesamiento del lenguaje natural", están cada vez más desarrolladas. Podemos introducir casi cualquier información que queramos en el sistema informático, pero ¿podemos, a su vez, interpretar correctamente los datos de salida?

A medida que los datos han aumentado, nos ha resultado difícil comprender su significado específico: se ha creado una barrera semántica entre nosotros y los sistemas informáticos. La existencia de barreras semánticas genera una serie de problemas para las empresas:

  • Comprensión empresarial inconsistente: La comprensión inconsistente del negocio por parte de los empleados es muy común en las empresas. La comprensión inconsistente de los términos comerciales dificulta la comunicación entre los empleados, lo que genera malentendidos y reduce la eficiencia de la comunicación. En la toma de decisiones en reuniones, la comprensión inconsistente del negocio por parte de los líderes puede llevar a decisiones erróneas. En las estadísticas departamentales, la comprensión inconsistente de las definiciones empresariales genera métodos estadísticos inexactos e incluso afecta los resultados estadísticos de múltiples indicadores e indicadores clave de rendimiento (KPI) de la empresa.
  • Encontrar información es difícil: En la era del big data, la cantidad de datos empresariales crece exponencialmente, y encontrar información para los empleados es cada vez más como "encontrar una aguja en un pajar". Según las estadísticas, los empleados dedican entre 151 y 351 millones de dólares de su tiempo a buscar los datos que necesitan en una gran cantidad de información cada día, y solo menos del 50% de los resultados de búsqueda satisfacen sus necesidades. En la mayoría de los casos, los resultados de búsqueda son insatisfactorios; como no se puede encontrar la información almacenada, las empresas suelen duplicar el trabajo innecesariamente.
  • Gran pérdida de personal: Según las estadísticas, la tasa de rotación anual promedio de empleados en las empresas es de aproximadamente 121 TP2T. Debido a la falta de métodos de gestión empresarial, las empresas suelen invertir mucho tiempo y dinero en capacitar a nuevos empleados, después de contratar a empleados con un dominio avanzado de las computadoras, lo que provoca una grave pérdida de conocimientos y un gasto considerable.

La aparición de la serie de problemas mencionada se debe, en última instancia, a que los empleados de la empresa no pueden leer los datos en la computadora. Para evitar estos problemas, las empresas necesitan romper la barrera semántica entre las computadoras y las personas y convertir la información generada por las computadoras a un lenguaje empresarial comprensible para el personal. Metadatos empresariales es la clave para resolver el problema.

2. Metadatos comerciales: el contexto comercial detrás de los datos.

Para aclarar qué son los metadatos empresariales, debemos comenzar con su clasificación. Actualmente, un método de clasificación reconocido por la industria consiste en dividir los metadatos en dos tipos: metadatos técnicos y metadatos empresariales.

El metadatos técnicos incluye: nombre del campo, longitud del campo, estructura de la tabla de la base de datos, etc.

El metadatos comerciales incluye: nombre comercial, definición comercial, descripción comercial, etc.

Los empresarios prestan más atención al contenido relacionado con “cliente”, “fecha de liquidación”, “monto de venta”, etc., que son difíciles de reflejar a partir de metadatos técnicos.

Los metadatos empresariales utilizan el nombre, la definición, la descripción y otra información de la empresa para representar diversos atributos y conceptos en el entorno empresarial. Hasta cierto punto, el contexto empresarial que subyace a todos los datos puede considerarse metadatos empresariales. A diferencia de los metadatos técnicos, los metadatos empresariales permiten a los usuarios comprender y utilizar mejor los datos en el entorno empresarial. Por ejemplo, al consultar los metadatos empresariales, los usuarios pueden comprender claramente el significado de cada indicador y su método de cálculo.

Los metadatos empresariales están ampliamente presentes en el entorno empresarial. Las principales fuentes de metadatos empresariales son:

  • ERP: El sistema ERP empresarial almacena una gran cantidad de metadatos comerciales, como fórmulas de cálculo financiero, lógica de procesos, reglas comerciales, etc.
  • Informe: El encabezado del informe también es un tipo de metadatos comerciales, especialmente aquellas columnas con propiedades de resumen como totales y promedios, y algunas fórmulas de cálculo en el informe.
  • Tabla: Al igual que los informes, los encabezados y fórmulas de Excel también son metadatos empresariales importantes. A diferencia de los informes, la mayoría de las tablas tienen una sola columna para "Descripción", y algunas también tienen una columna para "Código" y "Descripción del Código", que son metadatos empresariales útiles.
  • Archivo: Hay metadatos comerciales en todas partes del archivo, como título, autor, hora de modificación, etc. Es relativamente difícil obtener metadatos comerciales en el contenido del archivo, lo que implica tecnologías como el aprendizaje automático.
  • Herramientas de BI: La operación más común en BI es la de "exploración". Esta exploración suele definir diversas estructuras de clasificación de la empresa, como el nivel de producto y el nivel de estructura organizativa, que constituyen metadatos empresariales muy importantes.
  • almacén de datosLos metadatos empresariales también existen en los almacenes de datos. Por ejemplo, la creación de un almacén de datos suele requerir mucha investigación sobre cómo integrar múltiples fuentes de datos, y existe una gran cantidad de metadatos empresariales en los archivos relacionados con el proceso de construcción del almacén de datos.

Actualmente, la mayoría de las empresas solo prestan atención a los metadatos técnicos, ignorando la gestión de metadatos empresariales. Estos metadatos carecen de significado empresarial y son difíciles de comprender para quienes no sean técnicos. Por ejemplo, pueden usar "rec_temp_fld_a" para representar un campo y "236IN_TAB" para representar una tabla en la base de datos. Esto dificulta obtener beneficios para la empresa. Los metadatos empresariales pueden representar el significado empresarial detrás de los datos. Las empresas deben prestar atención a la gestión de metadatos empresariales al gestionar sus metadatos técnicos.

En comparación con los metadatos técnicos, la fuente de metadatos empresariales es más compleja y está dispersa en todos los aspectos del entorno empresarial. Para gestionarlos, las empresas necesitan métodos y medios eficaces.

3. Práctica de gestión de metadatos empresariales basada en ontología.

La definición de ontología, relativamente reconocida en la industria, es la siguiente: una especificación formal clara de un modelo conceptual compartido. Entre ellos, el modelo conceptual es un modelo obtenido mediante la abstracción de algunos fenómenos del mundo objetivo, lo que supone la abstracción y simplificación de dicho mundo; compartir significa que el conocimiento descrito en la ontología no es exclusivo de individuos, sino reconocido en el campo; explícitamente significa que los tipos de conceptos utilizados y las restricciones sobre su uso están claramente definidos; formal significa que la ontología es legible por máquinas y comprensible para humanos.

En resumen, la ontología puede analizar los objetos en el campo y descubrir la relación entre estos objetos, para así describir el negocio en este campo de manera clara y formal.

A gestionar metadatos empresariales A través de la ontología se requiere atención a tres puntos clave: la construcción de la ontología, el almacenamiento de la ontología y el uso de la ontología.

1. Construcción – Construir automáticamente una ontología mediante la gestión de metadatos.

La forma tradicional de construir una ontología consiste en ordenar manualmente la ontología del dominio empresarial según las sugerencias de expertos. Este método de ordenación manual presenta una serie de problemas:

  • Problema de eficiencia: En el entorno del big data, los datos son complejos, las fuentes son diversas y los campos de negocio se expanden constantemente. La velocidad de la clasificación manual ya no satisface las necesidades de las empresas.
  • Problema de herramientas: los expertos en negocios carecen de herramientas con capacidades de automatización, lo que resulta en la construcción de ontologías complejas que consumen mucho tiempo y recursos.
  • Datos de terceros: los expertos empresariales no comprenden el negocio relacionado con los datos de terceros, por lo que resulta difícil completar la construcción de la ontología relacionada.

En el entorno de big data, las empresas necesitan una nueva forma de construir ontologías. Pueden extraer automáticamente metadatos de los sistemas de aplicaciones empresariales y diversos documentos mediante herramientas de gestión de metadatos. Una vez formada la ontología, esta se entrega a expertos empresariales para su revisión secundaria, completando así su construcción.

2. Almacenamiento – basado en MOF para implementar la ontología de almacenamiento de especificación OWL.

El almacenamiento de la ontología debe basarse en ciertos estándares, y el método de almacenamiento debe ser flexible y extensible. La especificación OWL es una especificación recomendada por el W3C y actualmente es una especificación ampliamente reconocida para el almacenamiento e intercambio de ontologías. Dado que nuestros metadatos se basan en MOF, el metamodelo OWL puede integrarse en el metamodelo, lo que permite el almacenamiento y la gestión de la ontología en la base de datos de metadatos.

Dado que tanto los metadatos técnicos como la ontología se almacenan en la base de datos de metadatos, la ontología se extrajo originalmente de los metadatos técnicos. De esta manera, es fácil obtener la relación entre la ontología y los metadatos técnicos, para que el personal de la empresa pueda comprender claramente el significado empresarial de los datos.

3. Uso – obtener contexto empresarial a través de servicios de metadatos empresariales.

Por último, el servicio de metadatos empresariales debe proporcionarse a todo el personal empresarial, integrado en el entorno de trabajo del personal empresarial, para que el personal empresarial pueda comprender rápidamente los datos desde una perspectiva empresarial, ayudándolo así a utilizar mejor los datos.

4. Resumen y perspectivas

Finalmente, resumiré en una frase: los metadatos empresariales son clave para la gestión de metadatos del futuro. En la era del big data, las empresas necesitan fortalecer la gestión de metadatos empresariales. Pueden utilizar métodos automatizados para gestionar metadatos empresariales basados en ontología e integrarlos. Los datos se proporcionan al personal empresarial en forma de servicios para ayudarles a optimizar su uso.

Conclusión

Gracias por leer nuestro artículo. Esperamos que le ayude a comprender mejor la gestión de metadatos empresariales. Si desea obtener más información sobre la gestión de metadatos, le recomendamos visitar Flujo de SQL de Gudu Para más información.

Como uno de los Las mejores herramientas de linaje de datos Disponible actualmente en el mercado, Gudu SQLFlow no solo puede analizar archivos de script SQL, obtener el linaje de datos y realizar visualizaciones, sino que también permite a los usuarios proporcionar linaje de datos en formato CSV y realizar visualización. (Publicado por Ryan el 30 de junio de 2022)

Pruebe Gudu SQLFlow Live

Versión en la nube de SQLFlow

Suscríbete al boletín semanal

Deja un comentario