Linaje de datos de Python (versión Gudu SQLFlow Lite para Python)

El paquete de linaje de datos de Python (también conocido como la versión Gudu SQLFlow Lite para Python) es un conjunto de herramientas que se utiliza para analizar declaraciones SQL y procedimientos almacenados de varias bases de datos para obtener resultados complejos. linaje de datos  relaciones y visualizarlas.

Versión Gudu SQLFlow Lite para Python Permite a los desarrolladores de Python integrar rápidamente funciones de análisis y visualización de linaje de datos en sus propias aplicaciones Python. También puede ser utilizado en el trabajo diario por científicos de datos para descubrir rápidamente el linaje de datos a partir de scripts SQL complejos que suelen emplearse en tareas ETL para la transformación de datos en una enorme plataforma de datos.

La versión Lite de Gudu SQLFlow para Python es gratuita para uso no comercial y puede manejar cualquier sentencia SQL compleja con una longitud de hasta 10k, incluyendo compatibilidad con procedimientos almacenados. Es compatible con el dialecto SQL de más de 20 importantes proveedores de bases de datos, como Oracle, DB2, Snowflake, Redshift, Postgres, etc.

La versión Gudu SQLFlow Lite para Python incluye una biblioteca de Java para analizar sentencias SQL complejas y procedimientos almacenados para recuperar relaciones de linaje de datos, un archivo Python que utiliza jpype para llamar a las API en la biblioteca Java, y una biblioteca de JavaScript para visualizar relaciones de linaje de datos.

La versión Gudu SQLFlow Lite para Python también puede extraer automáticamente restricciones de tablas y columnas, así como relaciones entre tablas y campos, desde Scripts DDL exportados desde la base de datos y generar un diagrama ER.

Visualizar automáticamente el linaje de datos

Ejecutando este comando:
Copiar al portapapeles

Podemos obtener automáticamente las relaciones de linaje de datos contenidas en la siguiente declaración SQL de Oracle.

Copiar al portapapeles

Y visualízalo como:

linaje de datos de Python

Características del paquete de linaje de datos de Python:

  • Generar visualizaciones interactivas de linaje de datos

  • Crear linaje de datos en JSON/CSV/GRAPHML

  • Admite SQL de más de 20 proveedores de bases de datos principales

Cómo funciona la herramienta de linaje de datos de Python

linaje de datos de Python

Ahora, todos los componentes anteriores están empaquetados en un único repositorio en Github y puedes obtenerlos gratis simplemente clonándolos.

Copiar al portapapeles

– No se necesita conexión a la base de datos.
– No se necesita conexión a Internet.

Solo necesitas un JDK y un intérprete de Python para ejecutar este paquete de linaje de datos de Python localmente.

Ir al repositorio de github ahora