{"id":3493,"date":"2022-04-25T07:19:32","date_gmt":"2022-04-25T15:19:32","guid":{"rendered":"https:\/\/www.gudusoft.com\/?p=3493"},"modified":"2022-05-19T01:40:00","modified_gmt":"2022-05-19T09:40:00","slug":"data-lineage-create-external-table","status":"publish","type":"post","link":"https:\/\/www.gudusoft.com\/es\/linaje-de-datos-crear-tabla-externa\/","title":{"rendered":"Linaje de datos: crear una tabla externa | Gudu SQLFlow"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"background-color: rgba(255,255,255,0);background-position: center center;background-repeat: no-repeat;border-width: 0px 0px 0px 0px;border-color:#e8eaf0;border-style:solid;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start\" style=\"max-width:1310.4px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\" style=\"background-position:left top;background-repeat:no-repeat;-webkit-background-size:cover;-moz-background-size:cover;-o-background-size:cover;background-size:cover;padding: 0px 0px 0px 0px;\"><div class=\"fusion-text fusion-text-1\" style=\"line-height:26px;\"><h2><strong>Linaje de datos: crear una tabla externa | Gudu SQLFlow<\/strong><\/h2>\n<p>En el almac\u00e9n de datos, los datos originales siempre provienen de almacenamientos masivos como Amazon S3, Google Cloud Storage y Microsoft Azure, y se cargan en sistemas como BigQuery, Snowflake, Redshift y Microsoft Azure. Uno de los m\u00e9todos para cargar o usar estos datos es la instrucci\u00f3n SQL para crear una tabla externa. La conexi\u00f3n de datos del archivo externo a la tabla externa se puede capturar f\u00e1cilmente mediante... <strong>Flujo de SQL de Gudu<\/strong> Analizando la consulta SQL de creaci\u00f3n de tabla externa. Con estos datos disponibles, <strong>Flujo de SQL de Gudu<\/strong> Simplifica enormemente la capacidad de rastrear errores hasta su causa ra\u00edz en un proceso de an\u00e1lisis de datos.<\/p>\n<div id=\"attachment_3544\" style=\"width: 596px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-3544\" decoding=\"async\" class=\"size-full wp-image-3544\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/Data_Lineage_Create_External_Table.png\" alt=\"Linaje de datos Crear tabla externa\" width=\"586\" height=\"482\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/Data_Lineage_Create_External_Table-200x165.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/Data_Lineage_Create_External_Table-300x247.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/Data_Lineage_Create_External_Table-400x329.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/Data_Lineage_Create_External_Table.png 586w\" sizes=\"(max-width: 586px) 100vw, 586px\" \/><p id=\"caption-attachment-3544\" class=\"wp-caption-text\">Linaje de datos Crear tabla externa<\/p><\/div>\n<p>En el art\u00edculo, presentaremos la declaraci\u00f3n SQL de creaci\u00f3n de tabla externa utilizada en BigQuery, Snowflake, Redshift y Microsoft Azure, y veremos el linaje de datos generado por la <strong>Flujo de SQL de Gudu<\/strong> despu\u00e9s de analizar el script SQL.<\/p>\n<h3>BigQuery crea una tabla externa<\/h3>\n<p>Las tablas externas permiten a BigQuery consultar datos almacenados fuera del almacenamiento de BigQuery. Para obtener m\u00e1s informaci\u00f3n sobre las tablas externas, consulte <strong><a href=\"https:\/\/cloud.google.com\/bigquery\/external-data-cloud-storage\">Introducci\u00f3n a las fuentes de datos externas<\/a><\/strong>.<\/p>\n<p><strong>Flujo de SQL de Gudu<\/strong> Puede analizar la declaraci\u00f3n de creaci\u00f3n de tabla externa de BigQuery y crearla. <strong><a href=\"https:\/\/www.gudusoft.com\/es\/que-son-los-datos-de-linaje-y-por-que-son-importantes\/\">linaje de datos<\/a><\/strong> despu\u00e9s de analizar esta declaraci\u00f3n SQL.<\/p>\n<p>A continuaci\u00f3n se muestra una consulta SQL de creaci\u00f3n de tabla externa de BigQuery:<\/p>\n<pre class=\"wp-block-code\"><code>CREAR O REEMPLAZAR TABLA EXTERNA dataset.CsvTable ( x INT64, y STRING ) OPCIONES ( formato = &#039;CSV&#039;, uris = [&#039;gs:\/\/bucket\/path1.csv&#039;], delimitador_de_campo = &#039;|&#039;, max_bad_records = 5 );<\/code><\/pre>\n<p>El linaje de datos generado para el SQL anterior aqu\u00ed, como puede ver, el archivo gs:\/\/bucket\/path1.csv almacenado en Google Storage se trata como la fuente de la tabla externa dataset.CsvTable.<\/p>\n<figure class=\"wp-block-image size-large\"><\/figure>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter\"><a href=\"https:\/\/sqlflow.gudusoft.com\"><img decoding=\"async\" width=\"439\" height=\"87\" class=\"wp-image-3576\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/data-lineage-bigquery-create-external-table-1.png\" alt=\"Linaje de datos Crear tabla externa\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/data-lineage-bigquery-create-external-table-1-200x40.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/data-lineage-bigquery-create-external-table-1-300x59.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/data-lineage-bigquery-create-external-table-1-400x79.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/data-lineage-bigquery-create-external-table-1.png 439w\" sizes=\"(max-width: 439px) 100vw, 439px\" \/><\/a><figcaption>Linaje de datos Crear tabla externa<\/figcaption><\/figure>\n<\/div>\n<h3 class=\"wp-block-heading\">Snowflake crea una tabla externa<\/h3>\n<p>Snowflake crea una tabla externa para leer datos de un conjunto de uno o m\u00e1s archivos en una etapa externa especificada y genera los datos en una \u00fanica columna VARIANT. <a class=\"rank-math-link\" href=\"https:\/\/docs.snowflake.com\/en\/sql-reference\/sql\/create-external-table.html\"><strong>Crear declaraci\u00f3n de tabla externa<\/strong><\/a> crea una nueva tabla externa en el esquema actual\/especificado o reemplaza una tabla externa existente.<\/p>\n<p>Antes de crear una tabla externa, necesitamos: <a class=\"rank-math-link\" href=\"https:\/\/docs.snowflake.com\/en\/sql-reference\/sql\/create-stage.html\"><strong>crear un escenario externo<\/strong><\/a> para la ubicaci\u00f3n de almacenamiento donde se almacenan los archivos de datos.<\/p>\n<pre class=\"wp-block-code\"><code>crear etapa s1 url=&#039;s3:\/\/mybucket\/files\/logs\/&#039; ... ;<\/code><\/pre>\n<p>Cree la tabla externa particionada:<\/p>\n<pre class=\"wp-block-code\"><code>crear tabla externa et1( fecha_parte fecha como hasta_fecha(parte_dividida(metadata$filename, &#039;\/&#039;, 3) || &#039;\/&#039; || parte_dividida(metadata$filename, &#039;\/&#039;, 4) || &#039;\/&#039; || parte_dividida(metadata$filename, &#039;\/&#039;, 5), &#039;AAAA\/MM\/DD&#039;), marca de tiempo bigint como (valor:marca_de_tiempo::bigint), col2 varchar como (valor:col2::varchar)) particionar por (parte_de_fecha) ubicaci\u00f3n=@s1\/logs\/ actualizaci\u00f3n_autom\u00e1tica = verdadero formato_de_archivo = (tipo = parquet) aws_sns_topic = &#039;arn:aws:sns:us-west-2:001234567890:s3_mybucket&#039;;<\/code><\/pre>\n<p>Gudu SQLFlow puede procesar la declaraci\u00f3n de consulta de creaci\u00f3n de tabla externa de Snowflake y construir un linaje de datos entre los archivos en la etapa externa y la tabla externa de la siguiente manera:<\/p>\n<figure class=\"wp-block-image size-large\"><\/figure>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter\"><a href=\"https:\/\/sqlflow.gudusoft.com\"><img decoding=\"async\" width=\"428\" height=\"108\" class=\"wp-image-3505\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/data-lineage-snowflake-create-external-table.png\" alt=\"Linaje de datos Crear tabla externa\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/data-lineage-snowflake-create-external-table-200x50.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/data-lineage-snowflake-create-external-table-300x76.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/data-lineage-snowflake-create-external-table-400x101.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/04\/data-lineage-snowflake-create-external-table.png 428w\" sizes=\"(max-width: 428px) 100vw, 428px\" \/><\/a><figcaption>Linaje de datos Crear tabla externa<\/figcaption><\/figure>\n<\/div>\n<p>En Snowflake, los datos de archivos externos tambi\u00e9n se pueden mover a la tabla usando <strong><a class=\"rank-math-link\" href=\"https:\/\/github.com\/sqlparser\/sqlflow_public\/tree\/master\/databases\/snowflake\/copy-from-json\">copiar en<\/a><\/strong> La declaraci\u00f3n SQL y Gudu SQLFlow tambi\u00e9n pueden detectar el linaje de datos en la copia en la declaraci\u00f3n de consulta SQL.<\/p>\n<h2 class=\"wp-block-heading\">SQL Server y Azure Synapse Analytics<\/h2>\n<p>El comando Crear tabla externa crea una tabla externa para que PolyBase acceda a los datos almacenados en un cl\u00faster de Hadoop o un almacenamiento de blobs de Azure. Tabla externa de PolyBase que hace referencia a los datos almacenados en un cl\u00faster de Hadoop o un almacenamiento de blobs de Azure.<\/p>\n<p>En Azure Synapse Analytics, la tabla externa creada:<\/p>\n<ul>\n<li>Consulte datos de almacenamiento de blobs de Hadoop o Azure con instrucciones Transact-SQL.<\/li>\n<li>Importar y almacenar datos desde Hadoop o Azure Blob Storage.<\/li>\n<li>Importar y almacenar datos desde Azure Data Lake Store.<\/li>\n<\/ul>\n<p>Para crear una tabla externa, primero se debe crear una fuente de datos externa:<\/p>\n<pre class=\"wp-block-code\"><code>CREAR FUENTE DE DATOS EXTERNA AzureDataLakeStore CON (TIPO = HADOOP, UBICACI\u00d3N = &#039;abfss:\/\/data@pbasetr.azuredatalakestore.net&#039; )<\/code><\/pre>\n<p>Luego, crea una tabla externa usando esta consulta SQL:<\/p>\n<pre class=\"wp-block-code\"><code>CREAR TABLA EXTERNA [dbo].[DimProductexternal] ( [ProductKey] [int] NO NULO, [ProductLabel] nvarchar NULL, [ProductName] nvarchar NULL ) CON ( UBICACI\u00d3N=&#039;\/DimProduct\/&#039; , FUENTE_DE_DATOS = AzureDataLakeStore , FORMATO_DE_ARCHIVO = TextFileFormat , TIPO_DE_RECHAZO = VALOR , VALOR_DE_RECHAZO = 0 ) ;<\/code><\/pre>\n<p>El linaje de datos generado por Gudu SQLFlow despu\u00e9s de analizar la declaraci\u00f3n de creaci\u00f3n de tabla externa es:<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large is-resized\"><a href=\"https:\/\/sqlflow.gudusoft.com\"><img decoding=\"async\" class=\"wp-image-3752\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-sqlserver-create-external-table-1-1024x119.png\" alt=\"\" width=\"899\" height=\"104\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-sqlserver-create-external-table-1-200x23.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-sqlserver-create-external-table-1-300x35.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-sqlserver-create-external-table-1-400x46.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-sqlserver-create-external-table-1-600x69.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-sqlserver-create-external-table-1-768x89.png 768w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-sqlserver-create-external-table-1-800x93.png 800w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-sqlserver-create-external-table-1-1024x119.png 1024w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-sqlserver-create-external-table-1.png 1080w\" sizes=\"(max-width: 899px) 100vw, 899px\" \/><\/a><figcaption>SQL Server create exernal table data lineage<\/figcaption><\/figure>\n<\/div>\n<h2 class=\"wp-block-heading\">AWS Redshift crea una tabla externa<\/h2>\n<p>Puede crear una tabla externa en Amazon Redshift, AWS Glue, Amazon Athena o un metaalmac\u00e9n de Apache Hive. Si su tabla externa est\u00e1 definida en AWS Glue, Athena o un metaalmac\u00e9n de Hive, primero debe crear un esquema externo que haga referencia a la base de datos externa. Despu\u00e9s, puede hacer referencia a la tabla externa en su instrucci\u00f3n SELECT prefijando el nombre del esquema en el nombre de la tabla, sin necesidad de crear la tabla en Amazon Redshift.\u00a0<\/p>\n<p>El siguiente ejemplo crea una tabla denominada VENTAS en el esquema externo de Amazon Redshift denominado\u00a0<code>espectro<\/code>Los datos est\u00e1n en archivos de texto delimitados por tabulaciones.<\/p>\n<pre class=\"wp-block-code\"><code>create external table spectrum.sales(\r\nsalesid integer,\r\nlistid integer,\r\nsellerid integer,\r\nbuyerid integer,\r\neventid integer,\r\ndateid smallint,\r\nqtysold smallint,\r\npricepaid decimal(8,2),\r\ncommission decimal(8,2),\r\nsaletime timestamp)\r\nrow format delimited\r\nfields terminated by '\\t'\r\nstored as textfile\r\nlocation 's3:\/\/awssampledbuswest2\/tickit\/spectrum\/sales\/'\r\ntable properties ('numRows'='172000');<\/code><\/pre>\n<p>El linaje de datos generado por Gudu SQLFlow despu\u00e9s de analizar el SQL anterior es:<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><a href=\"https:\/\/sqlflow.gudusoft.com\"><img decoding=\"async\" width=\"644\" height=\"216\" class=\"wp-image-3799\" src=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-redshift-create-external-table.png\" alt=\"\" srcset=\"https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-redshift-create-external-table-200x67.png 200w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-redshift-create-external-table-300x101.png 300w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-redshift-create-external-table-400x134.png 400w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-redshift-create-external-table-600x201.png 600w, https:\/\/www.gudusoft.com\/wp-content\/uploads\/2022\/05\/data-lineage-redshift-create-external-table.png 644w\" sizes=\"(max-width: 644px) 100vw, 644px\" \/><\/a><figcaption>Redshift Create External Table Data Lineage<\/figcaption><\/figure>\n<\/div>\n<h2 class=\"wp-block-heading\">Conclusi\u00f3n\u00a0<\/h2>\n<p>Gracias por leer nuestro art\u00edculo y si te puede ayudar a tener una mejor comprensi\u00f3n de <strong>\u00bfC\u00f3mo crea el linaje de datos una tabla externa?<\/strong>Estar\u00edamos muy contentos. Si quieres saber m\u00e1s sobre <strong>linaje de datos crear tabla externa<\/strong>Nos gustar\u00eda recomendarle que visite nuestro sitio web. <strong><a href=\"https:\/\/sqlflow.gudusoft.com\">Flujo de SQL de Gudu<\/a><\/strong> Para m\u00e1s informaci\u00f3n. (Editado por Ryan el 25 de abril de 2022)<\/p>\n<\/div><\/div><\/div><style type=\"text\/css\">.fusion-body .fusion-builder-column-0{width:100% !important;margin-top : 0px;margin-bottom : 0px;}.fusion-builder-column-0 > .fusion-column-wrapper {padding-top : 0px !important;padding-right : 0px !important;margin-right : 1.92%;padding-bottom : 0px !important;padding-left : 0px !important;margin-left : 1.92%;}@media only screen and (max-width:1024px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}@media only screen and (max-width:640px) {.fusion-body .fusion-builder-column-0{width:100% !important;}.fusion-builder-column-0 > .fusion-column-wrapper {margin-right : 1.92%;margin-left : 1.92%;}}<\/style><\/div><style type=\"text\/css\">.fusion-body .fusion-flex-container.fusion-builder-row-1{ padding-top : 0px;margin-top : 0px;padding-right : 0px;padding-bottom : 0px;margin-bottom : 0px;padding-left : 0px;}<\/style><\/div>","protected":false},"excerpt":{"rendered":"","protected":false},"author":27,"featured_media":3544,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[31],"tags":[81,83,79,55,75,82,80],"_links":{"self":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/3493"}],"collection":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/comments?post=3493"}],"version-history":[{"count":49,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/3493\/revisions"}],"predecessor-version":[{"id":3898,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/posts\/3493\/revisions\/3898"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media\/3544"}],"wp:attachment":[{"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/media?parent=3493"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/categories?post=3493"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gudusoft.com\/es\/wp-json\/wp\/v2\/tags?post=3493"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}