Las transformaciones de SQL Server Integration Services son los componentes en el flujo de datos de un paquete que agregan, mezclan, distribuyen y modifican datos. Las transformaciones también pueden realizar operaciones de búsqueda y generar conjuntos de datos de ejemplo.
Transformaciones de Business Intelligence
Las siguientes transformaciones realizan operaciones de inteligencia empresarial tales como limpiar datos, realizar minería de texto y ejecutar consultas de predicción de minería de datos.
Transformación | Descripción | |
Transformación Dimensión de variación lenta | Slowly Changing Dimension | Transformación que configura la actualización de una dimensión de variación lenta. |
Transformación Agrupación aproximada | Fuzzy Grouping Transformation | Transformación que normaliza los valores de los datos de una columna. |
Transformación Búsqueda aproximada | Fuzzy Lookup Transformation | Transformación que busca valores en una tabla de referencia mediante una coincidencia aproximada. |
Transformación Extracción de términos | Term Extraction Transformation | Transformación que extrae términos del texto. |
Transformación Búsqueda de términos | Term Lookup Transformation | Transformación que busca términos en una tabla de referencia y cuenta los términos extraídos del texto. |
Transformación Consulta de minería de datos | Data Mining Query Transformation | Transformación que ejecuta consultas de predicción de minería de datos. |
Transformaciones de fila
Las siguientes transformaciones actualizan los valores de columna y crean columnas nuevas. La transformación se aplica a cada fila en la entrada de transformación.
Transformación | Descripción | |
Transformación Mapa de caracteres | Character Map Transformation | Transformación que aplica funciones de cadena a caracteres. |
Transformación Copiar columna | Copy Column Transformation | Transformación que agrega copias de columnas de entrada a la salida de transformación. |
Transformación Conversión de datos | Data Conversion Transformation | Transformación que convierte el tipo de datos de una columna en un tipo de datos diferente. |
Transformación Columna derivada | Derived Column Transformation | Transformación que rellena las columnas con los resultados de las expresiones. |
Transformación Exportar columna | Export Column | Transformación que inserta datos de un flujo de datos en un archivo. |
Transformación Importar columna | Import Column | Transformación que lee los datos de un archivo y los agrega a un flujo de datos. |
Componente de script | Script Component | Transformación que usa scripts para extraer, transformar o cargar datos. |
Transformación Comando de OLE DB | OLE DB Command Transformation | Transformación que ejecuta comandos SQL para cada fila de un flujo de datos. |
Transformaciones de conjunto de filas
Las siguientes transformaciones crean nuevos conjuntos de filas. El conjunto de filas puede incluir valores agregados y ordenados, conjuntos de filas de ejemplo y conjuntos de filas dinamizados y de anulación de dinamización.
Transformación | Descripción | |
Transformación Agregado | Aggregate Transformation | Transformación que realiza agregaciones tales como AVERAGE, SUM y COUNT. |
Transformación Ordenar | Sort Transformation | Transformación que ordena datos. |
Transformación Muestreo de porcentaje | Percentage Sampling Transformation | Transformación que crea un conjunto de datos de ejemplo mediante un porcentaje para especificar el tamaño del ejemplo. |
Transformación Muestreo de fila | Row Sampling Transformation | Transformación que crea un conjunto de datos de ejemplo especificando la cantidad de filas en la muestra. |
Transformación dinámica | Pivot Transformation | Transformación que crea una versión menos normalizada de una tabla normalizada. |
Transformación Anulación de dinamización | Unpivot Transformation | Transformación que crea una versión más normalizada de una tabla no normalizada. |
Transformaciones de división y combinación
Las siguientes transformaciones distribuyen filas a diferentes salidas, crean copias de las entradas de transformación, combinan varias entradas en una salida y realizan operaciones de búsqueda.
Transformación | Descripción | |
Transformación División condicional | Conditional Split Transformation | Transformación que en ruta las filas de datos a diferentes salidas. |
Transformación Multidifusión | Multicast Transformation | Transformación que distribuye conjuntos de datos a varias salidas. |
Transformación Unión de todo | Union All Transformation | Transformación que mezcla varios conjuntos de datos. |
Transformación Mezclar | Merge Transformation | Transformación que mezcla dos conjuntos de datos ordenados. |
Transformación Combinación de mezcla | Merge Join Transformation | Transformación que mezcla dos conjuntos de datos mediante una combinación FULL, LEFT o INNER. |
Transformación Búsqueda | Lookup Transformation | Transformación que busca valores en una tabla de referencia con una coincidencia exacta. |
Transformación de caché | Cache Transformation | La transformación que escribe los datos procedentes de un origen de datos conectado del flujo de datos en un administrador de conexiones de caché que guarda los datos en un archivo de caché. La transformación de búsqueda realiza búsquedas en los datos del archivo de caché. |
Auditar transformaciones
Integration Services incluye las transformaciones siguientes para agregar filas de recuento e información.
Transformación | Descripción | |
Transformación Auditar | Audit Transformation | Transformación que hace que la información sobre el entorno esté a disposición del flujo de datos en un paquete. |
Transformación Recuento de filas | Row Count Transformation | Transformación que cuenta las filas a medida que se mueven por ella y almacena el recuento final en una variable. |
Tipos de Datos en Integration Services
Tipo de datos | Descripción |
DT_BOOL | Un valor booleano. |
DT_BYTES | Un valor de datos binarios. La longitud es variable y la longitud máxima es de 8000 bytes. |
DT_CY | Un valor de moneda. Este tipo de datos es un entero con signo de 8 bytes con una escala de 4 y una precisión máxima de 19 dígitos. |
DT_DATE | Una estructura de fecha formada por año, mes, día, hora, minuto, segundo y fracciones de segundo. Las fracciones de segundo tienen una escala máxima de 7 dígitos. El tipo de datos DT_DATE se implementa utilizando un número de punto flotante de 8 bytes. Los días se representan mediante incrementos de números enteros, comenzando por el 30 de diciembre de 1899 y la medianoche como hora cero. Los valores de hora se expresan como el valor absoluto de la parte fraccionaria del número. Sin embargo, un valor de punto flotante no puede representar todos los valores reales; por lo tanto, existen límites en el intervalo de fechas que se puede presentar en DT_DATE. Por otra parte, DT_DBTIMESTAMP se representa mediante una estructura que posee internamente campos individuales para año, mes, día, horas, minutos, segundos y milisegundos. Este tipo de datos tiene límites más amplios que los intervalos de fechas que puede presentar. |
DT_DBDATE | Una estructura de fecha compuesta por año, mes y día. |
DT_DBTIME | Una estructura de hora compuesta por horas, minutos y segundos. |
DT_DBTIME2 | Una estructura de hora formada por hora, minuto, segundo y fracciones de segundo. Las fracciones de segundo tienen una escala máxima de 7 dígitos. |
DT_DBTIMESTAMP | Una estructura de marca de tiempo formada por año, mes, día, hora, minuto, segundo y fracciones de segundo. Las fracciones de segundo tienen una escala máxima de 3 dígitos. |
DT_DBTIMESTAMP2 | Una estructura de marca de tiempo formada por año, mes, día, hora, minuto, segundo y fracciones de segundo. Las fracciones de segundo tienen una escala máxima de 7 dígitos. |
DT_DBTIMESTAMPOFFSET | Una estructura de marca de tiempo formada por año, mes, día, hora, minuto, segundo y fracciones de segundo. Las fracciones de segundo tienen una escala máxima de 7 dígitos. A diferencia de los tipos de datos DT_DBTIMESTAMP y DT_DBTIMESTAMP2, el tipo de datos DT_DBTIMESTAMPOFFSET tiene un ajuste de zona horaria. Este ajuste especifica el desplazamiento de la hora en número de horas y minutos respecto a la hora universal coordinada (UTC). El sistema utiliza el ajuste de zona horaria para obtener la hora local. El ajuste de zona horaria debe incluir un signo, más o menos, para indicar si el ajuste se agrega o se resta de la UTC. El número válido de ajuste de horas está entre -14 y +14. El signo para el ajuste de minutos depende del signo del ajuste de horas: · Si el signo del ajuste de horas es negativo, el ajuste de minutos debe ser negativo o cero. · Si el signo para el ajuste de horas es positivo, el ajuste de minutos debe ser positivo o cero. · Si el signo del ajuste de horas es cero, el ajuste de minutos puede ser cualquier valor desde 0,59 negativo a 0,59 positivo. |
DT_DECIMAL | Un valor numérico exacto con una precisión fija y una escala fija. Este tipo de dato es un entero sin signo de 12 bytes con un signo aparte, una escala de 0 a 28 y una precisión máxima de 28. |
DT_FILETIME | Un valor de 64 bits que representa la cantidad de intervalos de 100 nanosegundos desde el 1 de enero de 1601. Las fracciones de segundo tienen una escala máxima de 3 dígitos. |
DT_GUID | Identificador único global (GUID). |
DT_I1 | Un entero con signo de un byte. |
DT_I2 | Un entero con signo de dos bytes. |
DT_I4 | Un entero con signo de cuatro bytes. |
DT_I8 | Un entero con signo de ocho bytes. |
DT_NUMERIC | Un valor numérico exacto con una precisión y escala fijas. Este tipo de dato es un entero sin signo de 16 bytes con un signo aparte, una escala de 0 a 38 y una precisión máxima de 38. |
DT_R4 | Un valor de coma flotante y precisión única. |
DT_R8 | Un valor de coma flotante y precisión doble. |
DT_STR | Una cadena de caracteres ANSI/MBCS terminada en NULL, con una longitud máxima de 8.000 caracteres. (Si un valor de columna contiene otros terminadores NULL, la cadena se truncará cuando se encuentre el primer NULL.) |
DT_UI1 | Un entero sin signo de un byte. |
DT_UI2 | Un entero sin signo de dos bytes. |
DT_UI4 | Un entero sin signo de cuatro bytes. |
DT_UI8 | Un entero sin signo de ocho bytes. |
DT_WSTR | Una cadena de caracteres Unicode terminada en NULL, con una longitud máxima de 4000 caracteres. (Si un valor de columna contiene otros terminadores NULL, la cadena se truncará cuando se encuentre el primer NULL.) |
DT_IMAGE | Un valor binario con un tamaño máximo de 231-1 (2.147.483.647) bytes. . |
DT_NTEXT | Una cadena de caracteres Unicode con una longitud máxima de 230 - 1 (1.073.741.823) caracteres. |
DT_TEXT | Una cadena de caracteres ANSI/MBCS con una |
Tengo 1 planilla excel con datos cualesquiera. He definido el formato de la celda como TEXTO. Sin embargo el SQL SERVER Business Intelligence le adjudica un formato DT_R8 y luego lo que debería leer en esa celda lo asume como NULL. ¿Como se puede hacer para que lea la celda como un simple string?
ResponderEliminar