sábado, 6 de noviembre de 2010

Transformaciones de Integration Services


Las transformaciones de SQL Server Integration Services son los componentes en el flujo de datos de un paquete que agregan, mezclan, distribuyen y modifican datos. Las transformaciones también pueden realizar operaciones de búsqueda y generar conjuntos de datos de ejemplo.
Transformaciones de Business Intelligence
Las siguientes transformaciones realizan operaciones de inteligencia empresarial tales como limpiar datos, realizar minería de texto y ejecutar consultas de predicción de minería de datos.
Transformación

Descripción
Transformación Dimensión de variación lenta
Slowly Changing Dimension
Transformación que configura la actualización de una dimensión de variación lenta.
Transformación Agrupación aproximada
Fuzzy Grouping Transformation
Transformación que normaliza los valores de los datos de una columna.
Transformación Búsqueda aproximada
Fuzzy Lookup Transformation
Transformación que busca valores en una tabla de referencia mediante una coincidencia aproximada.
Transformación Extracción de términos
Term Extraction Transformation
Transformación que extrae términos del texto.
Transformación Búsqueda de términos
Term Lookup Transformation
Transformación que busca términos en una tabla de referencia y cuenta los términos extraídos del texto.
Transformación Consulta de minería de datos
Data Mining Query Transformation
Transformación que ejecuta consultas de predicción de minería de datos.
Transformaciones de fila
Las siguientes transformaciones actualizan los valores de columna y crean columnas nuevas. La transformación se aplica a cada fila en la entrada de transformación.
Transformación

Descripción
Transformación Mapa de caracteres
Character Map Transformation
Transformación que aplica funciones de cadena a caracteres.
Transformación Copiar columna
Copy Column Transformation
Transformación que agrega copias de columnas de entrada a la salida de transformación.
Transformación Conversión de datos
Data Conversion Transformation
Transformación que convierte el tipo de datos de una columna en un tipo de datos diferente.
Transformación Columna derivada
Derived Column Transformation
Transformación que rellena las columnas con los resultados de las expresiones.
Transformación Exportar columna
Export Column
Transformación que inserta datos de un flujo de datos en un archivo.
Transformación Importar columna
Import Column
Transformación que lee los datos de un archivo y los agrega a un flujo de datos.
Componente de script
Script Component
Transformación que usa scripts para extraer, transformar o cargar datos.
Transformación Comando de OLE DB
OLE DB Command Transformation
Transformación que ejecuta comandos SQL para cada fila de un flujo de datos.
Transformaciones de conjunto de filas
Las siguientes transformaciones crean nuevos conjuntos de filas. El conjunto de filas puede incluir valores agregados y ordenados, conjuntos de filas de ejemplo y conjuntos de filas dinamizados y de anulación de dinamización.
Transformación

Descripción
Transformación Agregado
Aggregate Transformation
Transformación que realiza agregaciones tales como AVERAGE, SUM y COUNT.
Transformación Ordenar
Sort Transformation
Transformación que ordena datos.
Transformación Muestreo de porcentaje
Percentage Sampling Transformation
Transformación que crea un conjunto de datos de ejemplo mediante un porcentaje para especificar el tamaño del ejemplo.
Transformación Muestreo de fila
Row Sampling Transformation
Transformación que crea un conjunto de datos de ejemplo especificando la cantidad de filas en la muestra.
Transformación dinámica
Pivot Transformation
Transformación que crea una versión menos normalizada de una tabla normalizada.
Transformación Anulación de dinamización
Unpivot Transformation
Transformación que crea una versión más normalizada de una tabla no normalizada.
Transformaciones de división y combinación
Las siguientes transformaciones distribuyen filas a diferentes salidas, crean copias de las entradas de transformación, combinan varias entradas en una salida y realizan operaciones de búsqueda.
Transformación

Descripción
Transformación División condicional
Conditional Split Transformation
Transformación que en ruta las filas de datos a diferentes salidas.
Transformación Multidifusión
Multicast Transformation
Transformación que distribuye conjuntos de datos a varias salidas.
Transformación Unión de todo
Union All Transformation
Transformación que mezcla varios conjuntos de datos.
Transformación Mezclar
Merge Transformation
Transformación que mezcla dos conjuntos de datos ordenados.
Transformación Combinación de mezcla
Merge Join Transformation
Transformación que mezcla dos conjuntos de datos mediante una combinación FULL, LEFT o INNER.
Transformación Búsqueda
Lookup Transformation
Transformación que busca valores en una tabla de referencia con una coincidencia exacta.
Transformación de caché
Cache Transformation
La transformación que escribe los datos procedentes de un origen de datos conectado del flujo de datos en un administrador de conexiones de caché que guarda los datos en un archivo de caché. La transformación de búsqueda realiza búsquedas en los datos del archivo de caché.
Auditar transformaciones
Integration Services incluye las transformaciones siguientes para agregar filas de recuento e información.
Transformación

Descripción
Transformación Auditar
Audit Transformation
Transformación que hace que la información sobre el entorno esté a disposición del flujo de datos en un paquete.
Transformación Recuento de filas
Row Count Transformation
Transformación que cuenta las filas a medida que se mueven por ella y almacena el recuento final en una variable.

  
Tipos de Datos en Integration Services
Tipo de datos
Descripción
DT_BOOL
Un valor booleano.
DT_BYTES
Un valor de datos binarios. La longitud es variable y la longitud máxima es de 8000 bytes.
DT_CY
Un valor de moneda. Este tipo de datos es un entero con signo de 8 bytes con una escala de 4 y una precisión máxima de 19 dígitos.
DT_DATE
Una estructura de fecha formada por año, mes, día, hora, minuto, segundo y fracciones de segundo. Las fracciones de segundo tienen una escala máxima de 7 dígitos.
El tipo de datos DT_DATE se implementa utilizando un número de punto flotante de 8 bytes. Los días se representan mediante incrementos de números enteros, comenzando por el 30 de diciembre de 1899 y la medianoche como hora cero. Los valores de hora se expresan como el valor absoluto de la parte fraccionaria del número. Sin embargo, un valor de punto flotante no puede representar todos los valores reales; por lo tanto, existen límites en el intervalo de fechas que se puede presentar en DT_DATE.
Por otra parte, DT_DBTIMESTAMP se representa mediante una estructura que posee internamente campos individuales para año, mes, día, horas, minutos, segundos y milisegundos. Este tipo de datos tiene límites más amplios que los intervalos de fechas que puede presentar.
DT_DBDATE
Una estructura de fecha compuesta por año, mes y día.
DT_DBTIME
Una estructura de hora compuesta por horas, minutos y segundos.
DT_DBTIME2
Una estructura de hora formada por hora, minuto, segundo y fracciones de segundo. Las fracciones de segundo tienen una escala máxima de 7 dígitos.
DT_DBTIMESTAMP
Una estructura de marca de tiempo formada por año, mes, día, hora, minuto, segundo y fracciones de segundo. Las fracciones de segundo tienen una escala máxima de 3 dígitos.
DT_DBTIMESTAMP2
Una estructura de marca de tiempo formada por año, mes, día, hora, minuto, segundo y fracciones de segundo. Las fracciones de segundo tienen una escala máxima de 7 dígitos.
DT_DBTIMESTAMPOFFSET
Una estructura de marca de tiempo formada por año, mes, día, hora, minuto, segundo y fracciones de segundo. Las fracciones de segundo tienen una escala máxima de 7 dígitos.
A diferencia de los tipos de datos DT_DBTIMESTAMP y DT_DBTIMESTAMP2, el tipo de datos DT_DBTIMESTAMPOFFSET tiene un ajuste de zona horaria. Este ajuste especifica el desplazamiento de la hora en número de horas y minutos respecto a la hora universal coordinada (UTC). El sistema utiliza el ajuste de zona horaria para obtener la hora local.
El ajuste de zona horaria debe incluir un signo, más o menos, para indicar si el ajuste se agrega o se resta de la UTC. El número válido de ajuste de horas está entre -14 y +14. El signo para el ajuste de minutos depende del signo del ajuste de horas:
·         Si el signo del ajuste de horas es negativo, el ajuste de minutos debe ser negativo o cero.
·         Si el signo para el ajuste de horas es positivo, el ajuste de minutos debe ser positivo o cero.
·         Si el signo del ajuste de horas es cero, el ajuste de minutos puede ser cualquier valor desde 0,59 negativo a 0,59 positivo.
DT_DECIMAL
Un valor numérico exacto con una precisión fija y una escala fija. Este tipo de dato es un entero sin signo de 12 bytes con un signo aparte, una escala de 0 a 28 y una precisión máxima de 28.
DT_FILETIME
Un valor de 64 bits que representa la cantidad de intervalos de 100 nanosegundos desde el 1 de enero de 1601. Las fracciones de segundo tienen una escala máxima de 3 dígitos.
DT_GUID
Identificador único global (GUID).
DT_I1
Un entero con signo de un byte.
DT_I2
Un entero con signo de dos bytes.
DT_I4
Un entero con signo de cuatro bytes.
DT_I8
Un entero con signo de ocho bytes.
DT_NUMERIC
Un valor numérico exacto con una precisión y escala fijas. Este tipo de dato es un entero sin signo de 16 bytes con un signo aparte, una escala de 0 a 38 y una precisión máxima de 38.
DT_R4
Un valor de coma flotante y precisión única.
DT_R8
Un valor de coma flotante y precisión doble.
DT_STR
Una cadena de caracteres ANSI/MBCS terminada en NULL, con una longitud máxima de 8.000 caracteres. (Si un valor de columna contiene otros terminadores NULL, la cadena se truncará cuando se encuentre el primer NULL.)
DT_UI1
Un entero sin signo de un byte.
DT_UI2
Un entero sin signo de dos bytes.
DT_UI4
Un entero sin signo de cuatro bytes.
DT_UI8
Un entero sin signo de ocho bytes.
DT_WSTR
Una cadena de caracteres Unicode terminada en NULL, con una longitud máxima de 4000 caracteres. (Si un valor de columna contiene otros terminadores NULL, la cadena se truncará cuando se encuentre el primer NULL.)
DT_IMAGE
Un valor binario con un tamaño máximo de 231-1 (2.147.483.647) bytes. .
DT_NTEXT
Una cadena de caracteres Unicode con una longitud máxima de 230 - 1 (1.073.741.823) caracteres.
DT_TEXT
Una cadena de caracteres ANSI/MBCS con una

1 comentario:

  1. Tengo 1 planilla excel con datos cualesquiera. He definido el formato de la celda como TEXTO. Sin embargo el SQL SERVER Business Intelligence le adjudica un formato DT_R8 y luego lo que debería leer en esa celda lo asume como NULL. ¿Como se puede hacer para que lea la celda como un simple string?

    ResponderEliminar