Blog
¿Qué es SAP Information Steward?
- 16/06/2020
- Escrito por: Grazia Masulli
- Categoría: Otros productos SAP
SAP Information Steward es una plataforma de software para la gestión de datos empresariales: un conjunto de herramientas que permite realizar un análisis de la calidad de los datos empresariales, comprender su correlación y evaluar su impacto en el negocio.
Es uno de los productos que SAP ha desarrollado para la gestión de la información empresarial (EIM – gestión de la información de la empresa.).
SAP Information Steward, en concreto, puede conectarse a un sistema SAP en producción y permite llevarlo a cabo:
- Caracterización de los datos y control de la calidad de los mismos
- Definición de reglas de validación y limpieza de datos
- Control de los datos duplicados
- Análisis de metadatos
- Definición de un glosario de términos empresariales
Se trata de una herramienta indispensable para ayudar a los especialistas en diferentes aspectos de la gestión de datos empresariales: entender los datos y los metadatos, definir los requisitos de calidad de la empresa (incluidas las reglas de validación y limpieza de datos) y supervisar la evolución de la calidad de los datos a lo largo del tiempo.
La elaboración de perfiles de datos (“perfilado“) es simplemente el proceso de analizar los datos existentes y calcular los valores estadísticos pertinentes (por ejemplo, el mínimo, el máximo, la media, la mediana) para la detección de errores, anomalías y problemas potenciales.
Este es el punto de partida al analizar un conjunto de datos, una serie de pruebas que comprueban diversos aspectos como el tipo, la integridad, la redundancia, etc.
En la práctica, por ejemplo, podemos ver si la base de datos de los clientes potenciales que se han puesto en contacto con nosotros a través de Internet para pedir un presupuesto contiene información fundamental para nosotros, como las direcciones de correo electrónico, o si en algunos casos están ausentes o tienen un formato incorrecto (por ejemplo, sin la “@”).
Un aspecto interesante es la cuantificación del valor empresarial de los datos (“Business Value Analysis”). Volviendo al ejemplo anterior, si sabemos que cada cliente potencial que se pone en contacto con nosotros tiene un determinado valor monetario, podemos asociar una pérdida económica a todas las direcciones de correo electrónico que falten o estén incompletas. Si se realiza un pedido por cada diez contactos y el valor medio del pedido es de 10.000 euros, SAP Information Steward calculará que el 20% de las direcciones de correo electrónico que faltan o están incompletas equivale a una pérdida de 2.000 euros.
SAP Information Steward le permite crear complejas reglas de validación de la calidad de los datos para comprobar si éstos se ajustan a los requisitos empresariales. Estas reglas generan “puntuaciones” que determinan la aceptación o el rechazo de los datos y se definen en función de escenarios y objetivos empresariales específicos.
Estas reglas pueden utilizarse para crear “data quality scorecard” (fichas de calidad de datos) y diferentes visualizaciones que ayuden a los usuarios en su trabajo.
En cuanto a la eliminación de datos duplicados en situaciones en las que se requiere un alto grado de precisión del resultado, puede ser necesaria la intervención “manual” de un usuario para resolver casos complejos (“Mario Rossi” y “Mario L. Rossi” son el mismo cliente o no?). En este caso, Information Steward proporciona varios filtros para facilitar el trabajo y sugiere cambios que pueden ser aceptados o no.
Otra posibilidad interesante es la definición de un glosario empresarial. Esta definición tiene lugar en la “Metapedia”, una plataforma centralizada para la definición de un vocabulario estándar de términos, frases o conceptos relacionados con la empresa.
Por ejemplo, puede definir qué es el “Ingreso neto” y elegir que este término sea un sinónimo de “Beneficio”, que pertenezca a la categoría “Finanzas” y que esté vinculado a varias otras palabras clave (ventas, presupuesto, etc.).
Este glosario es de gran valor para una gestión de datos uniforme y para la definición de una “taxonomía” de clasificación de contenidos.