SAS: calidad de los datos para Big Data

sas-big-data-itusersSAS: La preparación de los datos es parte fundamental en el Big Data

Lima, Perú, 18 de setiembre del 2015.— Las modernas soluciones que existen actualmente en el mercado hacen cada vez más fácil manejar los grandes volúmenes de información, en la era del Big Data. Sin embargo, vale la pena preguntarse, ¿son necesarios tantos datos?… En otras palabras, si su solución de analítica puede organizarlos, consolidarlos y salir invicto dentro de este entorno de Big Data, ¿eso significa que estas nuevas herramientas de información pueden lograrlo con cualquier fuente de datos?… La respuesta es un no rotundo.

Gracias a que existen estas herramientas capaces de todo, hay una tentación natural por soltar los datos a estas herramientas y esperar a ver qué sale. Sin embargo, para obtener el valor real, es necesario hacer algo más que simplemente dejar sus datos en manos de un software y esperar a que salga un informe automático.

Por ejemplo, aspectos como la calidad, el diseño y la estructura de un reporte deberían importarle y esto no es sólo responsabilidad de la solución con la que usted cuente. La preparación de los datos es parte fundamental y por eso SAS propone algunos pasos que deben ser considerados como punto de partida para sacar el mayor provecho de su información antes de visualizarla en un informe.

  1. No use columnas innecesarias. A veces usted conserva los datos de determinada manera, sólo porque vienen de la fuente original así. Analice muy bien sus datos para entender cuáles le aportarán valor y cuáles no.
  2. Reduzca la distancia entre un campo y otro. A veces las casillas quedan largas debido a que se ajustan a la longitud del dato más grande. Analice qué puede hacer con estas cifras y sí es necesario mostrarlas completas.
  3. Iguale el conjunto de datos para poder combinar filas. La dispersión de sus datos puede afectar negativamente el rendimiento y aumentar el tamaño de los datos cuando son escasos. Haga que sus datos estén al mismo nivel.
  4. Trasponga datos desde filas a columnas. Algunas soluciones no sólo le ayudan a visualizar e informarse sobre los valores, sino que integran un análisis muy sofisticado tal como la previsión, los árboles de decisión y las correlaciones. Ubicando estos datos en columnas permite un análisis más sofisticado.
  5. Reduzca la “cardinalidad” si es posible. Como la alta cardinalidad puede disminuir el rendimiento, es buena idea revisar cuáles datos tienen alta cardinalidad pero no la requieren y reducirla al mínimo.

Finalmente, no utilice estos pasos como un checklist, sino como un punto de partida para ayudarle a manejar sus datos.

Acerca de SAS

SAS Institute fue creada en 1976 en la Universidad Carolina del Norte y actualmente es una de las principales empresas privadas de software a nivel mundial. Tiene presencia en 139 países, más de 13 mil empleados y en 2013 obtuvo ingresos por $3.02 billones. En 2012 SAS fue elegida como la Mejor Empresa para Trabajar del Mundo, según la lista de la revista Fortune.

SAS se encuentra dirigida por el Dr. Jim Goodnight, su mentor y actual Chief Executive Officer (CEO) de la compañía, quien ha sido distinguido como “Gran Líder de Negocios de América” por la revista Harvard Business Review.

En Chile, SAS posee una posición de liderazgo en el mercado de Big Data Analytics e inteligencia de negocios, especialmente en servicios financieros, retail, telecomunicaciones, seguros, salud y educación, entre otros. Gracias a las soluciones SAS, diversas empresas del rubro han incorporado la gestión de datos como un activo corporativo fundamental al momento de tomar decisiones estratégicas.

SAS Perú actualmente ofrece una completa suite de soluciones orientadas al análisis avanzado de datos, entre los que destaca Customer Intelligence, Risk Management, Fraud Management, Information Management, High Performance Analytics, entre otros.