Teradata supera limitaciones de analíticos R de código abierto

Teradata-Aster-R-itusersLa compañía ofrece a los usuarios de lenguaje R poder de procesamiento de alta velocidad, análisis adicional, facilidad de uso y volúmenes masivos de datos integrados

Lima, 08 de julio de 2014.— Teradata Corp. (NYSE: TDC), líder mundial en soluciones de análisis de datos, presentó Teradata® Aster® R, una solución que aumenta el poder del análisis R de código abierto gracias a la extensión de la memoria y el procesamiento de datos. De esta forma, Teradata Aster R brinda al analista R una solución de análisis empresarial masivamente escalable, confiable y fácil de usar.

En la actualidad, los analistas R tienen el desafío de obtener el máximo beneficio de R cuando el mismo es utilizado en un único servidor y solo funciona en un entorno en memoria. Esto último, sin embargo, restringe la cantidad de datos que pueden ser procesados y puede conducir a una performance lenta del análisis complejo.

Teradata mejora el procesamiento de datos y reduce las limitaciones de memoria al permitir la ejecución paralela en base de datos para el análisis R. Ejecutar R en la base de datos posibilita el procesamiento a una alta velocidad de cantidades masivas de datos, atendiendo las necesidades de análisis de la organización. Además, Teradata permite acceder e integrar información desde múltiples fuentes y utilizar una gama más amplia de análisis, logrando óptimos resultados.

Cabe destacar que R es un lenguaje estadístico y software de código abierto para mineros y científicos de datos. Según los resultados de una encuesta sobre minería de datos de 2013, el número de mineros de datos que utilizan R está creciendo: un 70 por ciento de los encuestados respondió que se encontraban implementando este lenguaje.

Teradata Aster R entrega el poder del análisis R a las empresas”, dijo Scott Gnau, Presidente de Teradata Labs. “Para apoyar a los analistas R, Teradata brinda un lenguaje R familiar y herramientas, facilitando poder de procesamiento masivo y análisis enriquecido sin precedentes. Además, los analistas tienen acceso a un inmenso volumen de información integrada desde múltiples fuentes.”

De esta manera, Teradata Aster R apalanca una plataforma de cómputos de alta performance con grandes ventajas en seguridad, gestión de datos y análisis. A continuación, se detallan tres componentes claves de la nueva solución:

  • Teradata Aster R Library – Esta librería incluye más de 100 funciones R pre construidas que funcionan paralelamente a través de toda la información, eliminando la complejidad del procesamiento paralelo. Los analistas ya no necesitan pasar varios días codificando un algoritmo paralelo, ya que ahora tienen acceso inmediato a las funciones paralelas R, cubriendo un rango de tareas que abarcan desde manejo de datos, acceso, exploración y manipulación, hasta aprendizaje automático de algoritmos. Asimismo, Teradata ha aumentado las capacidades de código abierto R con análisis de alto poder incluyendo el patentado Teradata Aster nPath™.
  • Teradata Aster R Parallel Constructor – Este componente de Teradata Aster R permite a los analistas construir sus análisis paralelos con más de 5,500 paquetes de análisis R o cualquiera de las nuevas funciones analíticas desarrolladas en la comunidad de fuente abierta.
  • Teradata Aster SNAP FrameworkIntegration –El motor R de código abierto ha sido integrado al Teradata Aster SNAP Framework, lo que permite una diversidad de motores de análisis múltiple y almacenamiento de archivos para ajustarse perfectamente a las necesidades de descubrimiento de los analistas. Esta perfecta integración de múltiples capacidades analíticas mejora el poder analítico. Los científicos de datos pueden ahondar profundamente en la información con variadas capacidades analíticas como gráficos, MapReduce, texto, estadísticas, series temporarias y análisis R desde un único programa. Teradata aumentó la Aster R library con módulos de alto poder de análisis gráfico para apoyar a Teradata Aster SQL-GR™, un motor de procesamiento gráfico. Los científicos de datos podrán recurrir al análisis de gráficos para el examen de redes sociales, detección de fraude y propagación de creencias, un algoritmo especializado para realizar modelado de probabilidad.

La rápida adopción de R y su probado valor trae como resultado que las organizaciones que buscan conducir nuevos insights para la generación de ganancias, deberían incluir a R como parte de su estrategia de análisis predictivo,” afirmó James Taylor, CEO de Decision Management Solutions. “Las organizaciones que adoptan R deberían recurrir a vendedores con un sólido plan para apoyar este lenguaje y proveer implementaciones escalables”.

Caso de Uso de Análisis R

Un proveedor de películas online debe predecir futuras ganancias y tomar acciones para detener la potencial reducción de consumidores rentables, al mismo tiempo de asegurarse que estos últimos mejoren su experiencia visual. El proveedor de películas entonces asigna la tarea a un analista R para que lo ayude a entender las preferencias de compras de los clientes y las necesidades de servicios. Sin embargo, el analista R no puede acceder e integrar todos los datos necesarios requeridos debido a las limitaciones de memoria y procesamiento. Si el análisis fue ejecutado en un único servidor, con un entorno en memoria, es probable que no sea completado a tiempo para responder a las necesidades del usuario comercial.

En este sentido, Teradata Aster R permite al analista superar las limitaciones de memoria y procesamiento. Un análisis en base de datos de alta velocidad puede ejecutarse fácilmente sobre toda la información requerida, incluyendo metadatos de películas, búsqueda de clientes, visión de la historia, e información de cuenta desde ApacheTM HadoopTM y Teradata. Con esos insights, el proveedor de películas online puede tomar decisiones para atender mejor a los clientes.

Los servicios de consultoría y clientes de Teradata ofrecerán apoyo de nivel empresarial y las mejores prácticas para Teradata Aster R. Teradata Aster R estará disponible para el cuarto trimestre de 2014.

Acerca de Teradata

Teradata (NYSE: TDC), líder global en plataformas de análisis de datos, aplicaciones de marketing y servicios de consultoría, ayuda a las organizaciones a ser más competitivas mediante el aumento del valor de sus datos y de sus relaciones con los clientes. Visite teradata.com para más detalles.