IBM: "Cuando la gente comienza a escuchar de Big Data se asusta un poco"
Para el experto, la masiva cantidad de datos irrelevantes puede resultar abrumadora a la hora de iniciar un proyecto. Cómo convertirlos en información para el negocio.
La visita del canadiense Dirk deRoos a Buenos Aires tiene un objetivo muy específico: acelerar las oportunidades que los ejecutivos de IBM captaron en el mercado local. Y, más concretamente, aportar casos de uso, ya que en la Argentina, y en América latina en general, no abundan. “Estamos en una segunda etapa de Big Data en la Argentina. La primera era que lo conocieran. Ahora ya saben lo que es; llega la etapa de pensar cómo lo pueden usar en sus compañías, cómo pueden extender el negocio”, asegura Franco Di Masi, Information Management Technical Specialist de IBM. En la actualidad, esas oportunidades aparecen mayoritariamente en los segmentos de telecomunicaciones y banca.
DeRoos está en IBM desde hace 11 años y pasó los últimos dos trabajando con Big Data, aconsejando clientes, encontrando casos de uso y enseñándoles cómo arrancar los proyectos. También participó del laboratorio de desarrollo de software de IBM Toronto como arquitecto de información para toda la documentación de la base de datos DB2. Escribió dos libros sobre Big Data y es uno de los evangelizadores de IBM en la materia. Y advierte que, en algunos casos, para cuando la información “aterrizó” en su destino final, ya es tarde. La alternativa es utilizar modelos predictivos que permitan identificar las variables relevantes en relación a un determinado evento y analizar esas variables en tiempo real. “Hospitales en Canadá y en otras partes del mundo están haciendo investigaciones sobre bebés prematuros. Tienen monitores sobre estos bebés, las enfermeras los revisan y registran los valores. ¿Qué pasaría si esos monitores estuvieran conectados a motores de análisis de datos en movimiento? Que un bebé prematuro desarrolle fiebre puede tener resultados terribles. Sin embargo, se pueden medir los indicadores tempranos de la fiebre y los doctores pueden tratarlos antes de que se produzca. Esto es imposible analizando a posteriori los datos que ya aterrizaron en un repositorio.”
DeRoos considera que cloud computing y la consiguiente disponibilidad de gran potencia de cómputo para organizaciones más pequeñas contribuirán a democratizar el fenómeno de Big Data.
Big Data tiene dos caras: el análisis de información dentro de la compañía y el conocimiento que se pueda extraer de fuentes externas. En su experiencia, ¿cuál es la situación actual de las compañías?
Veo que muchas organizaciones no tienen todas las capacidades de información en su propia organización. De modo que cuando la gente comienza a escuchar sobre Big Data se ve abrumada, se asusta un poco. Por otra parte, creo que se le presta mucha atención a los medios sociales. Pero no toda la información de los medios sociales es valiosa. Distinguir lo que es valioso de lo que no lo es resulta un problema dificultoso, abruma a la gente, y hace que dejen de lado a Big Data tempranamente. Pero hay una inmensa cantidad de fuentes de información disponibles. Como, por ejemplo, las iniciativas de Open Data impulsadas por algunos gobiernos. Y allí hay información potencialmente valiosa. No creo en la idea de una cara interna y otra externa. Lo que veo es un solo repositorio. La clave es alimentarse de diferentes fuentes de información.
¿Existe una manera “correcta” de abordar Big Data?
Si hay, es una manera incorrecta de hacerlo. Un ejemplo de camino equivocado es implementar Big Data por razones técnicas, porque es una tecnología interesante y se puede experimentar con ella, sin pensar en el valor para el negocio. Hemos visto muchos proyectos que terminaron transformándose en “proyectos de ciencia”, que no tuvieron respaldo del negocio y fallaron. Y la gente se frustra. El abordaje correcto siempre debe venir del negocio. La gente debe mirar los objetivos y ver qué información adicional pone en la mesa en términos de lo que el negocio puede hacer. Las compañías que fueron exitosas con Big Data pudieron usarlo para transformar y extender el negocio de una manera que no era posible antes.
Casos de uso, divino tesoro
A la hora de ejemplificar los casos de uso, DeRoos cita el de un proveedor de telecomunicaciones del Sudeste Asiático, con más de 150 millones de suscriptores de teléfonos móviles. “Ahora tiene capacidades de facturación en tiempo real para todos los suscriptores y lo hicieron a un costo extremadamente bajo. Pero, al mismo tiempo, tienen servidores que deben manejar hasta 5.000 millones de estos registros de llamadas por día y ése es un problema de Big Data”. El análisis de “data in motion” (en tiempo real, a medida que va llegando) les permite mejorar la retención de clientes, e incluso mejorar el desempeño de la infraestructura de red.
¿Podría mencionar un caso de uso en mercados no tradicionales?
Tenemos el caso de Vestas: un fabricante de turbinas eólicas danés. Uno de los grandes problemas de las turbinas de viento es dónde se las instala. Las turbinas eólicas son caras, de modo que ubicar estas turbinas es un problema importante de negocios. Por otro lado, quienes compran estas turbinas necesitan ver el retorno de la inversión del lugar donde se instalan estas turbinas. Lo que pudimos hacer en Vestas es ayudarlos a hacer de manera efectiva un mapa para que pudieran ver variables climatológicas como velocidad del viento, temperatura y presión. El problema de Vestas es cuán pequeña podía ser la grilla sobre el mapa. Pero, a medida que se aumenta la granularidad, la cantidad de datos escala asombrosamente. Le ayudamos a Vestas a que pudiera disponer de un mayor grado de precisión y mayor predictibilidad en términos de cuál es el valor de las turbinas eólicas. Creemos que esto producirá unos 6 petabytes de datos. Esto hizo que Vestas no fuera sólo un fabricante, sino que los habilitó para proveer un servicio extremadamente valioso en términos de localización. Y este negocio de consultoría no sólo genera ingresos, sino que empuja las ventas de las turbinas eólicas.
¿Cuál es el desafío a la hora de analizar “datos en movimiento” (en oposición al análisis de información ya almacenada en repositorios)?
Sólo se utiliza en algunas industrias para hacer cosas muy específicas, como la cotización de acciones, con datos muy estructurados que viajan muy rápido y permiten reaccionar a los cambios. IBM tiene una tecnología llamada Streams (que utiliza en la solución Infosphere Streams), creada en conjunto con el gobierno de los Estados Unidos luego del desastre del 9-11. Streams es un motor de propósito general para analizar datos en movimiento en tiempo real. Pero todavía hay muy pocas soluciones disponibles en IT que hoy puedan tratar con los datos en movimiento efectivamente.
Compartí tus comentarios