El Big Data es el universo de datos donde está cuantificada toda la actividad social del mundo. La interpretación de ese archivo mueve los hilos de la cultura de masas, la salud, el transporte y el poder.
por Agustín Marangoni
Alguien compra medio kilo de queso en un supermercado. Paga con tarjeta de crédito y vuelve a su casa caminando. De esa simple actividad quedan registrados los siguientes datos: el supermercado donde fue comprado el queso, la marca, la hora, cuánto gastó, el trayecto que hizo de vuelta a su casa, toda su actividad en las redes sociales durante la compra y si le sacó una foto a la tarta que hizo hasta se puede saber con qué lo combinó, con quién compartió el producto y qué le pareció. En 1992 la humanidad generaba unos 100 gigabytes por día. En 2016 se generan 50.000 gigabytes por segundo. Un smartphone de línea media, de esos que se venden en cuotas en cualquier local de electrodomésticos, tiene mayor capacidad de análisis de datos que la Nasa en 1969, año en que el hombre supuestamente llegó a la luna.
Este universo casi infinito de cifras se denomina Big data y está almacenado en servidores interconectados a lo largo del mundo. El término alude sin escalas al Big brother [Gran hermano] de George Orwell, entidad que en la ficción seguía cada movimiento de la sociedad con el objetivo de controlarla. En estos tiempos hiperconectados, la realidad superó por mucho a la literatura.
Las grandes corporaciones definen los precios en base al análisis de las compras online, absorben datos de los principales sitios web y se hace un seguimiento. Esta técnica se denomina scraping. De ahí se puede saber qué marca vende más, a qué precio y cuál es la recepción del cliente. Los porcentajes de inflación o deflación de un producto dependen en buena parte de este seguimiento. En el siglo veintiuno ya no es sólo cuestión de monitorear las variaciones de la oferta y la demanda. También se agrega el factor de cuánto está dispuesto a pagar el cliente. Netflix fue al hueso en este sentido y lanzó una encuesta basada en los comentarios sobre su empresa que circulan por la web, la mayoría positivos. Entonces le preguntó a sus usuarios si están de acuerdo con pagar más de lo que están pagando por el servicio y cuánto pagarían. El resultado arrojó que los usuarios de Netflix pagarían hasta un 30% más. De ahí el último aumento, que se concretó a principios del año pasado.
Las empresas que apuestan fuerte al desarrollo propio de contenidos audiovisuales, Netflix entre otras, también analizan exhaustivamente la aceptación de sus productos. El Big data es la base de operaciones para decidir qué serie continuará en producción y cómo. Fundamentalmente cómo. Los datos marcan las cifras de audiencia, la repercusión y la coordenadas sobre lo que más y menos gusta. El objetivo es obvio: generar un éxito. La interpretación de datos es el inicio de un proceso de modificaciones que puede impactar en el eje de una historia, eliminar un personaje o continuar la estructura narrativa por caminos que no estaban planificados en el comienzo. Lo mismo sucede en la industria cinematográfica. A partir de datos se decide qué artistas contratar y cuáles son los temas que tienen que trabajar los guionistas. Por ejemplo, para editar la publicidad de la película El renacido (2015), ganadora de tres premios Oscar, el director Alejandro González Iñárritu realizó una función de preestreno donde cada uno de los espectadores tenía una pulsera electrónica que medía el pulso cardíaco, el movimiento corporal, la temperatura de la piel y la sudoración. De este modo se identificaron los momentos más intensos de la obra, que fueron utilizados en el spot publicitario. La experiencia continúa y se expande. Ya hay empresas que están generando y analizando archivos de datos corporales para definir la edición final de una película.
Del total de datos que existen en el mundo digital, sólo se analiza el 5%. O sea: el 95% todavía se encuentra en estado salvaje [Wild data]. Es cuestión de encontrar entre tanta cifra una correlación que permita rentabilidad. El obstáculo es desarrollar la tecnología capaz de concretar ese análisis. Una cosa es archivar datos, otra muy distinta y más compleja es interpretarlos y lograr resultados funcionales a un sector productivo. Las principales consultoras internacionales aseguran que el mercado relacionado al software y al hardware que se utiliza para trabajar con grandes volúmenes de información llegará, en tres años, a los 50.000 millones de dólares en inversiones. Costo y beneficio: las estimaciones indican que ingresar en esta línea de análisis de datos masivos puede acelerar hasta en un 35% el crecimiento de una empresa.
Los bancos son otros de los interesados en el Big data. Al tener acceso directo a los movimientos de consumo –qué y cómo– ahora todos los esfuerzos están apuntados a analizar a sus clientes como casos particulares y cruzar datos. De esa manera diseñan ofertas de préstamos acordes a cada situación, basándose en gustos personales. Generarle deuda al cliente es la mejor manera de mantenerlo activo, además del beneficio de cobrar intereses. El negocio se amplía con el asesoramiento a marcas, empresas de seguros y obras sociales. El caso más emblemático para el sector de salud fue la pandemia de gripe A, en 2009. La cantidad de búsquedas en Google sobre los síntomas de la gripe disparó la alerta. La OMS confirmó el brote. Los Estados comenzaron una campaña para prevenirla. El efecto inmediato fue el desarrollo de una vacuna –donde intervinieron capitales suizos y norteamericanos– y antivíricos para su tratamiento. El caso es sorprendente, pero es parte de un pasado lejano. Desde 2009 hasta hoy el tamaño del Big data creció más del 100%.
Para el transporte, el análisis de datos es una asignatura vital. Las herramientas de geolocalización y el uso de boletos únicos electrónicos permiten analizar en tiempo real el comportamiento de los pasajeros. Desde el uso de rutas y autopistas hasta la identificación de las paradas de colectivo más y menos utilizadas. En los centros universitarios de Japón primero se siembra césped alrededor de todos los accesos. Las personas caminan y lo gastan. Sobre las huellas se construyen las veredas. De este modo se copia sin margen de error el movimiento orgánico de los transeúntes, que suele ser el más directo y cómodo. En el sector de transporte se intenta lograr el mismo efecto: trazados más efectivos y optimizar los que ya existen.
En el Big data está todo, pero no es todo. Esa masa de datos no arroja ningún resultado en sí misma, requiere de una interpretación social que, si bien tiene mucho anclaje en las ciencias exactas, depende de la reflexión humana para adaptarse y sobrevivir a los cambios. En este borde –muy delicado– entran en juego variables imposibles de medir y hasta cuestiones propias del campo de la biología. De lo contrario, las sociedades se podrían controlar, incluso predecir, con una serie algoritmos. Ficción por ahora. La pregunta es hasta cuándo. Y una certeza: la industria tecnológica actualiza a cada rato el mercado para optimizar el desarrollo de datos. El negocio no es sólo la venta de dispositivos, es el monitoreo de nuestra vida cotidiana. Vivir –intentar vivir– actualizado con las novedades es parecido a pagar por trabajar horas extra. Placeres impuestos por quienes construyen poder.