Sobre big data, bibliotecarios y documentalistas

julio 10th, 2014 by genisroca

ItemNo hace mucho Albert Díaz Mota y Mireia Siles Planas me entrevistaron para el número 57 de la revista Item del Col.legi Oficial de Bibliotecaris i Documentalistes de Catalunya, para hablar sobre big data. Este es el resultado de aquella agradable conversación:

 

¿Cómo podemos definir big data? ¿Hasta qué punto estamos hablando de un fenómeno nuevo?

El lenguaje esconde trampas. Cuando dices big data hay la idea de «vaya, ahora eso de gestionar se tendrá que hacer con datos», pero si tu ahora vas a Caprabo, por ejemplo, y les dices: «Lo que deberías hacer es coleccionar datasets porque ya no es posible gestionar sin datos, etc.»,yo creo que en una de estas te va a bajar un tortazo.

Hay un amplio sector empresarial que lleva muchos años gestionando con datos, y la sola insinuación de que no lo hacen o no lo hacen bien es para levantarse y largarse. Piensa que empresas como Damm, Gas Natural o “la Caixa” tienen perfiles demográficos de cada uno de nosotros, nos tienen identificados y clasificados. Si vas a una empresa de telefonía te ofrece tarifas que vienen dadas por un análisis previo cuantitativo de perfiles poblacionales. Hay una volumetría de datos espectactular. Creo que hay toda una cultura empresarial que está gestionando con datos desde hace más de 80 años y ahora llegan cuatro y quieren dar lecciones a gente que no ha tomado nunca una decisión sin un dato al lado.

En definitiva, creo que cuando hablamos de big data se aprecia mucha arrogancia. El profeta digital utiliza a menudo un tono más propio de quien da una lección a los otros sobre como deben hacerlo o dejar de hacerlo, y dan un poco de rabia. Poner en duda que haya sistemas generales de decisión por datos me resulta excesivo. Y me ha parecido ver, alguna vez, que quien hablaba de big data reñía a los otros por no utilizar los datos. Esto me molesta mucho.

 

¿Por tanto el big data no existe, o como mínimo no existe como concepto nuevo?

Estamos de acuerdo en que lo digital genera un flujo de datos nuevo. Las cosas que hacíamos analógicamente las hacíamos y punto, pero ahora al hacerlas generamos un flujo de datos distinto. Por ejemplo, el mero hecho de tener un teléfono móvil en el bolsillo genera, por triangulación de datos con las antenas de telefonía, una serie de datos de itinerancia de la población que antes, para saberlas, requería poner un becario en una esquina de la calle a contar personas. La pregunta que creo se debe hacer es: «El nuevo flujo de datos, ¿lo has incorporado a tu toma de decisiones?». Pero el nuevo, porque de datos tenemos muchos.

 

¿Y se están incorporando estos nuevos datos a la toma de decisiones?

No. No, porque en la mayoría de empresas que conozco no existe la unidad de procesamiento de datos, y el dato digital pide proceso. El mercado tradicional de datos hace estudios de mercado, oportunidad de un producto, percepción de la marca, intención de voto… Hay una industria relacionada, en la cual el empresario contrata una empresa especializada para que haga una explotación de datos, a través de una anállisis cuantitativo, y retorne un resultado. En cambio, este flujo de datos digital aún no tiene la infraestructura de operadores que preste el servicio. La mayoría de empresas tiene el dato, porque todo el mundo que compra en Caprabo, por ejemplo, pasa la tarejta cliente, pero no hay un operador que cocine este dato.

 

¿Quién debería hacerlo?

Aquí veo muchas oportunidades. Lo que pasa es que los empresarios no lo ven claro porque hay mucha incertidumbre legal. Piensan que les puede acarrear problemas. Y yo mismo también tengo muchas dudas sobre lo que es legal y lo que no. Por ejemplo, sé que es ilegal tener una base de datos que registre opciones personales no declaradas. Si apunto el nombre de una persona, no pasa nada. Pero si pongo: «Yo diría que tiene aspecto de homosexual», me acabo de meter en problemas. Y me parece bien. No está claro si se pueden capturar este tipo de datos; es un territorio peligroso.

Por otra parte, quizás la empresa tiene la certeza de que esto tiene valor pero no sabe exactamente cuál. Y si ha de venir un tercero a analizar la base de datos… quizás no es legal o quizás sencillamente no queremos que lo haga… Quizás le estamos dando demasiada información, y además, qué precio le debemos pagar? O es él quien nos debería pagar por propocionarle estos datos? Y para acabar de complicarlo, los datasets son realmente interesantes cuando los cruzas con otros. Y esto aumenta aún más el estrés legal.

 

¿Existen aquí empresas dedicadas a hacer análisis de datos?

Y tanto. Existen, y muchas. Accenture tiene una unidad de negocio en Barcelona, en Sant Cugat, que nadie sabe que es de referencia mundial. Cuando murió Michael Jackson, alguien de la discográfica llamó a Accenture para que calculase cuántos ejemplares de CD debía imprimir, mercado por mercado, país por país, en base a datos sociodemográficos, perfiles de consumo, etc. Y la empresa lo hizo. Por tanto están muy cerca.

 

Y trabajan más fuera que aquí…

Bien, trabajan para empresas que tienen muy claro qué quieren, cómo se hace… Diríamos que hay un territorio muy profesional y otro más amateur. Pongamos por caso una empresa como Mango, en Catalunya. ¿Gestiona con datos? Seguro. ¿Ha incorporado el flujo digital en su sistema de datos? No estoy tan seguro.

¿Qué hace que una empresa lo incorpore? La oportunidad. ¿Qué quiere decir la oportunidad? La contribución a resultados. Pongamos el anterior ejemplo de Accenture. La discográfica quería vender el máximo número posible de discos, pero no quería ni estampar más de la cuenta ni quedarse corto. El negocio era suficientemente grande como para encargar un esfuerzo adicional de proceso porque estamos hablando de mucho dinero.

 

Pero sólo habamos de empresas o de conseguir un beneficio económico. ¿Nos puedes dar otros ejemplos?

Ahí donde la empresa privada dice big data, la administración pública dice open data. Si trabajas en la administración pones el acento en el open, y si trabajas en la industria el acento lo pones en el big.

Esto demuestra a qué se dedica cada uno. Quien se orienta a la palabra open lo que le preocupa son los usos, mientras que quien se orienta a la palabra big lo qu le preocupa es la envergadura, el proceso. Son dos miradas muy distintas.

El modelo open me parece un poco naïf, a veces. Yo lo deseo, lo defiendo, creo en él, pero no sé como lo pagaremos. Mira por ejemplo las smart cities o ciudades inteligentes. Smart city es un concepto que se basa en la sensorización de la ciudad para crear una nueva capa de servicios. Tendrán un montón de semáforos en Barcelona, o tapas de alcantarillado, o árboles, que te dirán cosas como por ejemplo el volúmen de tráfico que hay en la Diagonal. Creo que este proyecto es consecuencia directa del parón en la contratación de obra pública por parte de la administración. Tenemos un tejido de veinte grandes empresas de ingeniería que tenían 20.000 empleados y ahora, cuando se acabe la línea 9 del metro o el AVE a Figueres ya no tendrán trabajo.

Todos estos operadores de ingeniería tienen tres opciones: echar a todo el mundo, ir a hacer edifcios a Dubai, o inventarse otro eje de actividad. Las dos primeras opciones ya las están haciendo y las smart cities representarían la tercera opción. Es una Internet que vuelve a la ingeniería, no es una internet social. Sólo hay que ver qué empresas están tras todo ello. La informática industrial y la ingeniería se alían para crear las smart cities, una capa de servicios para el ciudadano.

La idea es interesantísima, pero ¿quién lo va a pagar?. ¿Las ciudades?. Me parece que las smart cities son las nuevas concesionarias de las autopistas.

 

¿Y esto no será open data?

No. 50.000 semáforos generando datos cada dos segundos es big data, pero no será open.

 

Entre el big data y el open data, podríamos situar el data compartido. Este nivel de confianza, que permite compartir datos, ¿ha llegado a suceder?

Creo que la alternativa a la confianza es el mercado. Vodafone sabe cuántos franceses hay en España mediante el roaming y el BBVA sabe cuántos pagos con tarjeta han hecho los franceses hoy en Barcelona, y puede saber la media de su consumo en restauración. Hay diversos clientes para estos datos pero, ¿Vodafone dejará libres estos datos para que otro los pueda utilizar? Yo creo que no. Más bien se crearán datahubs, empresas que comprarán datasets a otras empresas y ofrecerán servicios con ellos. Yo no necesito que Vodafone y BBVA tengan confianza entre ellos. Sólo necesito que creen su dataset legal y lo vendan. Si yo se lo compro, y le añado el de Saba, TMB, etc., tendré el servicio de referencia de información turística de Barcelona. Y como clientes puedo tener centros comerciales, cadenas hoteleras, gremios, Turisme de Barcelona…

 

¿Existe esta industria intermediaria?

Creo que no.

 

Los bibliotecarios-documentalistas, ¿tenemos algo que ver con el big data?

Creo que este es un negocio de letras, no de ciencias. Me interesan las preguntas, no las respuestas. Quien tiene mérito es quien hace la pregunta, no quien procesa los datos para obtener la respuesta. A un abogado lo entrenan para anticiparse a los problemas: ¿y si os separáis?, ¿y si se te quema la casa?. A los médicos los entrenan para detectar síntomas, a los físicos en cambio los entrenan para hacer bien la pregunta. A mi los informáticos que siempre me han gustado son los físicos.

¿Qué le reclamaría al documentalista? ¿De qué es sospechoso? De preocuparse sólo por el objeto que quiere preservar. De dejar que las preguntas las hagan los otros. Tu vendrás a hacerme la consulta y yo te daré lo que necesitas. Pero claro, en un mundo en el que hay gente que explota los datos y gente que hace las preguntas, tener quien te guarde los datos ordenadamente, cuando hay tantos y sabes que no se pueden ordenar, no sé si tiene mucho sentido. Si yo tuviese que mutar, preferiría mutar en alguien que hace las preguntas, porque el otro lado es entrar en un territorio de conocimientos técnicos.

El discurso que nos venden con el big data es que ahora se generarán muchos datos. De acuerdo, pero yo aún no he dicho qué datos necesito. Cuando haga la pregunta, decidiré qué datos recojo. Y hacer preguntas quiere decir entender qué le preocupa al director de un hotel, al director de marketing de una compañía aérea, a un ciudadano que quiere llegar rápido al Parc Güell…

 

¿Cómo deberíamos hacer este cambio? ¿Qué le pedirías a un documentalista para contratarlo?

Sinceramente, no lo sé. Lo que me interesa es una persona resolutiva; tengo un problema y me lo resuelves. Un documentalista busca información y selecciona. Aplicado a datos sería: cómo ayudamos al director de un hotel a decidir en qué idiomas debe tener su web. Deberás buscar las fuentes de información más adecuadas. Si llevas las cinco fuentes correctas serás una persona valiosa.

 

Hasta ahora el documentalista se ha asociado más al mundo académico, universitario, cultural, público… ¿habría que dar el salto al mundo privado?

Eso no lo sé. Yo sólo digo que alrededor del data existirá una industria auxiliar y que será privada. Yo les llamo datahubs, que aglutinarán un conjunto de datos que podrán ser útiles para responder a determinadas preguntas. Creo que serán negocios especializados y locales: un datahub, por ejemplo, de Barcelona. Los datahubs podrían ser las bibliotecas del futuro.

 


2 Responses to “Sobre big data, bibliotecarios y documentalistas”

Feed for this Entry Trackback Address
  1. 1

    Sergio

    Buen artículo, casi da para un libro :-)

  1. 1

    website

    website

    Sobre big data, bibliotecarios y documentalistas at genís roca

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *