Hal Varian es un hombre poliédrico. Ha sido un buen economista académico, con importantes contribuciones a la economía industrial y a la economía pública, y con un artículo pionero en economía digital sobre position auctions, que son el tipo de subastas de anuncios que hacen ganar a Facebook y Google gran parte de sus beneficios. Su papel como economista jefe en esta última compañía es controvertido. Su trabajo consiste, en gran parte, en defender a su empresa en numerosos casos de conducta anticompetitiva y de abuso de posición de dominio. En algunos de ellos puede existir la duda razonable (respecto de Android, se puede opinar que se está penalizando a Google por tener un sistema operativo abierto frente al de su competidor, Apple, que esta verticalmente integrado), pero en otros Google ha sido pillado con el arma del crimen en la mano, y el trabajo de Varian es negar el sol a plena luz del día. En el caso de Google Search, por muy fan que uno sea del buscador –y yo mismo lo soy– es difícil negar que manipuló su algoritmo, cuando la evidencia muestra que el tráfico de algunas empresas cambió radicalmente de un día para otro. Y es que aunque Google tenga el alma blanca, también tiene el 90% de cuota del mercado de buscadores en Europa, lo que genera demasiadas tentaciones. Pero por encima de todo Varian es un excelente comunicador y divulgador. Sus manuales de Microeconomía fueron para mi (y para muchos otros economistas) el mejor lazarillo para adentrarse en este mundo. Por eso, le invitamos a la Universidad Pompeu Fabra a dar la lección inaugural del curso hace algunos años. Los estudiantes lo trataron como una estrella y su conferencia estuvo a la altura de la metáfora.
Varian explicó comó hacer predicciones y análisis con datos anonimizados y agregados de las búsquedas de Google utilizando una maravillosa herramienta de la que ya se ha hablado en este blog con anterioridad: Google Trends. Les preguntó a los estudiantes cuál era el día en que salían más de fiesta; se produjo un murmullo, los estudiantes no se ponían de acuerdo. Varian escribió en la bola mágica del buscador la palabra resaca y resolvió el misterio. Dado que la búsqueda de ese término, resaca, era más frecuente los viernes, se concluyó que los jueves era el día preferido por lo estudiantes para arrasar Barcelona. Luego, explicó otros usos más relevantes de la herramienta, como puedan ser la anticipación de los datos de desempleo (analizando las búsquedas de los formularios de los subsidios), el análisis de la producción de automóviles o el seguimiento de la evolución de la epidemia de la gripe común.
Les propongo un experimento sencillo, como los que hace mi hija de 9 años (bicarbonato con vinagre: baño de espuma asegurado): hagamos epidemiologia casera con Google. Carguen la página de Google Trends, tecleen pérdida de olfato en el campo de búsqueda y limiten la misma a España. La anosmia es un síntoma de la covid-19 que presenta entre entre 30 y un 60% de los afectados. Les aparecerá el siguiente gráfico.
Gráfico 1
Fuente: Google Trends.
¡Han visto aparecer la pandemia de la nada! Si son optimistas empedernidos como yo, incluso leerán en esta evidencia de juguete que el pico pasó en la segunda mitad de marzo. Si por el contrario, nacieron descreídos, miren en el gráfico 2 la correlación entre las búsquedas de este síntoma en estos últimos treinta días y el nivel de contagio por coronavirus en las diferentes comunidades autónomas.
Gráfico 2
Fuentes: Ministerio de Sanidad y Google Trends.
Nota: Casos confirmados: incidencia acumulada de COVID-19 (casos acumulados por 100.000 habitantes notificados en los últimos 14 días), a 23 de abril de 2020. Interés en la búsqueda: interés por subregión, expresado en un índice de 0 a 100, durante los últimos 30 días.
Un artículo reciente del New York Times encontraba la misma correlación con datos de Estados Unidos, y mostraba que las búsquedas de la falta de olfato comenzaron en Italia antes de que el síntoma fuera asociado por los médicos a la enfermedad. Además, el artículo analizaba la posibilidad de usar la búsqueda de síntomas en el buscador de Google como un sistema para identificar nuevos brotes de la Covid-19, especialmente en países donde no hay medios para hacer test masivos. A pesar de las imágenes que hemos visto de Guayaquil, las cifras oficiales sobre la incidencia de la enfermedad en Ecuador son relativamente bajas con respecto a Europa o a Estados Unidos. Sin embargo, Ecuador lidera a nivel global la búsqueda pérdida de olfato, siendo 10 veces más frecuente en ese país que en España, aunque las cifras de afectados sean allí 10 veces más bajas.
El uso de Google Trends para el seguimiento de enfermedades comenzó con la gripe común. Un grupo de investigadores públicó en 2009 un artículo en Nature que mostraba el éxito de un modelo de predicción de la difusión geográfica de la epidemia de gripe utilizando esta herramienta. Sin embargo, Google Trends tiene limitaciones: ese mismo año falló con la epidemia de gripe A H1N1. El miedo a la pandemia la hizo muy presente en los medios de comunicación, de modo que se realizaban búsquedas sobre la enfermedad mucho antes de que esta hubiera llegado a cada país. Por eso hay que fijarse en síntomas menos conocidos de la enfermedad e identificar la pregunta que haría quien tiene el síntoma, no quien solo tiene curiosidad. De hecho, nuestros propios datos pueden estar contaminados por noticias que aparecieron en los periódicos relacionando la falta de olfato con la Covid-19. El NYT analiza también otros síntomas asociados a la Covid-19 y aboga por prestar atención al dolor de ojos, padecido por un número significativo de afectados y que ha pasado relativamente desapercibido. Centrándonos en España, la búsqueda de ese síntoma creció desde mediados de febrero, lo que va en línea con informaciones recientes que apuntan a que el virus ya estaba entre nosotros antes de marzo.
Les recomiendo seguir al autor de este interesante artículo del NYT, Seth Stephens-Davidowitz. Doctorado en en Economía Harvard y con una licenciatura en Filosofía, este investigador lleva una década utilizando los datos las búsquedas de Google para analizar y medir el racismo, la depresión, el abuso infantil o las preferencias sexuales, entre muchos otros temas. Parte de los resultados de sus investigaciones los volcó en una obra que se convirtió rápidamente en un best-seller y que es nuestra humilde recomendación por el día del libro, “Todo el mundo miente: Lo que Internet y el Big Data pueden decirnos sobre nosotros”.
La premisa del esta obra es que el buscador de Google es el nuevo suero de la verdad y que los datos que se pueden extraer de nuestras búsquedas son más fiables que las tradicionales encuestas, incluso más que algunas fuentes de big data basadas en redes sociales como Facebook. La razón es que estas fuentes están contaminadas por el instinto natural de querer causar buena impresión, mientras que ante el buscador nos desnudamos de verdad. Con datos americanos, se comprueba que muchas personas mienten cuando declaran su intención de ir a votar en las encuestas, mientras que con las búsquedas para localizar los colegios electorales se puede predecir muy bien la participación electoral. En las encuestas, muchos americanos afirman seguir medios de comunicación rigurosos y desdeñan los sensacionalistas. Pero los datos reales dicen lo contrario. Aunque nadie se declara racista en las encuestas, las búsquedas en Internet de palabras despectivas como nigger para hacer bromas son numerosas. “Sorprendentemente”, el análisis de su distribución geográfica es el mejor predictor del apoyo electoral a Trump.
Yo no termino de compartir del todo el entusiasmo de Stephens-Davidowitz con Google Trends. Soy consciente de sus limitaciones y no debe ser fácil hacer buena ciencia con sus datos. Pero al mismo tiempo, este regalo de Google es una herramienta gratuita que muestra lo que podemos aprender con datos anonimizados y agregados. Así que les animo a que le pregunten al oráculo por el impacto de su equipo de futbol favorito, o la película que llamo más su atención. Jueguen, experimenten…