28 ago. 2017

Analizando el hilo de Manuel Bartual


Si has seguido Twitter estos días, seguro que habrás visto la que se ha liado con el hilo de Manuel Bartual. Si no lo has visto, te recomiendo que le eches un ojo a partir de este primer tweet. Si bien la historia no es nada especial, la forma de hacerlo sí que ha sido "revolucionaria". Manuel nos ha narrado en primera persona y "en directo" sus "vacaciones", teniendo enganchados a al menos 400.000 seguidores (que se dice pronto), todos ellos pendientes de saber qué iba a pasar a continuación.



Sin meterme en la parte literaria, me ha apetecido echarle un ojo a los tweets y ver si detectaba algo interesante. El análisis que os traigo no es exhaustivo y puede tener algún error, ya que lo he hecho en un par de ratos tontos que me aburría. Tampoco busco probar ningua hipótesis, es un mero análisis exploratorio. 

Estáis advertidos.


- El primer paso: Obtener los mensajes.

Manuel ha estado publicando desde el día 21 hasta el día 27 de Agosto. Obviamente esto implica que recuperar los mensajes a mano es inviable.

La primera idea que me vino a la cabeza fue cargar la página completa del autor en Twitter  y mirar si el HTML era "parseable" (se podían extraer los mensajes) de forma fácil. No obstante, el código es demasiado enredado, mucho JavaScript y demás para poder tener los datos limpios.

Como digo, me parecía demasiado enrevesado extraer los mensajes del código, así que me puse a buscar alguna librería por ahí que te permitiera pedir los mensajes a la API de Twitter. Tuve suerte y relativamente rápido encontré esta librería que precisamente te permite conectar con Twitter desde Python. Tuve que hacer un par de cambios al ejemplo que venía en su web, ya que Twitter te limita a obtener los mensajes de 200 en 200, pero nada complicado. Dejo aquí el código fuente por si alguien lo quiere reutilizar.

Último mensaje (en bruto) de Manuel, con el texto "¿Hola?"


Ya tenía los mensajes. Decidí obtenerlos la mañana del 27 a las 13.06h hora de Madrid. Es decir, que me guardé sólo desde el primero al que termina en "¿hola?", pues considero que es el fin del relato. Si en estos días hay más tuits relevantes, puede que repita el análisis, pero de momento me vale hasta ahí. Menciono la hora a la que he obtenidos los mensajes, ya que al ser datos dinámicos, los "Me gusta"/"Favoritos" o "Retweets" son los que he obtenido a dicha hora, probablemente ahora sean más.

En total extraje 374 mensajes.

- El segundo paso: Mirar los metadatos.


Twitter nos ofrece bastante información más allá del texto. Entre otras cosas, nos dice la fecha exacta de publicación de los mensajes, el número de favoritos que tienen, los RTs que se han hecho hasta ese momento, el idioma, etcétera. Antes de mirar los textos en sí, podemos hacer un repaso de estos metadatos, además como tenemos la fecha de cada mensaje, podemos estudiar series temporales.

Lo primero que podemos mirar es cuándo se publicaron mensajes:


En esta primera gráfica vemos cómo empiezan los tweets el día 21 a última hora y cómo la mayoría se concentran a última hora del 25 y a lo largo del día 26.

Si los agrupamos por días vemos que, efectivamente, la gran mayoría se concentran en el día 26 con alrededor de un tercio de mensajes del total:


Es curioso porque estos datos van bastante correlacionados con el número de RTs y Favoritos por cada mensaje, es decir, que parece que a medida que su hilo gana fama, Manuel publica más; o bien publica más y por ello gana fama (o no, porque correlación no implica causalidad, como ya nos decía XKCD).


El dato atípico de la izquierda con un número de Favoritos y RT tan alto se corresponde con el primer tweet del hilo, que es el que está destacado en su perfil y que probablemente sea el que más gente se ha leído, compartido, gustado y guardado. 

Es curioso ver como los Favoritos superan siempre a los RTs, lo que implica que en este caso se prima el "gustar" y "guardar", frente al "compartir".

Parece también haber algunos tweets concretos que destacan sobre el resto de la tendencia y que además coinciden con ser el último o el primero del día, como si la gente dijera "hoy has hecho un buen trabajo" o "me alegro de que vuelvas".

Se puede ver también como a lo largo de los días la popularidad va subiendo, siendo los mensajes del día 26 los más populares en ambas categorías.


- El tercer paso: mirar el contenido de los mensajes


Una vez analizados los metadatos, podemos empezar a mirar por encima los datos en sí. 

Para empezar podemos comparar la longitud de los mensajes, tanto en caracteres como en palabras:


Estos datos son bastante uniformes, pero se ve una ligera tendencia hacia el 26 y 27 donde los tweets empiezan a tener menos caracteres y sin embargo un número parecido de palabras (o algo inferior al resto de días).

Esto podría deberse al ritmo que se marca en esos tweets, ya que Manuel está intentando crear tensión: los mensajes o contienen menos información, o son muchos y de frases cortas para darle más velocidad y emoción al texto, lo que se reflejaría en su popularidad.

Esto obviamente lo deduzco no sólo de la gráfica superior (en la que no se aprecia tanto) si no conociendo el contenido de los textos. Vamos, que quiero ver la correlación más que realmente verla en estos datos. Pero para el análisis, de momento encaja como hipótesis.

Por un lado hemos visto el número de caracteres y por otro el número de favoritos, ¿qué pasaría si sacamos el número de favoritos con respecto a la longitud del mensaje? Pues que obtenemos esta gráfica:

Ahora se ve más clara esa hipótesis que antes planteábamos: los últimos tweets del hilo acumulan una gran popularidad con respecto a la longitud de estos. Sobre todo el último, que con sólo una palabra acumula más de 40K favoritos.

Por otra parte, podemos analizar las palabras más utilizadas. Para ello he utilizado la herramienta NLKT que permite realizar procesamiento del lenguaje natural (en este caso el español) desde Python.

Los 374 mensajes están formados por 6.024 palabras, y si quitamos las repeticiones obtenemos 1.260. Quitando las palabras "irrelevantes" (stopwords en inglés), que corresponderían a conjunciones, pronombres, preposiciones..., nos quedan 1121 palabras. Si comprobamos cual es su frecuencia obtenemos el siguiente ranking:


Parece que la "habitación" y el "hotel" eran clave :)

Aunque todos sabemos que el protagonista fue el "bollo", aunque sólo aparezca dos veces, una en singular y otra en plural.

Por otra parte, podemos mostrar esta misma información, pero de forma más resultona, con una nube de palabras. En estos gráficos el tamaño de la palabra es directamente proporcional al número de apariciones: cuantas más veces aparezca una palabra en el texto, más grande es la palabra en la imagen. Para este caso he usado esta otra librería:



- En definitiva:

Manuel ha hecho un gran trabajo, ha sabido llamar la atención aprovechando un medio que muchos consideran muerto, pero a pesar de todo ha conseguido destacar y mantenernos atentos a sus mensajes.

Espero que os haya parecido curioso el análisis, si alguien quiere algún detalle más o quiere los datos en bruto, podéis dejarme un comentario o contactarme por Twitter.

¿Y qué saco yo de todo esto? Pues:

- He aprendido a obtener los mensajes de alguien en Twitter.
- He repasado algún detalle para presentar las gráficas.
- He tocado un mínimo de NLKT para procesar los textos.
- Y he aprendido a dibujar nubes de palabras chulas.

Y todo en un día. No está mal, como dice Manuel: 








11 jul. 2017

Probando los álbumes de Saal Digital


Desde @saaldigital_es me invitaron a probar sus álbumes digitales si después les hacía una pequeña review, así que decidí hacerme uno de mis fotos por Europa. 

En general el resultado es bueno, cogí la opción de 32 páginas, portada sin acolchar, y aunque cogí el papel más simple y mate, la calidad es muy buena. Las fotos a hoja completa son una pasada (y la portada, a mi parecer, queda estupenda). Editar el álbum es bastante sencillo con su aplicación, te pones todo a tu gusto (yo lo hice de forma libre, sin plantillas). El único "pero" es que algunas fotos han quedado algo más oscuras que en el monitor, pero nada grave. 

Por lo demás todo perfecto, envío rápido (poco más de una semana desde el encargo) y sin problemas. Y ya tengo un recuerdo de mis viajecitos :)

Podéis conseguir el vuestro en: Saal Digital

Una publicación compartida de Javier Liébana Barrera (@kuu_6) el

30 ene. 2017

Necesitamos estímulos desesperadamente



Seguramente que con la poca duración de las baterías de los dispositivos que utilizamos hoy en día, en algún momento te hayas quedado sin poder usar tu móvil, tu kindle y, estando solo y sin nada que hacer, no te ha quedado otra opción que aburrirte.

Si te ha pasado en el tren o el metro, seguramente hayas aprovechado para mirar por la ventana, mirar a la gente de tu vagón, observar qué ropa llevan, montarte tus películas sobre sus vidas... En definitiva, tu cerebro se ha puesto a trabajar para buscar estímulos con los que poder seguir trabajando.

Y es que parece que nuestro cerebro necesita estímulos. Constantemente. Y según algunos estudios, más de lo que podríamos creer.

En un estudio publicado en la revista Science, tras el análisis de 11 experimentos, los investigadores descubrieron que la gente no disfrutaba cuando les obligaban a estar entre 6 y 15 minutos sin nada que hacer, y que en general, era más satisfactorio hacer alguna tarea, aunque fueran mundana a aburrirse. No obstante, y aquí viene la parte sorprendente, algunas personas preferían incluso recibir una descarga eléctrica a estar aburridos.

Una recreación de este último experimento, el de recibir descargas eléctricas, se realiza en el vídeo que os traigo hoy.

El experimento es sencillo: hay varias personas a las que se les enseñan una serie de objetos, siendo uno de ellos un pulsador, el cual dará una descarga eléctrica a aquel que lo pulse. En el vídeo se puede ver cómo el sujeto del experimento recibe una descarga eléctrica al pulsarlo por lo primera vez, por lo que sabe que le ocurrirá si lo presiona en el futuro. Además, antes de realizar el experimento se le pregunta si volvería a pulsar el botón, a lo que el participante responde claramente que no, porque no quiere recibir una descarga de nuevo.

El siguiente paso del experimento es llevar al individuo a otra sala. En esta sala no hay prácticamente nada: una silla y una mesa con el mismo pulsador que antes. Al individuo se le dice que espere sin hacer nada y que cuando termine el experimento, será avisado. 

Lo sorprendente no es que el sujeto pulse el botón, a pesar de que dijo que no lo volvería a pulsar, si no que lo hace al menos dos veces durante el experimento. La primera vez se podría atribuir a una mera curiosidad: ¿Seguirá dando calambre? ¿Será el mismo pulsador? Sin embargo, la segunda vez ya sabe que le va a doler y va a recibir una descarga, pero su cerebro prefiere recibir ese estímulo a seguir sin recibir nada.

Parece que nuestro cerebro necesita estímulos, aunque sean dolorosos.

La última parte de este vídeo es también interesante, pues Michael, el presentador, decide pasar 72 horas en una cámara aislada: sin referencias temporales, siempre con la misma iluminación, y con comida y bebida suficiente como para no tener contacto humano. Los resultados son muy interesantes: a pesar de pasar la primera parte buscando entretenimiento a base de contar los pasos dados en la habitación o haciendo ejercicio, de alguna manera su cerebro termina por no saber diferenciar entre sueños y realidad, dificultandole en gran medida mantener la cordura.

Os recomiendo mucho que lo veáis. El primer experimento empieza en el minuto 2:20 y el último en el minuto 14.




Espero que te haya gustado la entrada.

En otro orden de cosas, he creado una newsletter para que puedas recibir directamente en tu correo un aviso de las nuevas entradas. No enviaré spam y te puedes dar de baja cuando quieras.
Si te quieres apuntar, aquí puedes hacerlo:




23 ene. 2017

La subasta del dólar



Si juegas, pierdes. Así es este juego.

Las reglas son muy sencillas. Se va a a subastar un dólar, bajo dos condiciones:

1.- La persona que haga la puja de valor más elevado se lleva el dólar, pagando dicho precio.
2.- La persona que haga la segunda mayor puja, paga también su puja pero no se lleva nada.

¿Dónde está el problema? Esta claro que la segunda regla tiene truco, pero para entenderlo vamos a plantear una partida imaginaria:

Suponemos que hay al menos dos jugadores más el subastador. La subasta comienza de forma totalmente libre, cualquier jugador puede ofrecer la cantidad que quiera y el dólar le será entregado. Por ejemplo, el jugador 1 podría ofrecer 1 céntimo, por lo que se llevaría el dólar por ese precio, obteniendo una ganancia de 99 céntimos. ¡Qué fácil! ¡Claro que apuesto, dice el jugador 1, no pierdo nada! 

En ese momento, el segundo jugador verá que su contrincante se va a llevar 99 céntimos de beneficio por no hacer absolutamente nada... Sin embargo, el jugador 2 está en una posición aparentemente ventajosa: aún tiene la opción de ofrecer 2 céntimos, con lo que la ganancia será algo inferior a la que tenía el jugador 1, ¡pero así gana 98 céntimos por no hacer nada!

A partir de dicho instante, cuando el jugador 2 se ha dado cuenta de que puede ser él el beneficiado, al jugador 1 se le ha torcido la suerte: no sólo ha dejado de ganar 99 céntimos, si no que encima tiene que pagar 1 céntimo, pues es el segundo pujador y por la regla número 2, está obligado a pagar esa puja sin llevarse nada. 

La cosa se ha puesto difícil para el jugador 1, pero aún hay margen para arreglarlo: puede pujar 3 céntimos y salir victorioso con 97 céntimos de ganancia. Esto a su vez pone al jugador 2 en la posición de segundo mayor pujador, por lo que tendrá que sobrepujar al contrincante para no ser él el que pierda.

Aquí es dónde empieza la vorágine de pujas, ninguno de los dos jugadores quiere ser el perdedor, por lo que inevitablemente van a ir subiendo la puja del contrincante. Pero el juego tiene miga, porque cada vez que su contrincante sube la puja, la puja anterior cada vez es más alta, por lo que la pérdida del jugador que queda en segunda posición cada vez es mayor y la posible ganancia del primer pujador se ve reducida.

Lo mejor es que la subasta puede seguir, y probablemente siga, por encima del precio del dólar: si suponemos el caso anterior dónde la subida se hace céntimo a céntimo, llegaríamos al momento en el que un jugador ha llegado a los 99 céntimos y el otro al dólar.

El jugador que ha ofrecido la mayor puja se habría quedado sin premio, pero al menos no perdería 98 céntimos que era la otra opción. Sin embargo, el jugador que está en 99 céntimos va a querer ofrecer 1 dólar y un céntimo, ya que de esta forma pasaría a la primera posición, y aunque estaría comprando el dólar por un precio mayor al que tiene, sus pérdidas serían de tan sólo 1 céntimo frente a los 99 actuales.

De esta forma, si los jugadores sólo se centran en minimizar las pérdidas, seguirían jugando hasta que no tengan más dinero que ofrecer. Un jugador terminará pagando más de un dólar por un dólar, y el otro pagará más de un dólar por nada de nada.

Esto es lo que se llama en Teoría de juegos, de la que ya hemos hablado por aquí, un juego sin equilibrio y cuya suma no es nula: pese a que los dos jugadores tienen la información disponible desde el principio, en el momento que ambos hacen una puja, están condenados a que al menos uno de ellos pierda, y muy probablemente pierdan los dos, ya que si son puramente racionales, no se van a detener en la barrera del dólar. No hay equilibrio porque no hay un punto donde se pare la subasta y no hay suma nula porque ambos pierden.

Este juego fue diseñado por Martin Shubik, que trabajaba en la Teoría de Juegos con Nash en Princeton, y aunque parece una situación ridícula, estas situaciones se dan en el día a día en la vida real: cuando hacemos una cola para esperar algo estamos en esta situación. Cuánto más tiempo estamos esperando, más estamos invirtiendo y más tiempo llevamos invertido, por lo que menos probable será que abandonemos. 

Incluso, se usa en situaciones dónde la gente gana dinero, como por ejemplo en las películas que echan en televisión: cuánto más tiempo llevemos viéndola, más hemos invertido y menos probable es que abandonemos, así que las cadenas aprovecharán esto para aumentar la frecuencia de los anuncios. A medida que pasa el tiempo de visionado, cada vez vemos más anuncios y menos película, pero no no abandonamos porque llevamos mucho tiempo invertido. Las cadenas aprovechan esto y ganan dinero con esos anuncios.

Como decía el refrán, nadie vende duros a cuatro pesetas. 

Leí sobre esto en el libro de William Poundstone, El dilema del prisionero, y en la Wikipedia.

16 ene. 2017

Las misteriosas flechas gigantes

Si viajas por Estados Unidos y decides hacer una excursión podrías llegar a encontrarte con esto:


Se trata de unas flechas de hormigón, de hasta casi 20 metros de longitud, las cuales se encuentran por toda la geografía del país.

Algunas se encuentran hasta en el jardín de alguna vivienda:


Al ser tan grandes, las flechas son visibles desde la vista aérea de Google Maps, y esto nos da la primera pista de su origen.

 


Y a estas alturas te estarás preguntando qué narices son esas flechas y por qué están por todo el país. Pues la respuesta es bastante curiosa.

En agosto de 1920 comenzó la primera ruta área en Estados Unidos que enviaba el correo postal de costa a costa. El problema es que en aquella época los aviones no tenían radio balizas para saber su posición, ni obviamente GPS. Por lo que a los pilotos no les quedaba otra que guiarse "a ojo".

Para facilitar esa tarea, decidieron llenar el país de flechas que indicaban la ruta, colocando cada una de estas a unas 10 millas (unos 16 km) de distancia:



No obstante, las flechas sólo funcionaban de día y en buenas condiciones de visibilidad, así que la solución fue añadir unas torres con luz, que a modo de faro sirviesen de guía para todos los pilotos, independientemente de las condiciones atmosféricas.



Construir esta infraestructura llevó unos 9 años, y para 1929 ya se había conseguido tener la ruta completa, conectando San Francisco con Nueva York:

Durante los siguientes años se mejoraron las comunicaciones y se comenzaron a usar las balizas radiofónicas, por lo que estas otras balizas dejaron de ser utilizadas, y para los años 40 ya se habían abandonado completamente.

El acero de las torres se recuperó en su gran mayoría como materia prima para el armamento militar de la Segunda Guerra mundial, pero el hormigón de las flechas quedó en el suelo como recuerdo de aquella época.

Viéndolo desde una perspectiva actual, esta solución parece bastante bruta y tosca. ¿Os imagináis que cada actual ruta tuviera que tener sus flechas y faros en tierra? Pero en esos tiempos no quedaba otra...

Fuentes varias dónde leí sobre esta historia.
Related Posts Plugin for WordPress, Blogger...