Leer la Divina Comedia en el siglo XXI: #Dante2018 en Twitter

En estos dias se esta produciendo un fenomeno interesante en Twitter, la lectura colectiva de la Divina Comedia, sugerencia de un investigador argentino en Chicago, que tuvo un eco inesperado y que hizo que desde distintos puntos del planeta, cientos de usuarios lo estan viendo como una gran oportunidad de leer un clasico, y sentirse conectados y acompanados por otros.

Desde el punto de vista social era algo impensable hasta hace unos anos, porque implica que una tarea solitaria como leer un clasico de la literatura, se transforma en algo colectivo, donde todos aquellos que estan leyendo el libro comentan, opinan, analizan el canto del dia, desde backgrounds completamente diferentes.

Desde el punto de vista tecnologico, podemos analizarlo y cuantificar este fenomeno desde muy diversas perspectivas, tan solo pensandolo durante unos minutos podemos preguntarnos inicialmente:

  • Por usuarios: Cuantos usuarios han hablado alguna vez de #Dante2018? Cuantos usuarios participan diariamente? Donde estan esos usuarios? Se dan interacciones entre ellos?
  • Por la obra misma: Que traduccion es la mas utilizada en funcion de los versos que se comparten? Cuales son los versos mas compartidos?
  • Por las interacciones de los usuarios: Hay mas usuarios que hablan con otros a partir de la obra? Los que hablan de la obra tenian algun tipo de conocimiento previo entre ellos?

Ahora bien, considerando todos estos puntos la siguiente pregunta a responder es: cuales son las herramientas que nos pueden servir para analizar #Dante2018 en Twitter?

 

Advertisements

Using SOM with Car dataset (II)

Dataset Car

This dataset deals with speed and corresponding stopping distance of cars. In case you might be wondering why the speed measurements are quite low, the whole data was measured in the 1920s.

You will get 50 observations on 2 variables, both numeric and continuous.

speed numeric Speed (mph), continuous
dist numeric Stopping distance (ft), continuous

Using SOM with Car dataset

# load the kohonen package
library("kohonen")

# scale data
car.sc = scale(car[, 1:2])

# build grid
car.grid = somgrid(xdim = 2, ydim=2, topo="hexagonal")

# build model
car.som = som(car.sc, grid=car.grid, rlen=100, alpha=c(0.05,0.01))
car.som = som(car.sc, grid=car.grid)

# build model II
car.som = som(car.sc, grid=car.grid, rlen=100, alpha=c(0.05,0.01))

# visualize
plot (car.som)

The som() function has several parameters.

  • grid – the rectangular or hexagonal grid of units.
  • rlen – the numer of iterations, i.e. the number of times the data set will be presented to the map. The default is 100.
  • alpha – the learning rate, determining the size of the adjustments during training. The decrease is linear, and default values are to start from 0.05 and to stop at 0.01.

The result of the training, the car.som object, is a list.

Codes

The most important element is the codes element, which contains the codebook (the data structure that holds the weight vector for each neuron in the grid) vectors as rows.

Changes

Another element worth inspecting is changes, a vector indicating the size of the adaptions to the codebook vectors during training.

plot(iris.som, type="changes")

Node Counts.

The Kohonen packages allows us to visualise the count of how many samples are mapped to each node on the map. This metric can be used as a measure of map quality – ideally the sample distribution is relatively uniform. Large values in some map areas suggests that a larger map would be beneficial. Empty nodes indicate that your map size is too big for the number of samples. Aim for at least 5-10 samples per node when choosing map size.

plot(car, type="count")

Neighbour Distance.

Often referred to as the U-Matrix, this visualisation is of the distance between each node and its neighbours. Typically viewed with a grayscale palette, areas of low neighbour distance indicate groups of nodes that are similar. Areas with large distances indicate the nodes are much more dissimilar – and indicate natural boundaries between node clusters. The U-Matrix can be used to identify clusters within the SOMs map.

plot(car.som, type="dist.neighbours")

Codes/Weight vectors.

The node weight vectors, or codebook, are made up of normalised values of the original variables used to generate the SOM. Each node’s weight vector is representative / similar of the samples mapped to that node. By visualising the weight vectors across the map, we can see patterns in the distribution of samples and variables. The default visualisation of the weight vectors is a fan diagram, where individual fan representations of the magnitude of each variable in the weight vector is shown for each node.

plot(iris.som, type="codes")

Heatmaps

A SOM heatmap allows the visualisation of the distribution of a single variable across the map. Typically, a SOM investigative process involves the creation of multiple heatmaps; the individual sample positions do not move from one visualisation to another, the map is simply coloured by different variables.

coolBlueHotRed <- function(n, alpha = 1) {rainbow(n, end=4/6, alpha=alpha)[n:1]}
plot(car.som, type = "property", property = getCodes(car.som)[,2], main=names(car.som$data)[4], 
 palette.name=coolBlueHotRed)

 

Source

 

 

Using SOM (I)

Self Organizing Maps (SOMs) are a tool for visualizing patterns in high dimensional data by producing a 2 dimensional representation, which (hopefully) displays meaningful patterns in the higher dimensional structure.

The key feature to SOMs is that the topological features of the original input data are preserved on the map. What this means is that similar input samples (where similarity is defined in terms of the input variables (age, sex, height, weight)) are placed close together on the SOM grid.

Ideas intuitivas sobre el algoritmo del SOM

  • El SOM es, en realidad, un tipo de algoritmo para clasificar observaciones.
  • Se elige un gran número de clusters y se colocan en forma de una red bidimensional. La idea es que los representantes de cada grupo (o pesos) estén correlacionados espacialmente, de modo que los puntos más próximos en la rejilla sean más parecidos entre sí que los que estén muy separados
  • Points that were close in the data space are close in the SOM. Thus SOMs may be a good tool for representing spatial clusters in your data.
  • Entrenamiento NO-supervisado
  • Aprendizaje competitivo

Arquitectura en red

El algoritmo SOM considera una arquitectura en 2 capas: por una parte tenemos una capa de nodos de aprendizaje, de la que nos importa la relación geométrica que hay entre ellos y que serán los que finalmente contendrán la información acerca de la representación resultante, junto con una capa de nodos de entrada, donde se representarán los vectores originales durante el proceso de entrenamiento. Además, todos los elementos de la primera capa están conectados con todos los elementos de la segunda capa. La siguiente figura muestra una posible arquitectura 2D para un entrenamiento SOM, la red de aprendizaje viene representada por los nodos rojos, y los vectores de entrenamiento vienen representados en verde. Como en muchos sistemas similares, la idea del algoritmo consistirá en encontrar los pesos adecuados de las conexiones entre ambas capaz para dar una “representación” adecuada de los datos de entrada en la estructura geométrica de los nodos de aprendizaje.

En realidad, como no nos importa la representación geométrica ni topológica de los nodos de entrada, es común que solo se de una representación en la que aperecen los nodos de aprendizaje y los pesos asociados a cada uno de ellos se muestran como un vector de pesos (cada elemento de este vector es el peso de la conexión con el correspondiente nodo de entrada). De esta forma, si la capa de entrada tiene tamaño nn (que es la dimensión del espacio original), cada nodo de aprendizaje tendrá un vector de pesos, WW, de dimensión nn.

Algoritmo de aprendizaje

A grandes rasgos, ya que no hay vector objetivo al que aproximarse, lo que se hace es que, en aquellas zonas en las que la red tiene nodos con pesos que coinciden con vectores de entrenamiento, el resto de nodos de su entorno tienden a aproximarse también a ese mismo vector. De esta forma, partiendo de una dstribución de pesos inicial (normalmente aleatorios), el SOM tiende a aproximarse a una distribución de pesos estable. Cada una de estas zonas que se estabiliza se convierte en un clasificador de propiedades, de forma que la red se convierte en una salida que representa una aplicación de clasificación. Una vez estabilizada la red, cualquier vector nuevo estimulará la zona de la red que tiene pesos similares.

De forma más detallada, los pasos que se siguen para el proceso de entrenamiento son:

  1. Cada nodo se inicializa con un peso (aleatorio). Normalmente, vectores en [0,1]n01n,

  2. Se selecciona al azar un vector del conjunto de entrenamiento.

  3. Se calcula el nodo de la red que tiene el peso más similar al vector anterior, que notaremos como Best Matching Unit (BMU). Para ello, simplemente se calculan las distancias euclídeas entre los vectores WW de cada nodo y el vector de entrenamiento (por motivos de eficiencia, no se aplica la raíz cuadrada al cálculo de la distancia euclídea, cosa que no afecta para calcular el mínimo).
  4. Se calcula el radio del entorno de BMU. Este radio comenzará siendo grande (como para cubrir la red completa) y se va reduciendo en cada iteración.
  5. Cada nodo del entorno de BMU ajusta su peso para parecerse al vector de entrenamiento seleccionado en el paso 2, de forma que los nodos más cercanos al BMU se vean más modificados.
  6. Repetir desde el paso 2 (el número de iteraciones que se considere necesario).

Advantages & Disadvantages

Pro:

  • Intuitive method to develop customer segmentation profiles.
  • Relatively simple algorithm, easy to explain results to non-data scientists
  • New data points can be mapped to trained model for predictive purposes.

Contra:

  • Lack of parallelization capabilities for VERY large data sets since the training data set is iterative
  • Difficult to represent very many variables in two-dimensional plane
  • Requires clean, numeric data

Sources

SaveSaveSaveSaveSaveSaveSaveSave

Review: La vida secreta de la mente de Mariano Sigman

“Todas las personas mayores fueron al principio niños, aunque pocas de ellas lo recuerdan.”

Antoine de Saint-Exupéry

La vida secreta fue escrita por un alguien que recuerda que alguna vez fue un nino y trata de contestarse preguntas desde esa inocencia y simplicidad, con todas las herramientas que le da una larga carrera como cientifico.

Es un libro  de divulgacion cientifica agil, simple e interesante, narrado tal como si fuera la primera clase de la materia introductoria en la universidad, donde el profesor nos cuenta un poco de que van todo los temas mezclando investigaciones cientificas como conceptos basicos, de forma tal que tengamos una idea general de todo lo que podriamos ver en un cuatrimestre de cursada.

Como piensas y se comunican los bebes? Como podemos entenderlos mejor? Como elegimos y que hace que confiemos (o no) en los demas y en nuestras propias desiciones? Cuales son los mecanismos detras de nuestras propias desiciones? Como percibimos la corrupcion? Como nace la conciencia en el cerebro y como nos gobierna el inconsciente? Que sucede en el cerebro durante suenos? Podemos descifrar los suenos, controlarlos y manipularlos? Que hace que nuestro cerebro este predispuesto a cambiar?

Vemos como funciona cada uno de estos mecanismos a la luz de saber que todos somos iguales, todos compartimos los mismos genes, pero existen ciertos grados de libertad y diferencias que nos definen como los individuos unicos que somos cada uno de nosotros.

Uno de los capitulos mas intesantes es el ultimo capitulo que habla acerca de darle un espacio a todo el conocimiento propio de la neurociencia en las aulas, en el aprendizaje tomando ventaja de los conocimientos que la neurociencia pone a nuestra disposicion.

Muestra el gran amor por la ciencia del autor, su solvencia (y su gran practica) a la hora de explicar temas ante una audiencia de estudiantes y su habilidad para transformar temas complejos en un conjunto de conceptos sencillos y faciles de explicar.

 

Como recordamos el pasado?

Una de las preguntas que mas ha vuelto estos dias es cual es la forma mas facil de recordar algo: una imagen o un conjunto de palabras; una foto o una explicacion detallada acerca de que sucedio en ese momento; un grafico vs. un largo enunciado con ejemplos?

Que pasa cuando queremos recordar algo? Empezamos a divagar, a tratar de recordar, a hablarnos a nosotros mismos, hasta llegar a algo o nada. Otras veces llegan un conjunto de imagenes, sensaciones o recuerdos relacionados a lo que estamos buscando – sin ser especificamente lo que buscabamos- , y luego, finalmente en un momento eureka! llega la informacion (Dejenme anticiparles que los momentos eureka a pesar de que todos entendemos la idea, per se no existen, al menos no como el imaginario popular los conoce).

Existe un campo que se encarga de estudiar el sistema nervioso central y todas las conductas que emanan de el: La neurociencia.

Si bien la idea de entender que pasaba por la mente estaba desde los griegos, la Neurociencia moderna es el resultado de la convergencia de varias tradiciones científicas: la Anatomía, la Embriología, la Fisiología, la Bioquímica, la Farmacología, la Psicología y la Neurología. Otras disciplinas científicas más modernas, tambien se han sumado como ciencias que dan apoyo: una de ellas es la Informatica y la otra la Bioingeniería.

La neurociencia es un campo unificado del conocimiento que estudia la estructura, la función, el desarrollo de la bioquimica, la farmacologia y la patologia del sistema nervioso y de cómo sus diferentes elementos interactúan, dando lugar a las bases biológicas de la conducta.

En los ultimos anos, es una ciencia que se encuentra en plena expansion donde existen muchas areas en continuo desarrollo con enorme cantidad de preguntas por responder, pero al mismo tiempo existen conceptos e ideas basicas que nos pueden servir para entender a niveles basicos que es la memoria.

0. Antiguedad

La memoria siempre ha llamado la atencion de la humanidad: tratamos de explicar lo desconocido a traves de dioses y leyendas; o tambien buscamos representarla a traves de la literatura con personajes que logran guardar cantidades infinitas de informacion en su memoria o bien otros personajes que recuerdan cada evento de su vida como Funes el memorioso.

Si vamos hacia la cuna de conocimiento occidental nos dirigimos a Atenas y los antiguos griegos, nos encontramos en primer lugar con Hesíodo (circa 700 a.c.) quien en su obra Teogonía (un gran compilado acerca de las historias que componian la mitologia griega tradiciones orales que circulaban en Atenas) nos presenta a la titánides Mnemósine – Mνημοσυνη-; o La Memoria,  quien sabe todo lo que ha sido, es y será; posee el conocimiento de los orígenes y de las raíces, y su poder que traspasa los límites del más allá.

Platon (427 a. C) define la memoria como la conservacion de las sensaciones, que quedan impresos en los sentidos a manera de un sello en un bloque de cera. Posteriormente, Aristoteles (circa 384 a. C) y otros filosofos clasicos adoptan la misma metafora (sello y cera) para representar a la memoria.

1. Que es la memoria

 La memoria es la capacidad que tenemos los seres humanos para adquirir, almacenar y evocar información.

1.1 Desde el punto de vista funcional

La memoria como un proceso donde se ejecutan distintas tareas sobre la informacion: codificacion, almacenamiento y recupero.

Codificacion o registro: Transformación de la información sensorial en elementos reconocibles y manipulables por la memoria mediante códigos verbales (palabras, números, letras) y códigos visuales (imágenes y figuras). Esta codificación no es neutra sino que de toda la información sensorial que llega se selecciona la que interesa y se interpreta de acuerdo a vivencias e ideas anteriores. En esta operación influyen de manera decisiva la atencion y concentracion.

Almacenamiento: Retención de la información con el fin de conservarla y recuperarla cuando sea necesario. Según dónde se guarden los datos permanecerán más o menos tiempo en la memoria, desde unos segundos, hasta toda la vida.

Recuperacion / Recordar: Localización y reactualización de la información almacenada. Esto es a lo que llamamos recordar, es decir, evocar y reconocer la información adquirida y almacenada en la memoria. La recuperación significa traer a la conciencia la información.

1.2. Desde el punto de vista fisico

El cerebro humano almacena recuerdos a largo plazo a traves de patrones de conexiones entre las neuronas en el cerebro. Esas neuronas, alrededor de 100 mil millones, están altamente interconectadas. Algo así como 100 billones de sitios de conexión (sinapsis) están presentes en el cerebro.

Cuando una neurona particular se activa, influye en los niveles de actividad de las neuronas a las que está conectada, ya sea aumentando o inhibiendo sus niveles de actividad. Cuando forma una nueva memoria, el patrón de conexiones en su cerebro se altera.

2. Tipos de memoria

Tenemos distintos tipos de memoria: memoria sensorial, memoria de trabajo (que contiene a la memoria de corto plazo) y memoria de largo plazo.

Una primera forma de categorizar la memoria nos permite ver que cada una de ellas almacena informacion por distintos espacios de tiempo: la memoria sensorial tiene una vida útil extremadamente corta, que varia entre por debajo de un segundo y no por encima de dos).  La memoria de trabajo almacena la informacion por 10-15 segundos, y finalmente la memoria de largo plazo, puede guardar información durante, tal vez una vida entera.

2.1 Memoria Sensorial

Es la capacidad de registrar las sensaciones percibidas a través de los sentidos. Esta memoria tiene una gran capacidad para procesar una enorme cantidad de información a la vez, aunque durante un espacio de tiempo extremadamente breve.

Nos permite retener impresiones de información sensorial después de que el estímulo original haya cesado: la temperatura del cafe, el sonido que acabamos de escuchar, una luz brillante que aparecio en algun punto de nuestro campo visual…es nuestra ayuda para descifrar nuestro entorno a traves de los estimulos que recibimos del medio ambiente, los receptores sensoriales almacenan la informacion en los registros sensoriales. Estos registros son una una serie de almacenes de información correspondientes a cada sentido que prolongan la duración de la estimulación. Esta forma de trabaja a su vez facilita su procesamiento en la memoria operativa.

Todo esto constituye la fase inicial del desarrollo del proceso de la atención.

2.2.1 Caracteristicas

  • Alta capacidad de procesamiento de información en forma simultanea.
  • Almacenamiento de la informacion durante un espacio de tiempo muy breve.

2.2.2  Ejemplos de memoria sensorial

  • Memoria iconica (visual): Seguimos viendo una imagen a pesar que parpadeamos
  • Memoria ecoica (auditiva): Seguimos escuchando una cancion aunque apaguemos la radio
  • Memoria haptica (tacto): trabaja con información de tipo táctil, con sensaciones como el dolor, el calor, el picor, el cosquilleo, la presión o la vibración. Nos permite examinar objetos mediante el tacto e interactuar con ellos, por ejemplo para cogerlos o moverlos adecuadamente.

2.2 Memoria de trabajo / operativa

El término memoria a corto plazo (MCP) se refiere a una memoria de corta duración que se evalúa con pruebas que requieren únicamente la retención de una pequeña cantidad de información durante periodos muy cortos de tiempo. La memoria de trabajo / operativa / funcional es un término más amplio que incluye a la MCP.

La memoria de trabajo se refiere a la manipulación de información a corto plazo. Mantiene activas pequeñas cantidades de información durante un tiempo breve, a la vez que manipula esta información para poder realizar tareas de comprensión, razonamiento y aprendizaje más complejas.

Es la memoria que utilizamos para seguir instrucciones de varios pasos o resolver un problema de matemáticas mentalmente.

2.2.1 Caracteristicas

  • Su capacidad es limitada. Solo almacenamos 7 ±2 elementos .
  • Es activa. Almacena la información, la manipula y la transforma.
  • Sus contenidos se actualizan permanentemente.
  • Está modulada por el córtex frontal dorsolateral.

2.2.2  Ejemplos de memoria de trabajo

  • Integrar dos o más cosas que ha tenido lugar en estrecha proximidad temporal, por ejemplo recordar y responder a los datos que se han dicho en una conversación.
  • Asociar un conocimiento nuevo con conocimientos que ya conocíamos. Nos permite aprender.
  • Mantener en la mente una información mientras prestamos atención a otra cosa, por ejemplo podemos preparar los ingredientes que vamos a necesitar para hacer la comida mientras hablamos por teléfono con alguien.

2.3 Memoria de largo plazo

La memoria de largo plazo mecanismo cerebral que nos permite codificar y retener una cantidad prácticamente ilimitada de información durante un periodo largo de tiempo, como minimo se considera un lapso mayor a 6 meses. Se diferencia estructural y funcionalmente de la memoria a corto plazo y de la memoria de trabajo.

3. Cambios en la memoria

La memoria es la habilidad que permite clasificar, interpretar, almacenar y recuperar información. Sabemos que es posible perder la memoria, pensemos en alguien mayor; tal vez nuestros padres, nuestros abuelos, algún conocido, que a veces olvida algo, no sabe donde dejo la llaves o el nombre de ese chico tan simpático que vieron hace 5 minutos.

Dado que sabemos que la memoria se degrada, es valida la pregunta en sentido opuesto: es posible mejorar la memoria?

La respuesta corta es si es posible. Una respuesta larga y mucho más detallada considera: en que estadio de vida se encuentra la persona, cuales son sus antecedentes de vida, cual es su estilo de vida actual, que causa la perdida de memoria actual, que tipo de memoria se espera mejorar, y finalmente como se va a medir esa mejora. Por sobre todas las cosas, al hablar de mejorar la memoria, asi como cualquier otro proceso, tambien hablamos de  un concepto relativamente nuevo: la plasticidad cerebral.

3.1 Estrategias convencionales

Antes de que empiece a buscar en algun otro lugar de este vasto oceano de conocimiento que es Internet, formalmente no existe ninguna division entre estrategias convencionales y no convencionales, tan solo el sentido comun de detallar como cosas del dia a dia contribuyen al buen estado de la memoria y porque no, de la salud en general.

3.1.1 Dormir 8 horas

La idea de que el sueño mejora la memoria tiene una larga historia, pero solo en los últimos 20 años ha ganado un sólido soporte empírico. Muchos estudios han demostrado que la falta de sueño afecta el aprendizaje de habilidades. Pero faltaban estudios que mostraran lo contrario: que dormir contribuye a la memoria.

Buscando dar respuesta a esta pregunta se encontro que dormir mejora el aprendizaje al mejorar las oscilaciones en la actividad eléctrica del cerebro conocidas como “ondas lentas” que ocurren durante las etapas más profundas del sueño [1] [2] [3]. La fuerza de estas oscilaciones también predice el futuro rendimiento basado en la memoria. Tambien se ha estudiado que dormir influye en los cambios en la conectividad neuronal después del aprendizaje. [4] [5]

3.1.2 Dieta balanceada

 

3.1.3 Hacer ejercicio regularmente

 

3.2 Estrategias no convencionales

Dentro de las ideas no convencionales agrupe aquellas que implican entrenamiento de la memoria tal como si fuera ir al gimnasio y estuvieramos hablando de endurecer e incrementar su rendimiento.

4. En conclusion

El campo de la neurociencia y la memoria se encuentra en pleno desarrollo, y es absolutamente fascinante no solo por los descubrimientos pasados, sino por todo lo que esta por venir.

5. Fuentes: libros, charlas y documentos

Existen infinidad de libros, charlas TED y articulos que hablan acerca de la neurociencia, tan de moda en estos dias, y como todo, existe informacion y libros para todos los gustos  a continuacion algunos de los que mas llamaron mi atencion:

Libros

La vida secreta de la mente de Mariano Sigman: de divulgacion cientifica, narrado en un estilo ameno, cercano, y casi como si fuera una conversacion, a medida que habla acerca de preguntas basicas de la vida cotidiana nos cuenta como funciona nuestro cerebro, nos presenta datos e estudios que validan todo aquello que nos cuenta.

Scientific secrets for raising kids: de divulgacion cientifica, el enfoque del libro es presentarnos un topico y un conjunto de estrategias basadas en estudios que validan un comportamiento u otro por parte de los padres. Excelente libro, ameno y altamente recomendable.. sobre todo si tienen hijos.

Charlas TED

Como punto de partida para leer mas, ya que en muchos casos aprender mas, significa tener mas preguntas y menos certezas:

A map of the brain by Alan Jones: Aprendemos cuan interconectado esta el cerebro y nos da un vistazo de la relacion que existe entre cada una de sus partes.

The quest to understand conciousness by Antonio Damassio: Nos presenta como nuestro cerebro crea el sentido de nosotros, y que nos deja con mas preguntas que respuestas, y justamente por eso tan recomendable: despierta las ganas de estudiar y aprender mas.

Growing evidence of brain plasticity by Michael Merzenich: Muestra nuevas evidencias acerca de la plasticidad cerebral y nos ensena que al aprender determinados comportamientos se modifica la estructura cerebral.