La revista Nature ha dedicado su portada y su comentario editorial a un asunto que, de puro cotidiano, no parece plantear demasiadas dudas: ¿cómo valoramos las expectativas de futuro? Parece claro que lo hacemos teniendo en cuenta experiencias anteriores y a ningún científico se le escapa que tiene que ser el cerebro el que se encarga de semejante tarea. Es un neurotransmisor, la dopamina, el principal elemento que interviene en el proceso y, como explica el editorial de Nature a beneficio de los no especialistas, se producen incrementos y decrementos de dicho neurotransmisor en virtud de los resultados reales frente a los previstos. Si ante una determinada esperanza de éxito -encontrar fruta madura para alimentarse, por ejemplo- los resultados superan las expectativas, las neuronas receptoras de dopamina incrementan su trabajo; en caso de obtener recompensas inferiores a las esperadas, actúan en menor medida.

Pero la cuestión más importante para entender el funcionamiento del cerebro ante las expectativas de futuro es el de la estrategia que sigue. Se creía que el cerebro tiende a calcular un promedio de los resultados previsibles y luego produce las sensaciones de satisfacción o decepción de una forma que podríamos calificar como lineal: si creo que encontraré al menos un par de manzanas comestibles, me daré por satisfecho o por frustrado de acuerdo con esa esperanza única. Y de los resultados sucesivos que se obtienen se deriva el aprendizaje acerca de cómo y dónde hay que ir en busca de fruta. Pues bien, mediante un estudio de la actividad neuronal relacionada con la dopamina en el área tegmental ventral -cerebro medio- del ratón, Will Dabney, investigador de Inteligencia Artificial del grupo DeepMind de Londres (Reino Unido), y sus colaboradores han encontrado evidencias que conducen a un modelo mucho más complejo de la estrategia que sigue el cerebro para aprender del pasado y poder anticipar el futuro.

De acuerdo con el trabajo de Dabney y colaboradores, el cerebro (el del ratón, por supuesto, pero es probable que también el de cualquier otro mamífero) obtiene sus expectativas de futuro de otra forma. En vez de ajustarse a un simple promedio de posibilidades, realiza una especie de mapa de distribución. Se representan las probabilidades que tienen múltiples resultados futuros, y se evalúan estos de forma simultánea, en paralelo. El modelo se inspira en el aprendizaje que llevan a cabo los programas de Inteligencia Artificial, pero es muy probable que responda también a la actividad real del cerebro: tiene que elegir no frente a una única alternativa simple sino ante un panorama en el que aparece una multitud de posibles escenarios, cada uno con sus propias expectativas de recompensa. ¿Tan complejo es? Bueno; ya sabemos el lío que aparece cada vez que tenemos que tomar una decisión acerca de lo que se nos viene encima.