La investigación, llevada a cabo por científicos de la Universidad Carlos III de Madrid, se basa en el dilema del prisionero. Tras el estudio, la conclusión es clara: la cooperación se aprende, sobre todo con práctica. Parece que se hace realidad ese dicho que si tú tratas bien, te tratarán bien. El trabajo se publica en la revista Journal of the Royal Society Interface.
Cooperative behaviour lies at the very basis of human societies, yet its evolutionary origin remains a key unsolved puzzle. Whereas reciprocity or conditional cooperation is one of the most prominent mechanisms proposed to explain the emergence of cooperation in social dilemmas, recent experimental findings on networked Prisoner’s Dilemma games suggest that conditional cooperation also depends on the previous action of the player—namely on the ‘mood’ in which the player is currently in. Roughly, a majority of people behave as conditional cooperators if they cooperated in the past, whereas they ignore the context and free ride with high probability if they did not. However, the ultimate origin of this behaviour represents a conundrum itself. Here, we aim specifically to provide an evolutionary explanation of moody conditional cooperation (MCC). To this end, we perform an extensive analysis of different evolutionary dynamics for players’ behavioural traits—ranging from standard processes used in game theory based on pay-off comparison to others that include non-economic or social factors. Our results show that only a dynamic built upon reinforcement learning is able to give rise to evolutionarily stable MCC, and at the end to reproduce the human behaviours observed in the experiments.
Ayudar a quien te ayuda, esa es la base moral de este modelo matemático que ha desarrollado un equipo de científicos de la Universidad Carlos III de Madrid. Según la investigación, cuando existe una necesidad de cooperación, es más probable que se ceda a ello si antes los que están en situación de ayuda lo han hecho con nosotros. “Lo hacemos porque el aprendizaje refuerza lo que nos ha ido bien y no porque imitemos a personas con éxito, un planteamiento paradigmático en el que lo mejor que podemos hacer es cooperar, y nos irá bien a ambos”, explica a Sinc Anxo Sánchez, profesor del Grupo Interdisciplinar de Sistemas Complejos de la universidad madrileña.
El estudio se ha resuelto gracias al dilema del prisionero. La policía detiene a dos delincuentes y los separa para un interrogatorio. Aquí viene el dilema, con tres posibles respuestas: si los dos se encubren o permanecen en silencio, ambos son condenados a un año de prisión. Si los dos traicionan, los dos van a la cárcel. Si solo uno de ellos traiciona, el otro cumple pena y el traidor queda libre. ¿Qué harán los prisioneros? Esto mismo es aplicable a la cooperación según los científicos. “Dicho de otra manera, cuando traicionas una vez, es bastante difícil que vuelvas a cooperar en el futuro, mientras que si vienes de cooperar te inclinas más a seguir haciéndolo”, dice Sánchez.
El modelo matemático refuerza la idea de que el comportamiento no surge por imitación de otros, sino por las experiencias buenas o malas. “Hasta ahora la mayoría de modelos de cómo aparecía el comportamiento eran más sociales, es decir, más referidos a imitar a otros, bien porque los conocemos o porque nos parece bien lo que hacen, pero nuestro trabajo lo excluye definitivamente”, dice Sánchez. “Nuestro comportamiento se ajusta más según nos ha ido, no por lo que copiemos socialmente de los demás”, añade el científico.