Dual credit assignment processes underlie dopamine signals in a complex spatial environment

Timothy A Krausz; Alison E Comrie; Ari E Kahn; Loren M Frank; Nathaniel D Daw; Joshua D Berke

doi:10.1016/j.neuron.2023.07.017

Dual credit assignment processes underlie dopamine signals in a complex spatial environment

Neuron. 2023 Nov 1;111(21):3465-3478.e7. doi: 10.1016/j.neuron.2023.07.017. Epub 2023 Aug 22.

Authors

Timothy A Krausz¹, Alison E Comrie¹, Ari E Kahn², Loren M Frank³, Nathaniel D Daw², Joshua D Berke⁴

Affiliations

¹ Neuroscience Graduate Program, University of California, San Francisco, San Francisco, CA 94158, USA.
² Department of Psychology, and Princeton Neuroscience Institute, Princeton University, Princeton, Princeton, NJ 08544, USA.
³ Neuroscience Graduate Program, University of California, San Francisco, San Francisco, CA 94158, USA; Howard Hughes Medical Institute, Chevy Chase, MD 20815, USA; Department of Physiology, University of California, San Francisco, San Francisco, CA 94158, USA.
⁴ Neuroscience Graduate Program, University of California, San Francisco, San Francisco, CA 94158, USA; Kavli Institute for Fundamental Neuroscience, and Weill Institute for Neurosciences, University of California, San Francisco, San Francisco, CA 94158, USA; Department of Neurology and Department of Psychiatry and Behavioral Science, University of California, San Francisco, San Francisco, CA 94158, USA. Electronic address: joshua.berke@ucsf.edu.

Abstract

Animals frequently make decisions based on expectations of future reward ("values"). Values are updated by ongoing experience: places and choices that result in reward are assigned greater value. Yet, the specific algorithms used by the brain for such credit assignment remain unclear. We monitored accumbens dopamine as rats foraged for rewards in a complex, changing environment. We observed brief dopamine pulses both at reward receipt (scaling with prediction error) and at novel path opportunities. Dopamine also ramped up as rats ran toward reward ports, in proportion to the value at each location. By examining the evolution of these dopamine place-value signals, we found evidence for two distinct update processes: progressive propagation of value along taken paths, as in temporal difference learning, and inference of value throughout the maze, using internal models. Our results demonstrate that within rich, naturalistic environments dopamine conveys place values that are updated via multiple, complementary learning algorithms.

Keywords: credit assignment; decision-making; dopamine; maze; navigation; reinforcement learning.

Publication types

Research Support, N.I.H., Extramural
Research Support, Non-U.S. Gov't

MeSH terms

Animals
Brain
Decision Making*
Dopamine*
Rats
Reward

Substances

Dopamine

Abstract

Publication types

MeSH terms

Substances

Grants and funding