notesum.ai

Published at December 10

Efficient Online Reinforcement Learning Fine-Tuning Need Not Retain Offline Data

cs.LG

Released Date: December 10, 2024

Authors: Zhiyuan Zhou¹, Andy Peng, Qiyang Li, Sergey Levine, Aviral Kumar

Aff.: ¹UC Berkeley

Arxiv: http://arxiv.org/pdf/2412.07762v1

Refer to caption