力扣150题11-15
力扣150题16-20
本文以自然梯度法的推导为脉络,贯穿黎曼空间、黎曼流形、黎曼度量、费舍尔信息矩阵、KL 散度和自然梯度法等概念。这是 TRPO 算法理论的重要基础
力扣150题1-5
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号