机读格式显示(MARC)
- 000 01139nam0 2200313 450
- 010 __ |a 978-7-115-60069-1 |d CNY129.80
- 035 __ |a (A100000NLC)012140542
- 049 __ |a A100000NLC |b UCS01011695705 |c 012140542 |d NLC01
- 100 __ |a 20230208d2022 em y0chiy50 ea
- 200 1_ |a 深度强化学习 |A shen du qiang hua xue xi |b 专著 |d Deep reinforcement learning |f 王树森,黎彧君,张志华著 |z eng
- 210 __ |a 北京 |c 人民邮电出版社 |d 2022
- 215 __ |a 294页 |c 图 |d 24cm
- 330 __ |a 本书分为基础知识、价值学习、策略学习、多智能体强化学习、应用与展望五部分,涵盖机器学习基础、蒙特卡洛方法、强化学习基本概念、DQN与Q学习、SARSA算法、价值学习高级技巧、策略梯度方法等。
- 510 1_ |a Deep reinforcement learning |z eng
- 701 _0 |a 王树森 |A wang shu sen |c (自动化技术) |4 著
- 701 _0 |a 黎彧君 |A li yu jun |4 著
- 701 _0 |a 张志华 |A zhang zhi hua |c (计算机科学) |4 著
- 801 _2 |a CN |b OLCC |c 20230309
- 905 __ |a JBXQLIB |d TP18/756