机读格式显示(MARC)

000 01139nam0 2200313 450

001 0000444688

005 20240906092900.0

010 __ |a 978-7-115-60069-1 |d CNY129.80

035 __ |a (A100000NLC)012140542

049 __ |a A100000NLC |b UCS01011695705 |c 012140542 |d NLC01

100 __ |a 20230208d2022 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a 深度强化学习 |A shen du qiang hua xue xi |b 专著 |d Deep reinforcement learning |f 王树森，黎彧君，张志华著 |z eng

210 __ |a 北京 |c 人民邮电出版社 |d 2022

215 __ |a 294页 |c 图 |d 24cm

300 __ |a 图灵原创图灵教育

330 __ |a 本书分为基础知识、价值学习、策略学习、多智能体强化学习、应用与展望五部分，涵盖机器学习基础、蒙特卡洛方法、强化学习基本概念、DQN与Q学习、SARSA算法、价值学习高级技巧、策略梯度方法等。

510 1_ |a Deep reinforcement learning |z eng

606 0_ |a 机器学习

690 __ |a TP181 |v 5

690 __ |a TP18 |v 4

701 _0 |a 王树森 |A wang shu sen |c (自动化技术) |4 著

701 _0 |a 黎彧君 |A li yu jun |4 著

701 _0 |a 张志华 |A zhang zhi hua |c (计算机科学) |4 著

801 _2 |a CN |b OLCC |c 20230309

905 __ |a JBXQLIB |d TP18/756