机读格式显示(MARC)

000 01452nam0 2200265 450

001 0000454566

005 20241026125600.0

010 __ |a 978-7-111-75488-6 |d CNY119.00

100 __ |a 20240711d2024 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a 多模态大模型 |A duo mo tai da mo xing |b 专著 |e 算法、应用与微调 |d Multimodal large language models |e algorithms, applications, and fine-tuning |f 刘兆峰著 |z eng

210 __ |a 北京 |c 机械工业出版社 |d 2024.06

215 __ |a 404页 |c 图 |d 24cm

225 1_ |a 智能系统与技术丛书

330 __ |a 本书分为两篇：第一篇算法原理：详细介绍了先进的深度学习模型，包括Transformer、GPT系列、深度生成模型，从基本架构、训练方法到特定应用，包括但不限于Seq2Seq结构、位置编码、注意力机制、残差连接、变分自编码器、GAN、ViT、CLIP、Stable Diffusion、各模型训练实践的知识点。此外，探讨了预训练模型的涌现能力、模型参数和通信数据量的估算，以及分布式训练的各种技术，如数据并行、模型并行和混合精度训练等。第二篇应用实战：聚焦于深度学习模型的实际应用，特别是文本和图像生成，以及代码生成的应用实战。通过具体实战项目，如利用Stable Diffusion进行图像生成和Code Llama进行代码生成，提供了微调技术的详细细节等。

333 __ |a 人工智能研究相关人员

510 1_ |a Multimodal large language models |e algorithms, applications, and fine-tuning |z eng

606 0_ |a 人工智能

690 __ |a TP18 |v 5

701 _0 |a 刘兆峰 |A liu zhao feng |4 著

801 _0 |a CN |b 人天书店 |c 20240711

905 __ |a JBXQLIB |d TP18/858