漫游鲸二手书店
淘二手好书+回收闲置图书
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程 程戈
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程 程戈
程戈 著 | 机械工业出版社
ISBN:9787111739562
原价: ¥99.00
销售价:¥19.43元
参与书籍回收后,可享更低价格
分类
作者 程戈 著
出版社 机械工业出版社
图书简介

这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作并部署大模型的过程复盘和结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预到GPT-3的稀疏注意力机制详细描述了GPT系列的架构;6~8章从底层技术实现的角度讲解了大语言模型的策略、数据法,以及如何利用策略优化和人类反馈一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。

阅读更多

相关推荐

漫游鲸二手书店

漫游鲸二手书店

微信扫码去买书

漫游鲸二手书店

扫码访问微信小程序