|

《理解大语言模型: 学习其基本思想和技术》(订购)
西安交通大学出版社
2024年9月出版
前 言
如今,我们很难找到一个没有听说过ChatGPT的人,这款人工智能聊天机器人已席卷全球。ChatGPT与其竞争对手们(如谷歌公司的Bard、微软公司的必应聊天平台等)都属于人工智能广泛领域中的一部分,即大语言模型(large language models, LLMs)。大语言模型是人工智能的最新前沿技术,也是近期学术界在自然语言处理(natural language processing, NLP)和深度学习(deep learning, DL)领域的研究成果。然而,这类应用的广泛普及也导致人们产生了一些担忧和误解,因为很多人不清楚这类应用的真实情况。
理解这项新技术背后的思想(包括它是如何演变的,以及如何解决人们对它产生的误解和担忧),对于充分发挥其潜能来说至关重要。因此,本书旨在让读者能够真正地全面了解大语言模型。
本书可作为学习大语言模型的教材使用。
内容简介
本书的内容是大语言模型的基本思想和相关的技术。
本书首先介绍的是对话型人工智能(如ChatGPT)的兴起,以及其与更广泛的大语言模型的关系。然后,读者将了解自然语言处理、其核心思想,以及大语言模型的兴起。接着,读者将深入了解Transformer模型及其特性(如自注意力机制)、如何增强语言建模的性能,以及大语言模型的独特功能。本书最后探讨的是大语言模型的各种结构、大语言模型性能的不断增长所带来的机遇,以及滥用大语言模型的风险。
看完本书之后,读者将全面了解大语言模型,并且可以尝试将其应用到自己的项目中。
读者能够:
◆ 掌握大语言模型的基本思想。
◆ 深入了解自然语言处理的概念和方法,及其发展过程。
◆ 了解Transformer模型和注意力机制。
◆ 探索不同类型的大语言模型及其应用。
◆ 了解流行的大语言模型的架构。
◆ 深入了解人们对大语言模型的误解和担忧,以及如何更好地利用大语言模型。
译者简介
何明 教授、双博士后、博士生导师。入选国家级领军人才、学科拔尖人才、江苏省“333工程”中青年领军人才。兼任中国指挥与控制学会常务理事、无人系统专业委员会副主任。发表SCI/EI检索论文100余篇,获奖著作5部,获授权发明专利13项,主编国家/省级标准6部。获江苏省科学技术一等奖1项、中国指挥与控制学会科技进步一等奖3项、省部级科技进步二等奖3项、省部级教学成果二等奖2项、吴文俊人工智能科技进步二等奖1项。
专家评论
大语言模型的出现给通用人工智能带来了曙光,它在赋能各行各业时可极大提高行业生产力和工作效率。但也有学者认为,思维的存在独立于语言,大模型强大的自然语言处理能力并不代表它有复杂的决策推理能力。仁者见仁,智者见智,深入了解大模型的运行机理及相关技术,将有助于读者做出自己的判断。
——中国工程院 戴浩院士
本书围绕大语言模型,从发展历程、基本概念和典型应用等方面进行了系统剖析,能够帮助读者掌握大语言模型的相关基础理论,具有很好的科普作用,一定会激发广大读者探索利用大语言模型展开应用的热情。
——中国工程院 费爱国院士
来源:西安交通大学出版社
|