数据科学基础——基于R与Python的实现(基于Python的数据分析丛书) - 中国高校教材图书网
|
书名: |
数据科学基础——基于R与Python的实现(基于Python的数据分析丛书)
|
| ISBN: | 978-7-300-33466-0 |
责任编辑: | |
| 作者: |
吴喜之 张敏
相关图书
|
装订: | 平 |
| 印次: | 1-1 |
开本: | 16 |
| 定价: |
¥59.00
折扣价:¥53.10
折扣:0.90
节省了5.9元
|
字数: |
350千字
|
| 出版社: |
中国人民大学出版社 |
页数: |
|
| 出版日期: |
2025-01-16 |
每包册数: |
11
|
| 国家规划教材: |
|
省部级规划教材: |
|
| 入选重点出版项目: |
|
获奖信息: |
|
|
|
| 内容简介: |
数据科学是在动态世界中不断发展变化的。本书旨在让读者掌握数据科学基础知识与技能,尽快进入理论与实践,奠定进一步发展的基础。 本书精选了5章内容。第1章为数据初等描述;第2章介绍传统统计基本思维方式,可作为参考;第3章系统深入地介绍有监督学习基础,包括回归及分类概念方法,重点介绍决策树;第4章介绍机器学习组合算法及模型;第5章详细介绍神经网络的基本概念。内容聚焦于决策树、神经网络等既基础又具扩展功能的方法,未罗列扩展性不强的方法。 本书支持R和Python两种编程语言,R代码穿插于正文,Python代码及说明性R代码附于每章之后。建议读者在学习数据科学的过程中通过处理数据自学编程,培养自己的编程能力。 本书与教学契合度高,无论经验丰富的教师,还是没有机器学习和数理统计教学经验的教师,都能轻松上手。其独特的数据驱动教学方式,能够极大地激发学生的学习兴趣,促使学生快速吸收知识,提升学习效果。
|
| 作者简介: |
吴喜之 北京大学数学力学系本科毕业,北卡罗来纳大学统计学博士。中国人民大学统计学院教授,博士生导师.曾在南开大学、北京大学、加利福尼亚大学、北卡罗来纳大学等多所著名学府执教。 张 敏 重庆工商大学讲师。作为第一作者发表CSSCI、CSCD、SCI文章多篇,主持或参与国家级及省部级课题多项,作为第二作者出版关于数据科学的教材多部。
|
| 章节目录: |
第1章 体现真实世界的数据 1.1 数据: 对真实世界的记录 1.2 变量的逐个描述 1.3 变量关系的描述 1.4 数据的简单描述可能很肤浅甚至误导 1.5 习题 1.6 附录: 正文中没有的 R 代码 1.7 附录: 本章的Python代码 第2章 传统统计: 参数推断简介 2.1 关于总体均值 μ 的推断 2.2 关于伯努利试验概率的推断 2.3 习 题 2.4 附录: 本章的 Python 代码 第3章 有监督学习基础 3.1 引 言 3.2 简单回归模型初识 3.3 最小二乘线性回归模型 3.4 决策树回归 3.5 通过例子总结两种回归方法 3.6 简单分类模型初识 3.7 Logistic回归的数学背景 3.8 决策树分类的更多说明 3.9 通过例子对两种分类方法进行总结 3.10 多分类问题 3.11 习题 3.12 附录: 正文中没有的 R 代码 3.13 附录: 本章的 Python代码 第4章 机器学习组合算法 4.1 什么是组合算法 4.2 bagging 4.3 随机森林 4.4 梯度下降法及极端梯度增强回归 4.5 AdaBoost 分类 4.6 组合算法对两个数据的交叉验证 4.7 习题 4.8 附录: 正文中没有的R代码 4.9 附录: 本章的Python代码 第5章 神经网络 5.1 基本概念 5.2 通过基础编程了解神经网络的细节 5.3 习题 5.4 附录: 本章的Python代码
|
| 精彩片段: |
第 1 章是关于数据的初等描述,这是初识真实数据所必需的。第2章介绍了传统统计的基本思维方式,这部分虽然和后续内容关系不大, 但由于是历史, 不应该回避, 可以仅作为参考或讨论。第3章介绍了有监督学习基础,包括建模、模型解释、模型预测、基于交叉验证的模型比较等内容, 系统深入地介绍了回归及分类的概念及方法。对于有监督学习载体的具体模型, 不但介绍了传统统计中最常用的最小二乘线性回归, 还从基本原理到编程全方位地介绍了作为机器学习中最重要的基础学习器之一的决策树, 为后面要引入的更精确的组合算法奠定了基础。第4章介绍了机器学习组合算法及若干重要的组合算法模型, 包括 bagging、随机森林、梯度增强回归和 AdaBoost。第5章详细地介绍了神经网络的基本概念, 神经网络是深度学习的基础, 理解神经网络对今后学习深度学习有很大的益处。 本书是一本基础教材, 因此在机器学习选题上选择决策树、神经网络等既基本又有扩展功能的方法, 而且从理论到编码进行了详尽的描述。为了使读者在短时间内集中精力牢固掌握最重要的有广泛意义的知识, 本书没有罗列一些常用但扩展性不强的方法, 比如支持向量机、贝叶斯网络等, 感兴趣的读者可以从其他渠道获得这些知识。
|
| 书 评: |
|
|
| 其 它: |
|
|
|