更新时间:2025-04-01 15:05:55
封面
版权页
内容提要
大数据专业系列图书专家委员会
序
前言
第1章 Python概述
1.1 Python简介
1.1.1 Python语言
1.1.2 Python与机器学习
1.1.3 Python环境配置
1.2 Python基础知识
1.2.1 固定语法
1.2.2 运算符
1.2.3 数据类型
1.2.4 Python I/O
1.3 控制语句
1.3.1 条件语句
1.3.2 循环语句
1.4 函数
小结
课后习题
第2章 NumPy数值计算
2.1 ndarray的创建与索引
2.1.1 创建ndarray
2.1.2 ndarray的索引和切片
2.2 ndarray的基础操作
2.2.1 变换ndarray的形态
2.2.2 排序与搜索
2.3 ufunc
2.3.1 ufunc的广播机制
2.3.2 常用ufunc运算
第3章 pandas基础
3.1 pandas常用类
3.1.1 Series
3.1.2 DataFrame
3.1.3 Index
3.2 DataFrame基本操作
3.2.1 索引
3.2.2 排序
3.2.3 合并
3.3 其他数据类型操作
3.3.1 时间操作
3.3.2 文本操作
3.3.3 category操作
第4章 pandas进阶
4.1 数据的读取与写出
4.1.1 CSV
4.1.2 Excel
4.1.3 数据库
4.2 DataFrame进阶
4.2.1 统计分析
4.2.2 分组运算
4.2.3 透视表和交叉表
4.3 数据准备
4.3.1 缺失值处理
4.3.2 重复数据处理
4.3.3 连续特征离散化处理
4.3.4 哑变量处理
第5章 Matplotlib绘图
5.1 Matplotlib绘图基础
5.1.1 编程风格
5.1.2 动态rc参数
5.2 分析特征关系常用图形
5.2.1 散点图
5.2.2 折线图
5.3 分析特征内部数据状态常用图形
5.3.1 直方图与条形图
5.3.2 饼图
5.3.3 箱线图
第6章 scikit-learn
6.1 数据准备
6.1.1 标准化
6.1.2 归一化
6.1.3 二值化
6.1.4 独热编码
6.2 降维
6.2.1 PCA
6.2.2 ICA
6.2.3 LDA
6.3 分类
6.3.1 Logistic回归
6.3.2 SVM
6.3.3 决策树
6.3.4 KNN
6.3.5 朴素贝叶斯
6.3.6 随机森林
6.3.7 多层感知机
6.4 回归
6.4.1 最小二乘回归
6.4.2 岭回归
6.4.3 Lasso回归