×
思维导图备注
数据科学导论:Python语言实现
首页
收藏书籍
阅读记录
书签管理
我的书签
添加书签
移除书签
3.3.2 主成分分析
浏览
4
扫码
小字体
中字体
大字体
2022-01-23 09:16:26
请
登录
再阅读
上一篇:
下一篇:
译者序
前言
1.1 数据科学与Python简介
1.2 Python的安装
1.2.1 Python 2还是Python 3
1.2.2 分步安装
1.2.3 Python核心工具包一瞥
1.2.4 工具包的安装
1.2.5 工具包升级
1.3.1 Anaconda
1.3.2 Enthought Canopy
1.3.3 PythonXY
1.3.4 WinPython
1.4 IPython简介
1.4.1 IPython Notebook
1.4.2 本书使用的数据集和代码
1.5 小结
第2章 数据改写
2.1 数据科学过程
2.2.1 数据快捷加载
2.2.2 处理问题数据
2.2.3 处理大数据集
2.2.4 访问其他数据格式
2.2.5 数据预处理
2.2.6 数据选择
2.3 使用分类数据和文本数据
2.4 使用NumPy进行数据处理
2.4.1 NumPy中的N维数组
2.4.2 NumPy ndarray对象基础
2.5 创建NumPy数组
2.5.2 控制内存大小
2.5.3 异构列表
2.5.4 从列表到多维数组
2.5.5 改变数组大小
2.5.6 利用NumPy函数生成数组
2.5.7 直接从文件中获得数组
2.5.8 从pandas提取数据
2.6 NumPy快速操作和计算
2.6.1 矩阵运算
2.6.2 NumPy数组切片和索引
2.6.3 NumPy数组堆叠
2.7 小结
第3章 数据科学流程
3.1 EDA简介
3.2 特征创建
3.3 维数约简
3.3.1 协方差矩阵
3.3.2 主成分分析
3.3.3 一种用于大数据的PCA变型——Randomized PCA
3.3.4 潜在因素分析
3.3.5 线性判别分析
3.3.6 潜在语义分析
3.3.7 独立成分分析
3.3.8 核主成分分析
3.3.9 受限玻耳兹曼机
3.4 异常检测和处理
3.4.1 单变量异常检测
3.4.2 EllipticEnvelope
3.4.3 OneClassSVM
3.5 评分函数
3.5.1 多标号分类
3.5.2 二值分类
3.5.3 回归
3.6 测试和验证
3.7 交叉验证
3.7.1 使用交叉验证迭代器
3.7.2 采样和自举方法
3.8 超参数优化
3.8.1 建立自定义评分函数
3.8.2 减少网格搜索时间
3.9 特征选择
3.9.1 单变量选择
3.9.2 递归消除
3.9.3 稳定性选择与基于L1的选择
3.10 小结
第4章 机器学习
4.1 线性和逻辑回归
4.2 朴素贝叶斯
4.3 K近邻
4.4 高级非线性算法
4.4.1 基于SVM的分类算法
4.4.2 基于SVM的回归算法
4.4.3 调整SVM
4.5 组合策略
4.5.1 基于随机样本的粘合策略
4.5.2 基于弱组合的分袋策略
4.5.3 随机子空间和随机分片
4.5.4 模型序列——AdaBoost
4.5.5 梯度树提升
4.5.6 处理大数据
4.6 自然语言处理一瞥
4.6.1 词语分词
4.6.2 词干提取
4.6.3 词性标注
4.6.4 命名实体识别
4.6.6 一个完整的数据科学示例——文本分类
4.7 无监督学习概述
4.8 小结
第5章 社会网络分析
5.1 图论简介
5.2 图的算法
5.3 图的加载、输出和采样
5.4 小结
第6章 可视化
6.1 matplotlib基础介绍
6.1.1 曲线绘图
6.1.2 绘制分块图
6.1.4 直方图
6.1.5 柱状图
6.1.6 图像可视化
6.2 pandas的几个图形示例
6.2.1 箱线图与直方图
6.2.2 散点图
6.2.3 平行坐标
6.3 高级数据学习表示
6.3.1 学习曲线
6.3.2 验证曲线
6.3.3 特征重要性
6.3.4 GBT部分依赖关系图
6.4 小结
暂无相关搜索结果!
×
二维码
手机扫一扫,轻松掌上学
×
《数据科学导论:Python语言实现》电子书下载
请下载您需要的格式的电子书,随时随地,享受学习的乐趣!
EPUB 电子书
×
书签列表
×
阅读记录
阅读进度:
0.00%
(
0/0
)
重置阅读进度