书籍封面
书籍目录
封面
书名
版权
前言
目录
第1章 Spark机器学习简介
1.1 机器学习介绍
1.2 Spark介绍
1.3 Spark MLlib介绍
第2章 Spark数据操作
2.1 Spark RDD操作
2.1.1 Spark RDD创建操作
2.1.2 Spark RDD转换操作
2.1.3 Spark RDD行动操作
2.2 MLlib Statistics统计操作
2.2.1 列统计汇总
2.2.2 相关系数
2.2.3 假设检验
2.3 MLlib数据格式
2.3.1 数据处理
2.3.2 生成样本
第3章 Spark MLlib矩阵向量
3.1 Breeze介绍
3.1.1 Breeze创建函数
3.1.2 Breeze元素访问及操作函数
3.1.3 Breeze数值计算函数
3.1.4 Breeze求和函数
3.1.5 Breeze布尔函数
3.1.6 Breeze线性代数函数
3.1.7 Breeze取整函数
3.1.8 Breeze常量函数
3.1.9 Breeze复数函数
3.1.10 Breeze三角函数
3.1.11 Breeze对数和指数函数
3.2 BLAS介绍
3.2.1 BLAS向量-向量运算
3.2.2 BLAS矩阵-向量运算
3.2.3 BLAS矩阵-矩阵运算
3.3 MLlib向量
3.3.1 MLlib向量介绍
3.3.2 MLlib Vector接口
3.3.3 MLlib DenseVector类
3.3.4 MLlib SparseVector类
3.3.5 MLlib Vectors伴生对象
3.4 MLlib矩阵
3.4.1 MLlib矩阵介绍
3.4.2 MLlib Matrix接口
3.4.3 MLlib DenseMatrix类
3.4.4 MLlib SparseMatrix类
3.4.5 MLlib Matrix伴生对象
3.5 MLlib BLAS
3.6 MLlib分布式矩阵
3.6.1 MLlib分布式矩阵介绍
3.6.2 行矩阵(RowMatrix)
3.6.3 行索引矩阵(IndexedRowMatrix)
3.6.4 坐标矩阵(CoordinateMatrix)
3.6.5 分块矩阵(BlockMatrix)
第4章 Spark MLlib线性回归算法
4.1 线性回归算法
4.1.1 数学模型
4.1.2 最小二乘法
4.1.3 梯度下降算法
4.2 源码分析
4.2.1 建立线性回归
4.2.2 模型训练run方法
4.2.3 权重优化计算
4.2.4 线性回归模型
4.3 实例
4.3.1 训练数据
4.3.2 实例代码
第5章 Spark MLlib逻辑回归算法
5.1 逻辑回归算法
5.1.1 数学模型
5.1.2 梯度下降算法
5.1.3 正则化
5.2 源码分析
5.2.1 建立逻辑回归
5.2.2 模型训练run方法
5.2.3 权重优化计算
5.2.4 逻辑回归模型
5.3 实例
5.3.1 训练数据
5.3.2 实例代码
第6章 Spark MLlib保序回归算法
6.1 保序回归算法
6.1.1 数学模型
6.1.2 L2保序回归算法
6.2 源码分析
6.2.1 建立保序回归
6.2.2 模型训练run方法
6.2.3 并行PAV计算
6.2.4 PAV计算
6.2.5 保序回归模型
6.3 实例
6.3.1 训练数据
6.3.2 实例代码
第7章 Spark MLlib贝叶斯分类算法
7.1 贝叶斯分类算法
7.1.1 贝叶斯定理
7.1.2 朴素贝叶斯分类
7.2 源码分析
7.2.1 建立贝叶斯分类
7.2.2 模型训练run方法
7.2.3 贝叶斯分类模型
7.3 实例
7.3.1 训练数据
7.3.2 实例代码
第8章 Spark MLlib SVM支持向量机算法
8.1 SVM支持向量机算法
8.1.1 数学模型
8.1.2 拉格朗日
8.2 源码分析
8.2.1 建立线性SVM分类
8.2.2 模型训练run方法
8.2.3 权重优化计算
8.2.4 线性SVM分类模型
8.3 实例
8.3.1 训练数据
8.3.2 实例代码
第9章 Spark MLlib决策树算法
9.1 决策树算法
9.1.1 决策树
9.1.2 特征选择
9.1.3 决策树生成
9.1.4 决策树生成实例
9.1.5 决策树的剪枝
9.2 源码分析
9.2.1 建立决策树
9.2.2 建立随机森林
9.2.3 建立元数据
9.2.4 查找特征的分裂及划分
9.2.5 查找最好的分裂顺序
9.2.6 决策树模型
9.3 实例
9.3.1 训练数据
9.3.2 实例代码
第10章 Spark MLlib KMeans聚类算法
10.1 KMeans聚类算法
10.1.1 KMeans算法
10.1.2 演示KMeans算法
10.1.3 初始化聚类中心点
10.2 源码分析
10.2.1 建立KMeans聚类
10.2.2 模型训练run方法
10.2.3 聚类中心点计算
10.2.4 中心点初始化
10.2.5 快速距离计算
10.2.6 KMeans聚类模型
10.3 实例
10.3.1 训练数据
10.3.2 实例代码
第11章 Spark MLlib LDA主题模型算法
11.1 LDA主题模型算法
11.1.1 LDA概述
11.1.2 LDA概率统计基础
11.1.3 LDA数学模型
11.2 GraphX基础
11.3 源码分析
11.3.1 建立LDA主题模型
11.3.2 优化计算
11.3.3 LDA模型
11.4 实例
11.4.1 训练数据
11.4.2 实例代码
第12章 Spark MLlib FPGrowth关联规则算法
12.1 FPGrowth关联规则算法
12.1.1 基本概念
12.1.2 FPGrowth算法
12.1.3 演示FP树构建
12.1.4 演示FP树挖掘
12.2 源码分析
12.2.1 FPGrowth类
12.2.2 关联规则挖掘
12.2.3 FPTree类
12.2.4 FPGrowthModel类
12.3 实例
12.3.1 训练数据
12.3.2 实例代码
第13章 Spark MLlib ALS交替最小二乘算法
13.1 ALS交替最小二乘算法
13.2 源码分析
13.2.1 建立ALS
13.2.2 矩阵分解计算
13.2.3 ALS模型
13.3 实例
13.3.1 训练数据
13.3.2 实例代码
第14章 Spark MLlib协同过滤推荐算法
14.1 协同过滤推荐算法
14.1.1 协同过滤推荐概述
14.1.2 用户评分
14.1.3 相似度计算
14.1.4 推荐计算
14.2 协同推荐算法实现
14.2.1 相似度计算
14.2.2 协同推荐计算
14.3 实例
14.3.1 训练数据
14.3.2 实例代码
第15章 Spark MLlib神经网络算法综述
15.1 人工神经网络算法
15.1.1 神经元
15.1.2 神经网络模型
15.1.3 信号前向传播
15.1.4 误差反向传播
15.1.5 其他参数
15.2 神经网络算法实现
15.2.1 神经网络类
15.2.2 训练准备
15.2.3 前向传播
15.2.4 误差反向传播
15.2.5 权重更新
15.2.6 ANN模型
15.3 实例
15.3.1 测试数据
15.3.2 测试函数代码
15.3.3 实例代码
封底
没有回复内容