大数据分析挖掘技术介绍 |
1、map/reduce
2、mahout数据挖掘
3、sql on hadoop
4、spark生态体系
5、R语言
6、MPI并行计算
7、GPU并行计算(深度学习)
8、java并行计算框架 |
常用机器学习算法原理 |
1、决策树
2、随机森林
3、协同过滤推荐算法(余弦相似、修正余弦)
4、Jaccard算法
5、朴素贝叶斯算法
6、k-means聚类算法
7、pagerank算法
8、逻辑回归
9、图计算 |
大数据挖掘业务场景和生产平台 |
1、互联网金融业务—如何构建阿里金融系统
2、银行客户需求业务
3、大数据分析生产平台
4、推荐/广告系统的原理、架构、模型、验证等。
5、基于GBDT的组合模型架构 |
编程实践(动手) |
1、迭代类机器学习编程入门-求圆周率
2、pagerank的并行化实现(*)
3、逻辑回归算法的java实现
4、决策树c45,id3的java实现
5、随机森林和全树并行化实现
6、训练数据和结果模拟器
7、模型结果规则化处理
8、协同过滤java实现
9、基于图计算的推荐java实现 |