统计学基本原理 |
- 何谓研究
- 常见的研究名词:概念性架构、模型、操作型定义、变量、命题与假设
- 问卷设计原则与操作
- 研究中常见的变量:自变量、依变量、中介变量、干扰变量及控制变量
- 统计分析常用的名词:平均数、众数、方差、协方差、标准偏差、标准误
- 测量尺度的应用:名目尺度、顺序尺度、区间尺度及比例尺度
- 估计(Confidence Interval, CI)与检定(P-value)
- 自由度 9. 统计的假设:常态、同质、独立 10. 信度
- 效度:表面效度、内容效度、效标效度、建构效度(收敛效度及区别效度
|
R语言基础 |
- R简介、数据类型介绍、R的数据可视化、常用R包介绍。R集成开发环境
- 数据整理:数据的读入输出、控制流、各种图表,常用统计量计算
- 数据展现1:基本制图函数综述、理解关键制图参数
|
R语言数据可视化 |
- 数据展现2:散点图、线图与时间序列谱图,案例:股价走势可视化展现
- 数据展现3:柱形图,点图,饼图,直方图,案例:销售数据可视化展现
- 数据展现4:箱线图,热力图,等高线,地图,案例:Facebook好友联系图
|
Logistic回归与商业大数据建模 |
- Logistic回归是商业建模的常用重要数据挖掘方法,本讲要讲清楚Logistic回归的建模原理、与多元线性模型的区别、R语言实现过程及回归诊断注意事项、预测方法和结果解释,让学员彻底地掌握Logistic回归解决问题的R语言方法。
- 主要案例:
- 案例2:利用Logistic回归分析网页点击流量
- 案例3:利用Logistic回归分析婚外情
|
关联规则和R语言实现 |
- 关联规则(著名的“啤酒和尿布”)是数据挖掘的基础和核心技术之一,本讲将着重围绕经典的Apriori算法和eclat算法,阐明关联规则的支持、置信和提升程度与控制,使用R语言快速完成关联规则分析。
- 主要案例:
- 案例1:使用R语言关联规则方法帮助各个超市实现商品的最佳捆绑销售方案(即“购物篮”分析);
|
决策树(回归树)分析和随机森林R语言实现 |
- 决策树是数据挖掘的经典方法,其原理容易被理解。本讲主要讲授两种最为普遍的决策树算法:CART和C4.5算法,使用rpart和J48函数进行R语言分析。
- 主要案例:
- 案例1:对汽车销量走势预测
|
R语言聚类算法 |
- 在机器学习中,聚类算法包括,层次聚类法,谱系图,k平均值法,k中心法
- 是非常重要的算法模块
- 主要案例:
- 案例1:推荐系统
|