摘要: 本文是一份针对初学者的数据统计分析理论基础笔记📒,涵盖了数据统计分析的概率和分布、抽样与估计、假设检验、回归分析与方差分析、主成分分析与因子分析。笔记源自大数据学习实践课(中级),其中的配图来自:课程ppt或者当时听课自制的思维导图,该博文图、公式偏多🍃每当面对专业迷茫时,大数据导论的大饼🫓总是让我遐想拥有改变世界的能力hhh…
一、概率和分布
概率
- 概率论基础/独立事件/条件概率/全概率公式/贝叶斯定律
○ 事件A或事件B发生的概率
○ 事件A与事件B不发生的概率
○ 条件概率
○ 全概率公式
○ 贝叶斯定理
- 公式
分布
1.数据分布
几何分布
二项分布
柏松分布
2.正态分布
3.正态分布概率计算
4.经验法则
大约68%的数值位于距离均值1个标准差的范围内
二、抽样与估计
统计抽样
点量估计
比例抽样分布
参数估计
参数估计问题
参数估计的方式
点估计
(1 方法
a.矩估计
b.极大似然估计
(2 评价标准
a.无偏性
b.有效性
c.相合性
区间估计
a.区间估计的概念
b.正态总体的区间估计
三、假设检验
假设检验问题
假设检验
置信区间
置信区间计算
统计量+-误差范围误差范围计算
六步骤
假设检验的两类错误
四、回归分析与方差分析
回归分析
回归的定义
Francis Galton
线性回归
模型的一般形式
a.回归模型的一般形式
b.几个基本假设
c.一元线性回归模型
参数估计:最小二乘估计
定义:
方差分析
- 定义
- 假设检验
- 组内偏差与组间偏差
- 单因素方差分析的步骤
五、主成分分析与因子分析
主成分分析
- 基本思想
- 数学模型
- 主成分分析步骤
因子分析
- 介绍
- 目的
- 因子分析模型
- 因子分析与主成分分析的联系
- 二者区别
- 因子分析步骤
🌿至此数据统计理论基础笔记📒就介绍完啦~
-------------本文结束感谢您的阅读-------------
本文作者:
金金
本文链接: http://example.com/2023/05/22/数据统计分析理论基础/
版权声明: 本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。转载请注明出处!
本文链接: http://example.com/2023/05/22/数据统计分析理论基础/
版权声明: 本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。转载请注明出处!