摘要: 本文是一份针对初学者的数据统计分析理论基础笔记📒,涵盖了数据统计分析的概率和分布、抽样与估计、假设检验、回归分析与方差分析、主成分分析与因子分析。笔记源自大数据学习实践课(中级),其中的配图来自:课程ppt或者当时听课自制的思维导图,该博文图、公式偏多🍃每当面对专业迷茫时,大数据导论的大饼🫓总是让我遐想拥有改变世界的能力hhh…
一、概率和分布
概率
- 概率论基础/独立事件/条件概率/全概率公式/贝叶斯定律

○ 事件A或事件B发生的概率
○ 事件A与事件B不发生的概率
○ 条件概率
○ 全概率公式
○ 贝叶斯定理
- 公式

分布
1.数据分布
几何分布

二项分布

柏松分布

2.正态分布

3.正态分布概率计算

4.经验法则
大约68%的数值位于距离均值1个标准差的范围内
二、抽样与估计
统计抽样

点量估计

比例抽样分布

参数估计
参数估计问题

参数估计的方式

点估计
(1 方法
a.矩估计

b.极大似然估计


(2 评价标准
a.无偏性

b.有效性

c.相合性

区间估计
a.区间估计的概念

b.正态总体的区间估计

三、假设检验
假设检验问题


假设检验
置信区间

置信区间计算
统计量+-误差范围误差范围计算

六步骤

假设检验的两类错误

四、回归分析与方差分析
回归分析
回归的定义

Francis Galton


线性回归

模型的一般形式
a.回归模型的一般形式


b.几个基本假设

c.一元线性回归模型

参数估计:最小二乘估计
定义:


方差分析
- 定义

- 假设检验

- 组内偏差与组间偏差

- 单因素方差分析的步骤

五、主成分分析与因子分析
主成分分析
- 基本思想

- 数学模型



- 主成分分析步骤

因子分析
- 介绍

- 目的

- 因子分析模型

- 因子分析与主成分分析的联系

- 二者区别

- 因子分析步骤

🌿至此数据统计理论基础笔记📒就介绍完啦~
-------------本文结束感谢您的阅读-------------
本文作者:
金金
本文链接: http://example.com/2023/05/22/数据统计分析理论基础/
版权声明: 本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。转载请注明出处!
本文链接: http://example.com/2023/05/22/数据统计分析理论基础/
版权声明: 本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。转载请注明出处!