Skip to content

概率论与数理统计

Chap1 概率论的基本概念

概率的加法公式

\[ P(A \cup B)=P(A)+P(B)-P(AB) \]
\[ P(A \cup B \cup C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC) \]
\[ P( \cup_{j=1}^{n} A_j)= \sum_{j=1}^{n} P(A_j) -\sum_{i<j}P(A_i A_j) + \sum_{i<j<k} P(A_i A_j A_k)-...+(-1)^{n-1}P(A_iA_2...A_n), \quad n \ge 1 \]

全概率公式

\[ P(A)=\sum_{j=1}^{n}P(B_j)P(A|B_j) \]

贝叶斯公式

\[ P(B_k|A)=\frac{P(B_kA)}{P(A)}=\frac{P(B_k)P(A|B_k)}{\sum_{j=1}^n P(B_j)P(A|B_j)} \]

Chap2 随机变量及其概率分布

离散型随机变量

0-1(p) 分布

\[ P\{x=k\} = p^k(1-p)^k, \quad k=0,1 \]

记为 \(X \sim 0-1(p)\)

二项分布

\[ P\{X=k \}=C_n^kp^k(1-p)^{n-k} \]

记为 \(X \sim B(n,p)\)

泊松分布

\[ P\{X=k\}= \frac{e^{-\lambda} \lambda^{k}}{k!}, \quad k=0,1,2... \]

记为 \(X \sim P(\lambda)\)

泊松定理

n 充分大,p 足够小时

\[ C _n^k p^k (1-p)^{n-k} \approx \frac{e^{-\lambda} \lambda^k}{k!} \]

其中 \(\lambda = np\)

超几何分布

\[ P\{ X=k\} = \frac{C_a^k C_b^{n-k}}{C_N^n}, \quad k=l_1,l_1+1,...l_2 \]

其中 \(l_1 = \max(0,n-b), l_2=\min (a,n)\)

记为 \(H(n,a,N)\)

几何分布

\[ P\{ X=k\}=p(1-p)^{k-1} \]

随机变量的概率分布函数

概率分布函数

\[ F(x)=P\{X \le x\} = \sum_{x_i \le x} P\{X=x_i\} \]

\(F(x+0)=F(x)\), \(F(x)\) 是右连续函数

\(F(x)-F(x-0)=P\{X=x\}\)

连续性随机变量

概率密度函数

\[ F(x)=\int_{- \infty}^x f(t)dt \]

\(P\{x_1 < X \le x_2\}= F(x_2) -F(x_1)=\int_{x_1}^{x_2} f(t)dt\)

在连续点 \(x\) 处,\(F^{\prime}(x)=f(x)\)

均匀分布

\[ f(x)=\left\{ \begin{aligned} \frac{1}{b-a}, x \in (a,b) \\ 0, 其他 \end{aligned} \right. \]

正态分布

\[ f(x)= \frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/ (2 \sigma^2)}, \quad |x|< + \infty \]

记为 \(X \sim N(\mu, \sigma^2)\)\(\mu\)为位置参数,\(\sigma\)为尺度参数

\(Z \sim N(0,1)\) 为标准正态分布

\[ \phi (x)=\frac{1}{\sqrt{2 \pi}} e^{-x^2/2}, \quad |x|< + \infty \]
\[ \Phi(x) = \int_{- \infty}^{x} \frac{1}{\sqrt{2\pi}} e^{-t^2/2}ddt \]
\[ P\{ a<x<b\} = \Phi(\frac{b-\mu}{\sigma}) - \Phi (\frac{a-\mu}{\sigma}) \]

指数分布

\[ f(x)=\left\{ \begin{aligned} \lambda e^{-\lambda x}, x>0 \\ 0, x<0 \end{aligned} \right. \]

记为 \(X \sim E(\lambda)\)

\[ F(x)=\left\{ \begin{aligned} 1-e^{-\lambda x}, x>0 \\ 0, x\le 0 \end{aligned} \right. \]

\(P\{X > t_0 +t\}=P\{X>t_0\}\cdot P\{X > t\}\)

随机变量函数的分布

Note

已知 \(Y=g(X)\) \(X\) 的密度函数,求 \(F_Y(y)\) \(f_Y(y)\) 1. 求\(\{Y \le y\}\)的等价事件 2. 求\(F_Y(y)\) 3. 求导得\(f_y(y)\)

定理

\[ f_Y(y) = \left\{ \begin{aligned} f_X(h(y)) \cdot |h^{\prime}(y)|, y\in D \\ 0, y \notin D \end{aligned} \right. \]

Chap3 多维随机变量及其分布

二元离散型随机变量

联合分布 边际分布 条件分布

二元随机变量的分布函数

联合分布函数

\[ F(x,y) = P\{X \le x, Y \le y\} \]

边际分布函数

\[ F_X(x) = F(x, + \infty) \]
\[ F_Y(y) = F(+\infty ,y) \]

条件分布函数

\[ F_{Y|X}(y|x_i)= P\{Y \le y|X =x_i\} \]

二元连续型随机变量的联合分布

联合密度函数

\[ F(x,y)= \int_{- \infty}^{x} \int_{- \infty}^{y} f(u,v)dudv \]

\(f(x,y)\) 的连续点上有

\[ \frac{\partial^2 F(x,y)}{\partial x \partial y}=f(x,y) \]

\((X,Y)\) 落入 \(xOy\) 平面任意区域 \(D\) 的概率为

\[ P\{ (X,Y) \in D\} = \iint_D f(x,y)dxdy \]

边际分布

\[ f_X(x)=\int_{- \infty}^{+\infty}f(x,y)dy \]
\[ f_Y(y)=\int_{- \infty}^{+ \infty}f(x,y)dx \]

条件分布

\[ f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)} \]

随机变量的独立性

相互独立

\[ P\{X \le x, Y \le y\}=P\{X \le x\}\cdot P\{Y \le y\} \]

\(F(x,y)=F_X(x)\cdot F_Y(y)\) 时,\(X\)\(Y\) 相互独立

\(f(x,y)=f_X(x)\cdot f_Y(y)\) 几乎处处相等为连续型随机变量为 XY 相互独立的等价定义

二元随机变量函数的分布

\(Z=X+Y\) 的分布

\(M=\max(X,Y)\) 的分布

\[ F_M(t)=\prod_{i=1}^{n} F_i(t) \]

\(N=\min(X,Y)\) 的分布

\[ F_N(t)=1-\prod_{i=1}^{n}[1-F_i(t)] \]

Chap4 随机变量的数字特征

数学期望

\[ E(X)=\sum_{i=1}^{+\infty}x_ip_i=\int_{-\infty}^{+\infty}xf(x)dx \]

泊松分布:\(E(X)=\lambda\) 指数分布:\(E(X)=\frac{1}{\lambda}\) 标准正态分布:\(E(x)=0\)

方差、变异系数

\[ Var(X)=\sum_{i=1}^{+\infty}(X_i-E(X))^2p_i=\int_{-\infty}^{+\infty}(x-E(X))^2f(x)dx \]
\[ Var(X)=E(X^2)-(E(X))^2 \]

泊松分布:\(Var(X)=\lambda\) 指数分布:\(Var(X)=\frac{1}{\lambda^2}\) 标准正态分布:\(Var(X)=1\) 二项分布:\(Var(X)=np(1-p)\) 正态分布:\(Var(X)=\sigma^2\) 均匀分布:\(Var(X)=\frac{(b-a)^2}{12}\)

协方差与相关系数

协方差

\[ \begin{aligned} &Cov(X,Y)=E[(X-E(X))(Y-E(Y))] \\ &=E(XY)-E(X)E(Y) \end{aligned} \]

满足以下性质:

\[Var(\sum_{i=1}^{n}X_i)=\sum_{i=1}^{n} Var(X_i)+2\sum_{1\le i< j \le n}Cov(X_i,X_j)\]

\(Cov(X,Y)=Cov(Y,X)\) \(Cov(X,X)=Var(X)\) \(Cov(aX,bY)=abCov(X,Y)\) \(Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)\)

相关系数

\[ \rho_{XY} =\frac{Cov(X,Y)}{\sqrt{Var(X)}\sqrt{Var(Y)}} \]

不相关

\(\rho_{XY}=0\) \(Cov(X,Y)=0\) \(E(XY)=E(X)E(Y)\) \(Var(X+Y)=Var(X)+Var(Y)\)

Note

独立可以推出不相关,不相关无法推出独立,因为相关是“线性相关性”。

其他数字特征

k 阶(原点)矩

\[ \mu_k=E(X^k) \]

k 阶中心矩

\[ v_k=E[(X-E(X))^k] \]

k+l 阶混合(原点)矩

\[ E(X^kY^l) \]

k+l 阶混合中心矩

\[ E[(X-E(X))^k(Y-E(Y))^l] \]

Chap5 大数定律及中心极限定理

大数定律

马尔可夫不等式

\[P\{|Y| \ge \varepsilon\} \le \frac{E(|Y|^k)}{\varepsilon^k} \]

切比雪夫不等式

\[ P\{ |X-\mu| \ge \varepsilon\}\le \frac{\sigma^2}{\varepsilon^2} \]
\[ P\{|X-E(X)| \ge \varepsilon \} \le \frac{Var(X)}{\varepsilon^2} \]

伯努利大数定律

\[ \lim_{n \rightarrow +\infty}P\{ |\frac{n_A}{n}-p|\ge \varepsilon\} =0 \]

辛钦大数定律

\[ \lim_{n\rightarrow +\infty}P\{|\frac{1}{n}\sum_{i=1}^{n}h(X_i)-a|\ge \varepsilon\}=0 \]

中心极限定理

林德伯格 - 莱维中心极限定理

\[ \lim_{n \rightarrow +\infty}P\{{\frac{\sum_{i=1}^n X_i - E(\sum_{i=1}^n X_i)}{\sqrt{Var(\sum_{i=1}^n X_i)}}\le x}\}=\lim_{n \rightarrow +\infty}P\{\frac{\sum_{i=1}^{n} X_i-n\mu}{\sigma\sqrt{n}}\le x\}=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{t^2}{2}}dt=\Phi(x) \]

也称为独立同分布的中心极限定理

棣莫弗 - 拉普拉斯中心极限定理

\[ \lim_{n \rightarrow +\infty}P\{\frac{n_A-np}{\sqrt{np(1-p)}} \le x\}=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^x e^{-\frac{t^2}{2}}dt=\Phi(x) \]

李雅普诺夫中心极限定理

\[ \lim_{n\rightarrow +\infty}P\{\frac{1}{B_n}\sum_{i=1}^{n}(X_i-\mu_i)\le x\}=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{t^2}{2}}dt=\Phi(x) \]

Chap6 统计量与抽样分布

随机抽样与统计量

样本方差

\[ S^2 = \frac{1}{n-1} \sum_{i=1}^{n}(X_i-\bar{X})^2=\frac{1}{n-1}(\sum_{i=1}^{n} X_i^2 - n\bar{X}^2) \]

样本标准差

\[ S=\sqrt{S^2} \]

样本 k 阶(原点)矩

\[ A_k=\frac{1}{n}\sum_{i=1}^{n}X_i^k, \quad k=1,2... \]

样本 k 阶中心矩

\[ B_k=\frac{1}{n} \sum_{i=1}^n (X_i-\bar{X})^k, \quad k=2,3... \]

\(\chi^2\) 分布,\(t\) 分布,\(F\) 分布

\(\chi^2\) 分布

\[Y=X_1^2+X_2^2+...X_n^2 \sim\chi^2(n) \]

其中 \(X_1,X_2...X_n\) 为独立同分布的随机变量,且都服从 \(N(0,1)\)

\(t\) 分布

\[ t=\frac{X}{\sqrt{Y/n}}\sim t(n) \]

其中 \(X\sim N(0,1)\)\(Y\sim \chi^2(n)\)

\(F\) 分布

\[ F=\frac{U/n_1}{V/n_2}\sim F(n_1,n_2) \]

其中 \(U\sim \chi^2(n_1)\)\(V\sim \chi^2(n_2)\)

正态总体下的抽样分布

\[ \bar{X} \sim N(\mu, \frac{\sigma^2}{n}) \]
\[ \frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) \]
\[ \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}\sim F(n_1-1,n_2-1) \]

Chap7 参数估计

点估计

矩法

本质是用样本矩作为总体矩的估计

极大似然法

Note

  1. 写出样本似然函数
  2. 取对数
  3. 求驻点

估计量的评价准则

无偏性

无偏估计量

\[ E(\bar{\theta})=\theta \]

有效性

区间估计

置信区间的定义

枢轴量法

正态总体参数的区间估计

Note

  1. 提出假设
  2. 选检验统计量
  3. 得拒绝域

非正态总体参数的区间估计

Chap8 假设检验

假设检验的基本思想

单个正态总体参数的假设检验

两个正态总体参数的假设检验

假设检验与区间估计

拟合优度检验

评论区

如果有什么问题或想法,欢迎大家在下方留言~