Skip to content

概率论与数理统计

参考资料

  • 宋浩 - 应试, 有些冗余 - 3

基本概念

  • 频率 / 概率 / 独立性
  • 古典概型 / 几何概型 (有点离散 / 连续的意思)
  • 条件概率
  • 全概率: \(P (A) = \sum_{i=1}^n P (A|B_i) P (B_i) \quad ({B_i}\text {为完备事件组})\)
  • 贝叶斯: \(P (B_k|A) = \frac {P (A|B_k) P (B_k)}{\sum_{i=1}^n P (A|B_i) P (B_i)}\)

分布

  • 概率函数 描述概率累加
  • 概率密度函数 (导数) 描述概率
  • 二维函数 可求偏导 (边缘密度函数 \(f_X (x) = \int_{-\infty}^\infty f (x,y) dy\)) 可用于判断独立
  • 期望: \(E (X) = \sum x_k p (x_k) \ \int x f (x) dx\)
  • 方差: \(D (X) = E \left [ (X-E (X))^2 \right ]\)
  • 协方差 描述互相影响程度
  • 相关系数 描述互相影响程度

样本

  • 统计量 (样本的一个特征)
  • 切比雪夫不等式 (随机变量偏离均值的程度的概率) 可见均值与方差之重 \(P (|X-E (X)| \geq \epsilon) \leq \frac {D (X)}{\epsilon^2}\)
  • 大数定律 (均值收敛期望)
  • 中心极限定理 (大量独立随机变量和近似正态分布)

抽样分布

  • 正态分布 (样本均值服从自身)
  • 卡方分布 (正态样本方差与分布方差的比值)
    • \(\chi^2 (n) = \sum_{i=1}^n Z_i^2 \quad (Z_i \sim N (0,1))\)
  • t 分布 (正态样本量小时, 对应的标准正态分布化的结果, 更易偏移)
    • \(T = \frac {\bar {X}-\mu}{S/\sqrt {n}} \sim t (n-1)\)
  • F 分布 (卡方 /n 的比值)
    • 根据大数定律与上两个分布取样越多越稳定,F 分布可以描述不同取样量的两个样本的方差的比
    • \(F (m,n) = \frac {\chi^2 (m)/m}{\chi^2 (n)/n}\)
  • 借助以上技术, 可以拟合统计量为特征 (矩估计), 可以估计特征值在某区间的概率 (区间估计), 构造函数使所有样本的发生概率最大 (极大似然估计)
  • 以及校验假设 (关于统计量) 相对样本的发生概率 (假设检验)

离散型分布

0-1分布 (伯努利分布)

  • 参数: 成功概率 \(p \in [0,1]\)
  • PMF:
\[ P(X=k) = \begin{cases} p & k=1 \\ 1-p & k=0 \end{cases} \]
  • 期望: \(E(X) = p\)
  • 方差: \(D(X) = p(1-p)\)

二项分布 $ B(n,p) $

  • 参数: 试验次数 $n \in \mathbb{N}^* $, 成功概率 $ p \in [0,1]$
  • PMF: \(P(X=k) = \binom{n}{k} p^k (1-p)^{n-k} \quad (k=0,1,...,n)\)
  • 期望: \(E(X) = np\)
  • 方差: \(D(X) = np(1-p)\)

泊松分布 $ P(\lambda) $

  • 参数: 发生率 \(\lambda > 0\)
  • PMF: \(P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!} \quad (k=0,1,2,...)\)
  • 期望: \(E(X) = \lambda\)
  • 方差: \(D(X) = \lambda\)

几何分布

  • 参数: 成功概率 \(p \in (0,1)\)
  • PMF: \(P(X=k) = (1-p)^{k-1} p \quad (k=1,2,...)\)
  • 期望: \(E(X) = \frac{1}{p}\)
  • 方差: \(D(X) = \frac{1-p}{p^2}\)

超几何分布

  • 参数: 总体量 \(N\), 成功元素数 \(K\), 抽样数 \(n\)
  • PMF: \(P(X=k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}} \quad (k = \max(0,n+K-N),...,\min(n,K))\)
  • 期望: \(E(X) = n\frac{K}{N}\)
  • 方差: \(D(X) = n\frac{K}{N}\left(1-\frac{K}{N}\right)\frac{N-n}{N-1}\)

连续型分布

均匀分布 \(U(a,b)\)

  • 参数: 区间端点 \(a < b\)
  • PDF:
\[ f(x) = \begin{cases} \frac{1}{b-a} & x \in [a,b] \\ 0 & \text{其他} \end{cases} \]
  • 期望: \(E(X) = \frac{a+b}{2}\)
  • 方差: \(D(X) = \frac{(b-a)^2}{12}\)

正态分布 \(N(\mu,\sigma^2)\)

  • 参数: 均值 \(\mu \in \mathbb{R}\), 方差 \(\sigma^2 > 0\)
  • PDF: \(f(x) = \frac {1} {\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2 \ sigma^2}}\)
  • 期望: \(E(X) = \mu\)
  • 方差: \(D(X) = \sigma^2\)

指数分布 \(Exp(\lambda)\)

  • 参数: 率参数 \(\lambda > 0\)
  • PDF:
\[ f(x) = \begin{cases} \lambda e^{-\lambda x} & x \geq 0 \\ 0 & x < 0 \end{cases} \]
  • 期望: \(E(X) = \frac{1}{\lambda}\)
  • 方差: \(D(X) = \frac{1}{\lambda^2}\)