首页 1 2 3 4 5 6 7

MCMC采样详解

一、目录

1、采样方法的原理

2、常见的几种蒙德卡罗采样方法

a.均匀采样

b.接受-拒绝采样

c.重要性采样

3、马尔科夫链简介

4、MCMC算法

a.Metropolis-Hasting算法

b.Gibbs Sampling算法

二、采样方法的原理

我们通常求一个积分时，对于可以直接积分出来的函数是非常好求解的，但是当我们遇到一个积分不好算或者说根本积分积不出来的函数 $p ( x ) p(x) 时，我们应该怎么做呢？我们的方法就是通过采样的方法来计算他的积分，我们假设X是一个随机变量，他的概率密度函数是 p ( x ) p(x) ，我们要求解的是函数 f ( x ) f(x) 的积分： ∫ a b f ( x ) d x \int^b_a{f(x)}{\rm d}x$

三、常见的蒙德卡罗采样方法

a、均匀采样（略）

在这里就步过多阐述，在matlab中可以直接生成均匀分布 $中的随机数。$

b、接受-拒绝采样

对于一个未知的分布 $p ( x ) p(x) ，我们采样不容易进行，所以在这里我们就要引入一个 q ( x ) q(x) 分布，被称之为提议分布(proposal distribution).（注：我们提出的 q ( x ) q(x) 的分布是一个已知的，易于采样的，比如所高斯分布），然后根据一定的规则，我们接受一部分样本，拒绝一部分样本。具体的算法如下： a、首先选取一个已知的分布 q ( x ) q(x) 并且取一个常数K使得对于所有的x都有 K q ( x ) ≥ p ( x ) Kq(x)\geq p(x)$

当我们在一定的采样频率条件下，要求提高采样的精度，此时我们就应该用到重要性采样，假设我们已知x服从 $p ( x ) p(x) 的概率分布，但是 p ( x ) p(x) 比较复杂，不容易采样得到样本x，那我由此我们引入一个与 p ( x ) p(x) 有相同定义域的概率分布 q ( x ) q(x) ，我们将 p ( x ) q ( x ) \frac{p(x)}{q(x)}$

四：马尔科夫链简介

马尔科夫链实际上是一个概率图模型，他是状态空间中一个状态转向另一个状态的随机过程，如下图所示（描述的是三个状态之间的转移）：

在这里插入图片描述

各个状态之间转移的概率可以构成状态转移矩阵 $a_{ij}$

马尔科夫链平稳状态

以上面三个状态为例，假设一开始我们选择初始概率分布 $\pi(0)$

五、MCMC算法

基本想法：
假设目标是对一个概率分布进行随机抽样或者求的是函数关于该概率分布的数学期望，我们可以采用传统的蒙德卡罗的采样方法，比如说：接受-拒绝采样、重要性采样等等。当然我们也可以用马尔可夫链蒙德卡罗采样法。他一般来说更适用于随机变量是多元的、密度函数是非标准的（无法直接采样的）等情况。
我们假设多元随机变量x，其概率密度函数是 $p ( x ) p(x) ， f ( x ) f(x) 为定义在多元随机变量定义域上的函数，现在我们的目标是要得到关于概率分布 p ( x ) p(x) 的样本集合，或者是求得 f ( x ) f(x) 关于概率密度 p ( x ) p(x) 的期望 E p ( x ) [ f ( x ) ] E_{p(x)}[f(x)]$

a、Metropolis-Hasting算法

首先先定义采样时刻t-1的采样值为 $，t时刻的采样值为，所以对于要抽样的概率分布,采用转移核为的马尔科夫链：$

b、Gibbs Sampling算法(多元的，Metropolis-Hasting算法是其一个特例)