案例来源

本博客讲解的案例来源于Journal of the American Statistical Association期刊(顶刊)上的内容：

import numpy as np import seaborn as sns import matplotlib.pyplot as plt import matplotlib.mlab as mlab class gmm(): def __init__(self, data, num_clusters, sigma=1): '''initialization model parameters(m,s2,phi)--need update ''' self.data = data self.K = num_clusters self.n = data.shape[0] self.sigma = sigma self.phi = np.random.random([self.n,self.K]) # phi(matrix n*k) self.m = np.random.randint(np.min(data), np.max(data), self.K).astype(float) # m(matrix 1*k) self.s2 = np.random.random(self.K) # s2(matrix 1*k) def compute_elbo(self): '''calculate ELOB ''' p1 = -np.sum((self.m**2 + self.s2) / (2 * self.sigma**2)) p2 = (-0.5 * np.add.outer(self.data**, .m** + .s2) + np.outer(.data, .m))*(.phi) p3 = -np.(np.log(.phi)) p4 = np.( * np.(np.log(.s2))) elbo_c = p1 + np.(p2) + p3 + p4 elbo_c (): e = np.outer(.data, .m) + (- * (.m** + .s2))[np.newaxis, :] .phi = np.exp(e) / np.(np.exp(e), axis=)[:, np.newaxis] .m = np.(.data[:, np.newaxis] * .phi, axis=)/( / .sigma** + np.(.phi, axis=)) .s2 = / ( / .sigma** + np.(.phi, axis = )) (): elbo = [] elbo.append(.compute_elbo()) i (iters): .update_bycavi() elbo.append(.compute_elbo()) (, elbo[i]) np.(elbo[-] - elbo[-]) <= epsilon: (,i) elbo (): sns.set_style() i ((.n/size)): sns.distplot(data[size*i : (i+)*size], rug=) x = np.linspace(.m[i] - *.sigma, .m[i] + *.sigma, ) plt.plot(x,mlab.normpdf(x, .m[i], .sigma),color=) plt.show() __name__ == : number = clusters = mu = np.array([, , , , ]) data = [] i (clusters): data.append(np.random.normal(mu[i], , number)) data = np.concatenate(np.array(data)) model = gmm(data, clusters) model.trainmodel(, ) (, (model.m)) model.plot(number)

变分推断之高斯混合模型(案例及代码)

案例来源

DataLearner 官方微信

高斯混合模型(Mixture of Gaussians model,GMM)

变分推断

下界ELBO计算

类别参数$\varphi$更新

均值对应的参数的更新

完整的算法流程

程序

参考论文