论文标题
概率变压器
Probabilistic Transformers
论文作者
论文摘要
我们表明,变压器是高斯模型混合物的最大后验概率估计器。这为变压器带来了概率的观点,并建议向其他概率案例扩展。
We show that Transformers are Maximum Posterior Probability estimators for Mixtures of Gaussian Models. This brings a probabilistic point of view to Transformers and suggests extensions to other probabilistic cases.