回答思路
EM算法解决问题的思路是使用启发式的迭代方法,既然我们无法直接求出模型分布参数,那么我们可以先猜想隐含参数(EM 算法的E步),接着基于观察数据和猜测的隐含参数一起来极大化对数似然,求解我们的模型参数(EM算法的M步)。由于我们之前的隐含参数是猜测的,所以此时得到的模型参数一般还不是我们想要的结果。我们基于当前得到的模型参数,继续猜测隐含参数(EM算法的E步),然后继续极大化对数似然,求解我们的模型参数(EM算法的M步)。以此类推,不断的迭代下去,直到模型分布参数基本无变化,算法收敛,找到合适的模型参数。 例如: 先设定男生和女生的身高分布参数(初始值),例如男生的身高分布为 N(p=172=52),女生的身高分布为N(2=162,吃=52),当然了,刚开始肯定没那么准;然后计算出每个人更可能属于第一个还是第二个正态分布中的(例如,这个人的身高是180那很明显,他极大可能属于男生),这个是属于Expectation 一步。 我们已经大概地按上面的方法将这200个人分为男生和女生两部分,我们就可以根据之前说的极大似然估计分别对男生和女生的身高分布参数进行估计,这步称为 Maximization。 然后,当我们更新这两个分布的时候,每一个学生属于女生还是男生的概率又变了,那么我们就再需要调整E步。 如此往复,直到参数基本不再发生变化或满足结束条件为止。 答案解析 这道题考验EM算法,EM的意思是“Expectation Maximization"。只要将EM算法的大致流程描述清楚即可