统计学习方法理解2

Posted by Jianghaowen on August 10, 2019

在进行无监督学习时,我们的最优模型可以为p(z|x)的条件概率分布密度,也可以是p(x|z)的条件概率分布密度,也就是说我们既可以由因变量去预测自变量,也可以由自变量预测因变量,例如一个系统我们既可以做一个系统去确认人的身份(因变量预测自变量),也可以做一个系统去创造绘画(自变量预测因变量)。
强化学习实质是一个在不停运作中寻找最优的过程,可以通过求解最优策略或者找出最优价值函数来学习。


X