Dong Guo's Blog

日记2016/02/13:周志华老师的新书

| Comments

明天是2016春节后的第一个工作日,新年要有新气象,其中一件就是要多写博客,将每天的想法和收获总结下来。

今天在石家庄家里翻了翻周志华老师的新书《机器学习》,ML基础的内容基本都包括了,讲得比较通俗易懂,公式推导比比李航的《统计学习方法》更少一些。个人还是比较推荐的。

重点翻了翻半监督学习和强化学习这2章。做一些笔记如下

半监督学习

基于“相似的样本有相似的label”的合理假设,未标记样本为样本分布提供了信息,故可以提高有监督学习的效果。

一种典型的半监督学习模型是TSVM(Transductive SVM),其在目标函数中包含了未标注样本的松弛向量,求解方法类似于EM思想,E步对未标注样本进行预测,M步调整分类面;一个要点是未标注样本的预测结果通常是显然不如有标注样本的label靠谱的,所以在目标函数中这2类样本的松弛向量的权重有差别,且未标注样本的权重随着多轮迭代不断上升。

强化学习

强化学习的应用场景很广,比如曾经很火的Flappy Bird和最近很火的Google的AlphaGo(围棋AI)。

明天补充细节,碎觉

Comments