讨论 2020-12-16

讨论 2020-12-16 = ###### tags: `tutorials` `Fudan` `2020` # 经典模型及算法导览（六） ## 监督学习，半监督，弱监督，无监督，强化学习机器学习中有很多不同的场景，而其中比较常见的分类方法是根据数据标注情况来的： - 监督学习：训练集中所有数据都带有人工标注 - 半监督：训练集中部分数据带有人工标注 - 弱监督：训练集中所有数据都带有人工标注，但标注内容与任务所需有差别，比如要求检测一张图片中的所有物体，但标注只标出了一个 - 无监督：训练集中所有数据都不带人工标注，由人设计的规则得到的标注不算人工标注 - 强化学习：强化学习所采用的的监督信号与上述都有差异，一般认为强化学习没有固定的训练集，而是不停与环境交互，得到反馈 ### 监督学习监督学习是最常用，但也是成本最高的，大部分机器学习都适用于监督学习的场景，也是最容易接近实际任务需求的。 ### 半监督学习半监督指的是有一部分标注数据，但同时也有一部分无标注数据，比如在翻译中，有中英对照的译文（标注数据）也有单纯的中文语料库（无标注数据）。又或者，需要从照片中识别物体，有一部分是有人工标注出哪些位置有什么物体的（标注数据），而另一部分是单纯的图像（无标注数据）。这些都属于典型的半监督学习。当然，还有一些更为的特殊的场景，比如二类分类问题中，只有正样本。也就是Positive Unlabel (PU) Learning，需要相应的算法来应对。 ### 弱监督学习弱监督，即指标注数据不是任务所需的，比如让找东西，结果标注只是在哪个附近。或者给质量打分（10分制），但标注是优良中差。简单来说，弱监督的特点是答非所问，但也有点联系。我个人认为，distant learning也属于这一范畴。 ### 无监督学习无监督，即没有人工标注，但不是没有标注，我们同样需要label和监督信号，只不过他不是人工提供的。所以“无监督”指的是“无人工监督”而不是没有监督。所以只要是不需借助人工就可以提供标注的方法都是无监督学习。像Auto encoder，Language model 都属于无监督学习，他们的label可以从数据本身推测得到，而不需任何人工参与。当然，无监督的界定也有模糊的时候，比如借助人工编写的规则，在网上自动爬取数据，算不算无监督？这其实不好说，大家标准不一样，主要看人工编写的规则是不是很复杂，是不是通用，包含了多少知识等。 ### 强化学习强化学习没有固定的训练集这一概念，他给了模型一个可以交互的环境，模型做任何事情都会从环境中获得相应的反馈，而这些反馈就是监督信号。交互与自由探索是强化学习的特色。 https://cs.stanford.edu/people/karpathy/convnetjs/demo/rldemo.html ### 半监督学习范式半监督学习大部分都遵循几种范式 - 无标注数据上的预训练+有标注数据上的监督学习 - 无监督与有监督的多任务学习 - 有监督学习预热，再无监督学习 ### 弱监督学习范式弱监督学习范围很广，每种场景的处理方法都不同，这里指介绍两种常见的 - 标注不完整 - 标注粒度不对 - 标注有噪声 ## 预告 ### Distant learning ### PU learning ### Learning with noise