讨论 2020-12-16 = ###### tags: `tutorials` `Fudan` `2020` # 经典模型及算法导览 (六) ## 监督学习,半监督,弱监督,无监督,强化学习 机器学习中有很多不同的场景,而其中比较常见的分类方法是根据数据标注情况来的: - 监督学习:训练集中所有数据都带有人工标注 - 半监督:训练集中部分数据带有人工标注 - 弱监督:训练集中所有数据都带有人工标注,但标注内容与任务所需有差别,比如要求检测一张图片中的所有物体,但标注只标出了一个 - 无监督:训练集中所有数据都不带人工标注,由人设计的规则得到的标注不算人工标注 - 强化学习:强化学习所采用的的监督信号与上述都有差异,一般认为强化学习没有固定的训练集,而是不停与环境交互,得到反馈 ### 监督学习 监督学习是最常用,但也是成本最高的,大部分机器学习都适用于监督学习的场景,也是最容易接近实际任务需求的。 ### 半监督学习 半监督指的是有一部分标注数据,但同时也有一部分无标注数据,比如在翻译中,有中英对照的译文(标注数据)也有单纯的中文语料库(无标注数据)。又或者,需要从照片中识别物体,有一部分是有人工标注出哪些位置有什么物体的(标注数据),而另一部分是单纯的图像(无标注数据)。这些都属于典型的半监督学习。 当然,还有一些更为的特殊的场景,比如二类分类问题中,只有正样本。也就是Positive Unlabel (PU) Learning,需要相应的算法来应对。 ### 弱监督学习 弱监督,即指标注数据不是任务所需的,比如让找东西,结果标注只是在哪个附近。或者给质量打分(10分制),但标注是优良中差。简单来说,弱监督的特点是答非所问,但也有点联系。我个人认为,distant learning也属于这一范畴。 ### 无监督学习 无监督,即没有人工标注,但不是没有标注,我们同样需要label和监督信号,只不过他不是人工提供的。所以“无监督”指的是“无人工监督”而不是没有监督。所以只要是不需借助人工就可以提供标注的方法都是无监督学习。像Auto encoder,Language model 都属于无监督学习,他们的label可以从数据本身推测得到,而不需任何人工参与。当然,无监督的界定也有模糊的时候,比如借助人工编写的规则,在网上自动爬取数据,算不算无监督?这其实不好说,大家标准不一样,主要看人工编写的规则是不是很复杂,是不是通用,包含了多少知识等。 ### 强化学习 强化学习没有固定的训练集这一概念,他给了模型一个可以交互的环境,模型做任何事情都会从环境中获得相应的反馈,而这些反馈就是监督信号。交互与自由探索是强化学习的特色。 https://cs.stanford.edu/people/karpathy/convnetjs/demo/rldemo.html ### 半监督学习范式 半监督学习大部分都遵循几种范式 - 无标注数据上的预训练+有标注数据上的监督学习 - 无监督与有监督的多任务学习 - 有监督学习预热,再无监督学习 ### 弱监督学习范式 弱监督学习范围很广,每种场景的处理方法都不同,这里指介绍两种常见的 - 标注不完整 - 标注粒度不对 - 标注有噪声 ## 预告 ### Distant learning ### PU learning ### Learning with noise
×
Sign in
Email
Password
Forgot password
or
Sign in via Google
Sign in via Facebook
Sign in via X(Twitter)
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
Continue with a different method
New to HackMD?
Sign up
By signing in, you agree to our
terms of service
.