机器学习笔记00:机器学习问题 木灵的炼金工作室

机器学习是通过计算机程序从有限的数据用例中总结出一般规律,并使用这一规律进行预测的方法。

机器学习问题的分类

监督学习

监督学习的数据集中给出了”标记信息”:即数据的原象映射的结果。如年份-商品价格关系中的商品价格,大小-是否好瓜中的bool信息。

根据象空间(输出空间, 标记空间)的属性(连续 / 离散),可以将监督学习分为”回归问题”和”分类问题”。回归分析的输出空间是连续值的集合,聚类问题的输出空间是离散值的集合。

但监督学习中,无论是原始数据还是预测数据,其均有一个明确的”标记信息”(“输出值”)

无监督学习

无监督学习的数据集中未给出”标记信息”,也就是说相比于同问题的监督学习,其数据集和预测集中均缺少了若干维度的”结果信息”。

无监督学习又可以称为”聚类问题”,常见的应用为搜索引擎中的等价类/相关内容划分。

机器学习中常用的工具是Octave。


Copyright AmachiInori 2017-2021. All Right Reserved.
Powered By Jekyll.
amachi.com.cn