您可以自由地共享和演绎本文稿, 只需遵守开源协议[CC By 4.0]
如果这篇文章帮助到你, 可以请我喝一杯咖啡~
机器学习是通过计算机程序从有限的数据用例中总结出一般规律,并使用这一规律进行预测的方法。
机器学习问题的分类
监督学习
监督学习的数据集中给出了”标记信息”:即数据的原象映射的结果。如年份-商品价格关系中的商品价格,大小-是否好瓜中的bool信息。
根据象空间(输出空间, 标记空间)的属性(连续 / 离散),可以将监督学习分为”回归问题”和”分类问题”。回归分析的输出空间是连续值的集合,聚类问题的输出空间是离散值的集合。
但监督学习中,无论是原始数据还是预测数据,其均有一个明确的”标记信息”(“输出值”)
无监督学习
无监督学习的数据集中未给出”标记信息”,也就是说相比于同问题的监督学习,其数据集和预测集中均缺少了若干维度的”结果信息”。
无监督学习又可以称为”聚类问题”,常见的应用为搜索引擎中的等价类/相关内容划分。
机器学习中常用的工具是Octave。