机器学习 01 概论 木灵的炼金工作室

机器学习是通过计算机程序从有限的数据用例中总结出一般规律,并使用这一规律进行预测的方法。

机器学习模型

浅层学习

机器学习主要关注的问题是:如何从传入数据的模式推导出预测数据的方法。
我们想到,如果传入数据可以表示为一种“键-值对”的模式,那么预测模型的构建将会变得容易。

所以我们可以对输入的用例进行一些处理,将输入的实际信息(比如图片、音频等)转化为计算机可识别的特征。在某些机器学习算法中,这种特征提取方法是人工定义的,而寻找提取方式的过程往往很漫长,这样的算法称为浅层学习。

表示学习

而若一种算法可以基于给出的用例,自动改进或生成特征提取的方法,并最终提高机器学习模型的性能,这种学习称为表示学习。

然而表示学习仍然无法避开“如何将输入的具体信息抽象化”这一问题,即:我们应当如何结合具体信息与抽象概念?或者:怎么样提取一个具体信息的特征才是恰当的?这一问题称为语义鸿沟

深度学习

将修改提取策略的表示学习与浅层学习结合,即深度学习。

深度学习可以避免浅层学习中对于构建“特征提取方法”的大量时间消耗。

深度学习关心的关键问题是“贡献度分配”问题,即判断输入信息中哪一些变量对结果的影响大,哪一些变量对结果的影响小。目前,深度学习采用神经网络模型。

人工神经网络

在生命科学视角看来,人类的学习过程就是反复加强某些神经回路,同时削弱某些神经回路的过程。根据这种模式,人工神经网络的概念被提出了。它可以基于输入,对数据的关系进行模型建立,依据最后的关系强度而得出上述的贡献度


Copyright AmachiInori 2017-2021. All Right Reserved.
Powered By Jekyll.
amachi.com.cn