
将不打标签的相片给机器
通过学习,机器会把那些相片分为2类,一类都是狗的相片,一类都是猫的相片。虽然和旁边的监督学习看上去结果差不多,但是有着本质的区别:
非监督学习中,虽然相片分为了狗跟犬机器学习方法,但是机器并不晓得那个是狗,哪个是猫。对于机器来说,相当于分成了 A、B 两类。
机器可以将狗跟犬分开,但是并不知道那个是狗,哪个是猫
了解更多关于 非监督学习
强化学习
强化学习更接近生物学习的本质,因此有望荣获更高的智能。它关注的是智能体怎样在环境中采取一系列行为,从而荣获最大的累积收益。通过加强学习,一个智能体应当晓得在何种状态下应当采取何种行为。
最典型的场景就是打游戏。
2019年1月25日,AlphaStar(Google 研发的人工智能程序,采用了强化学习的训练方法) 完虐星际争霸的职业拳手职业拳手“TLO”和“MANA”。新闻链接
了解更多关于 强化学习
机器学习实战的7个方法
通过前面的内容,我们对机器学习早已有一些模糊的概念了,这个时侯肯定会非常好奇:到底如何使用机器学习?
机器学习在实际操作层面一共分为7步:
收集数据数据打算选择一个模型训练评估参数调整预测(开始使用)
机器学习的7个方法

假设我们的任务是通过乙醇度跟色调来辨别啤酒跟饮料,下体介绍一下机器学习中每一个方法是怎样工作的。
案例目标:区分啤酒跟饮料
步骤1:收集数据
我们在商场买来一堆不同种类的威士忌跟啤酒,然后再卖来检测色调的光谱仪跟适于测定酒精度的设备。
这个时侯,我们把买来的所有酒都标记出他的色调跟酒精度,会产生下边这张表格。
颜色酒精度种类
啤酒
红酒
红酒
这一步十分重要,因为数据的数目跟品质直接决定了预测模型的优劣。
步骤2:数据打算
在这个事例中,我们的数据是太工整的,但是在实际状况中,我们搜集至的数据会有这些问题,所以会牵涉至数据擦洗等工作。
当数据原本没有哪些问题后,我们将数据分成3个部份:训练集(60%)、验证集(20%)、测试集(20%),用于上面的验证跟评估工作。
数据要分为3个部份:训练集、验证集、测试集

关于数据打算部份,还有特别多的方法,感兴趣的可以瞧瞧《AI 数据集最常见的6大问题(附解决方案)》
步骤3:选择一个模型
研究人员跟数据科学家多年来造就了许多模型。有些特别适于图象数据,有些特别适合于序列(如文本或音乐)机器学习方法,有些适于数字数据,有些适于基于文本的数据。
在我们的实例中,由于我们只有2个特点,颜色跟酒精度,我们可以使用一个小的线性模型,这是一个相当简略的模型。
步骤4:训练
大部分人都觉得这个是最重要的部份,其实并非这么~ 数据总量跟品质、还有模型的选择比训练原本重要更多(训练知识台上的3分钟,更重要的是台下的10年功)。
这个过程就不需要人来参与的,机器独立就可以完成,整个过程就好似是在做算术题。因为机器学习的本质就是将问题转换为物理问题,然后解惑英语题的过程。
步骤5:评估
一旦训练完成,就可以评估模型是否有用。这是我们之前预留的验证集跟测试集发挥作用的地方。评估的指标主要有 准确率、召回率、F值。
这个过程可以使我们看见模型怎样对未能见到的数是怎样做预测的。这意味着代表模型在现实世界中的表现。
步骤6:参数调整
完成评估后,您或许希望了解是否可以以任何形式逐步改进训练。我们可以通过调整参数来做到这一点。当我们进行训练时,我们蕴涵地假定了一些参数,我们可以通过觉得的调整某些参数使模型表现的更强悍。
步骤7:预测
我们里面的6个方法都是为了这一步来服务的。这只是机器学习的价值。这个时侯,当我们买来一瓶新的酒,只要告诉机器他的色调跟酒精度,他都会告诉你,这时威士忌还是啤酒了。


YouTube 上有一个视频介绍了这7个方法 The 7 Steps of Machine Learning(需要科学上网)
15种精典机器学习算法算法训练方法
线性回归
监督学习
逻辑回归
监督学习
线性鉴别剖析
监督学习
决策树
监督学习
朴素贝叶斯
监督学习
监督学习

学习向量量化
监督学习
支持向量机
监督学习
随机森林
监督学习
AdaBoost
监督学习
高斯混合模型
非监督学习
限制波尔兹曼机
非监督学习
K-means 聚类
非监督学习
最大期望算法
非监督学习
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-134963-1.html
收拾他好简单嘛
这次的回归感觉都是超棒
10