人工智能基础知识
人工智能、机器学习和深度学习之间的关系:
机器学习是人工智能的一个分支,该领域的主要研究对象是人工智能,特别是如何在经验学习中改进具体算法的性能;深度学习是一种典型的机器学习方法,是一种基于对数据进行表征学习的算法。
人工智能 > 机器学习 > 深度学习。
机器学习
人工智能实现路径:机器学习是对能通过经验自动改进计算机算法的研究;机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。人类是基于经验,机器学习基于训练模型。
举例:草莓
机器学习就是找到草莓的不同特征维度(尺寸、颜色、成熟度)与草莓标签(酸、甜)之间的映射关系。
机器学习就是找到特征与标签之间的关系,利用算法从一类训练数据或信息中自动分析并获得该类数据或信息的规律,并利用获得的规律进行预测。
上述寻找关系和规律的过程,称为训练。结果是得到一个机器学习模型。
三种类型:监督学习、无监督学习、强化学习。
监督学习:是在有指导的前提下让机器进行学习,这种指导的关键是给训练数据标注好“标签”。监督学习的目标在观察完一些事先标注过的训练数据(输入和预期输出)后,这个模型对任何可能出现的输入去预测其输出。要达到此目的,学习者必须以“合理”(归纳规律)的方式从现有的数据中一般化到未观察到的情况。在人类和动物感知中,则通常被称为概念学习。
无监督学习:无指导的学习的过程,待训练的数据没有标签。聚类:机器学习算法寻找共同特征,并聚合到一起;把相似的对象通过静态分类的方法,分成更多的组别或者不同的子集,使成员具备相似的属性。
系统自由的探索,所学的内容要包括理解数据本身,而不是将这种理解用于特定的任务。通往通用智能的道路,必须有无监督学习。比如监督学习是考试,知道答案,学习后下次的目的就是考试。无监督学习是自己学习试卷,把语文、数学题分开,并不是要考100分为特定的目的。就是归纳数据,创建子集。和人类的“归纳”学习方法类似。
强化学习:强化学习(Reinforcement Learning, RL)是机器学习的一个重要分支,它主要解决的是决策问题,即让智能体(agent)在与环境的交互过程中自动进行决策以达到回报最大化或实现特定目标。
强化学习的基本框架包括四个元素:agent、环境状态、行动和奖励。智能体(agent)根据当前的环境状态(state)按照某种策略(policy)选择下一步动作(action),并从环境中得到奖励(reward)。强化学习可以分为基于值(value-based)的强化学习、基于策略(policy-based)的强化学习和演员-评论家(Actor-Critic)方法。
强化学习是一种试错方法,没有直接的标签,而是通过奖励来学习。
深度学习
神经网络模型:深度学习是机器学习中一种基于对数据进行表征学习的算法。观测值(例如一幅草莓照片)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。
深度学习的最主要特征是使用神经网络作为计算模型。神经网络模型 得名于其对于动物神经元传递信息方式的模拟。
深度,一般指神经网络的层数。一般有2-3个隐藏层;深层神经网络,隐藏层可能有150层。
深度学习 VS 机器学习:相辅相成。
特征处理:
所有机器学习:需要可准确识别且有人工提取的特征。
深度学习:从数据中习得高级特征,并自行创建新的特征
学习方法:
所有机器学习:将学习过程划分为较小的步骤。然后,将每个步骤的结果合并成一个输出。
深度学习:通过端到端地解决问题来完成学习过程,只要有输入和输出即可,不需要分为更多步骤。
数据依赖:
所有机器学习:可以使用少规模的数据做出预测,可解释性好,性能好。
深度学习:需要使用大量的训练数据做出预测,可解释性不好。
硬件依赖:
所有机器学习:可在低端机器上工作,不需要大量的计算能力。
深度学习:依赖于本身就能执行大量的矩阵乘法运算的高端机器。 GPU可以有效地优化这些运算。
最后,深层神经网络,数据量大性能越好,传统机器学习,数据量大,性能和结果扁平。