一、初识AI

1、什么是AI?

  

AI学习笔记(一)-初识AI_神经网络

  人工智能(Artificial Intelligence),英文缩写为AI。它是计算机科学的一个分支,研究用于模拟延伸和扩展人的智能的理论或方法、技术及应用系统。它企图了解智能的实质,并生产出一种能与人类智能相似的智能机器,该领域的研究包括机器人、语言识别与处理、图像识别与处理、自然语言处理和专家系统等。

2、AI与传统程序设计的区别:

  

AI学习笔记(一)-初识AI_神经网络_02

3、人工智能、机器学习、神经网络、深度学习几者间的关系:

AI学习笔记(一)-初识AI_神经网络_03

(1)人工智能:

  包含“机器学习”和“非机器学习”(如过去的专家系统,通过大量if-else定义规则);

(2)机器学习:

  包含“传统机器学习”、“强化学习”、“神经网络”等;机器学习是一门涉及概率统计学、系统辨识、逼近理论、神经生物学、优化理论、计算机科学、哲学等诸多领域的交叉学科,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,是人工智能技术的核心。

(3)传统的机器学习:

  传统机器学习涵盖以下技术:

  • 决策树算法(DTrees):利用一系列规则进行分类学习的算法;
  • 随机森林算法(RFTrees):以决策树为估计器的Bagging算法;
  • 支持向量机算法(SVM):类神经网络,将数据映射到高维空间,寻找最大切分超平面的算法;
  • K-近邻算法(KNN):根据邻居的数据类别来决定自己的类别;
  • 逻辑回归(LogisticRegression)
  • 线性回归
  • 朴素贝叶斯算法(Bayes Classification):根据先前经验和样本信息来确定样本类别的算法;
  • 正则化模型
  • 模型集成(ensemble)
  • 神经网络(ANN;这个发展为一门独立的新技术了,所以这个放在机器学习中)
  • ...

(4)强化学习:

  像训兽师训练动物一样训练模型;当动物选择正确时给予奖励,选择失败时没有奖励或给予处罚。这种学习方式(称为强化学习)与传统监督机器学习的曲线拟合方法有很大不同。尤其是,强化学习学习得非常快,因为每一个新的反馈(例如执行一个行动并获得奖励)都会影响到随后的决定。

  强化学习也提供了预测和优化的平滑整合,因为它在采取不同的行动时保持当前状态的信念和可能的转换概率,然后做出决定哪些行动可以导致最佳结果。

(5)神经网络:

  神经网络也被称为类神经网络,它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。

  ① 神经网络:

  神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。模型如下:

AI学习笔记(一)-初识AI_神经网络_04

  上面的图可以抽象为下图:

AI学习笔记(一)-初识AI_神经网络_05

  神经网络分类:

  • 按照网络结构区分:前馈型网络、前馈内层互联网络、反馈型网络

AI学习笔记(一)-初识AI_数据_06

AI学习笔记(一)-初识AI_机器学习_07

AI学习笔记(一)-初识AI_机器学习_08

  • 其他作者的神经网络分类图:

AI学习笔记(一)-初识AI_神经网络_09

  ② 神经元模型

AI学习笔记(一)-初识AI_机器学习_10

AI学习笔记(一)-初识AI_神经网络_11

  ③ 神经网络的优越性:
  • 具有自学习功能:例如实现图像识别时,只在先把许多不同的图像样板和对应的应识别的结果输入神经网络,网络就会通过自学习功能,慢慢学会识别类似的图像。
  • 具有联想存储功能:用人工神经网络的反馈网络就可以实现这种联想。
  • 具有高速寻找优化解的能力:寻找一个复杂问题的优化解,往往需要很大的计算量,利用一个针对某问题而设计的反馈型人工神经网络,可能很快找到优化解。

(6)深度学习:

  深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。

  深度学习的诞生:2006年,Hinton提出了在非监督数据上建立多层神经网络的一个有效方法,具体分为两步:首先逐层构建单层神经元,这样每次都是训练一个单层网络;当所有层训练完后,使用wake-sleep算法进行调优。

4、传统学习与深度学习的区别:

  • 明确了特征学习的重要性。也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更容易。
  • 与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据丰富的内在信息。
  • 与人工规则构造特征的方法相比,在进行学习前无须进行特征提取。降低了建模的难度和建模效果的不确定性,省事省力。
  • 与人工规则构造特征的方法相比,减

5、新一代的AI可以理解为:AI=深度学习+强化学习+百科库

  • 深度学习:一切运用了神经网络作为参数结构进行优化的机器学习算法。最基础的如:CNN(卷积神经网络),RNN(递归神经网络),LSTM(长期短期记忆),GAN(生成敌对网络)等。
  • 强化学习:不仅能利用现有数据,还可以通过对环境的探索获得新数据,并利用实战数据循环往复地更新迭代现有模型的机器学习算法。
  • 百科库:在训练力度不够时,采用百科库进行问答还是有必要的。

6、机器学习的学习方式有哪些?

(1)监督学习

  有特征(feature)和标签(label)的,即便部分没有标签,机器也是可以通过特征和标签之间的关系,判断出标签。

  

AI学习笔记(一)-初识AI_机器学习_12

(2)无监督学习

  只有特征,没有标签。

(3)半监督学习

  使用的数据,一部分是标记过的,而大部分是没有标记的。和监督学习相比较,半监督学习的成本较低,但是又能达到较高的准确度。

(4)强化学习

  强化学习也是使用未标记的数据,但是可以通过一些方法知道你是离正确答案越来越近还是越来越远(奖惩函数)。

7、训练模型的一般步骤有哪些?

  • 选择一个模型结构(例如逻辑回归,随机森林等)或神经网络预训练模型
  • 用训练数据(输入和输出)输入模型;
  • 学习算法将输出最优模型(即具有使训练错误最小化的特定参数的模型);
  • 验证数据验证模型
  • 测试数据测试模型

作者:꧁执笔小白꧂