机器学习的目标

机器学习是实现人工智能的手段,其主要研究内容是如何利用数据或经验进行学习,改善具体算法的性能。多领域交叉,涉及概率论统计学算法复杂度理论等多门学科。
广泛应用于网络搜索、垃圾邮件过滤、推荐系统、广告投放、信用评价、欺诈检测、股票交易和医疗诊断等应用。

机器学习分类
  • 监督学习(Supervised Learning)

    给定的训练数据集中学习出一个函数,当新的数据集到来时,可以根据这个函数预计出结果,训练集通常由人工标注

  • 无监督学习(Unsupervised Learning)

    训练集没有人工标注的结果

  • 半监督学习(Semi-supervised Learning)

    介于监督学习和无监督学习之间

  • 强化学习(Reinforcement Learning,增强学习)

    通过观察来学习执行什么样的动作来获得最好的回报,每个动作都会对环境造成影响,研究对象通过对环境反馈的判断,来继续学习

  • 深度学习(Deep Learning)

    利用深层神经网络模型,抽象数据的表示特征的一种方法

Python Scikit-learn
  • 一组简单有效的工具集
  • 依赖Python的NumPy,SciPy和matplotlib库
  • 开源,可复用的

Scikit-learn常用函数

01机器学习课程指导_数据集

学习目标
  • 了解基本的机器学习原理及算法
  • 学习利用机器学习算法解决应用问题的能力
  • 掌握sklearn库中常用机器学习算法的基本调用方法,避免重复造车。