一、环境部署
 概念.

 大数据指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

 数据挖掘( Data Mining )是有组织有目的地收集数据,通过分析数据使之成为信息,

 从而在大量数据中寻找潜在规律以形成规则或知识的技术。

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这- -过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。

宏观背景
Python岗位关键词:
➢python开发➢运维开发➢python后端➢python实习➢flask

➢python数据分析➢数据挖掘➢python爬虫➢django➢大数据

  python语言特征与历史

  特征

   (1 )编译性语言: C、C++需编译,运行速度较快( 2 )解释性语言: python平台兼容性

   ( 3 )动态语言: python运行时,检测数据类型不用声明

   ( 4)静态语言: C、 C++、java编译时,检测数据类型需要使用前声明

   ( 5 )强数据类型数据类型,仅能强制转换类型安全的语言
( 6 )弱数据类型一个变量可赋予不同数据类型的值

 总结: python是- -门动态解释性的强数据类型的编程语言。


二、基本知识

 变量

      变量命名规则

      ( 1 )标识符只能由字母、数字或下划线组成。( 2)标识符的第一一个字符不能是数字。( 3 )标识符区分大小写。

      (4)关键字不能声明为标识符,例如

      'and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del','elif', 'else', 'except', 'exec', 'finally', 'for', 'from','global', 'if', 'import', 'in', 'is', 'lambda', 'not', 'or', 

      'pass', 'print', 'raise', 'return', 'try', 'while', 'with', 'yield'

      命名规范:小写字母,单词之间用分割, 见名知意

缩进注释
缩进
在代码行前面添加空格,这样做可以使程序更有层次、更有结构感,从而使程序更易读。

在Python程序中,缩进不是任意的。平级的语句行(代码块)的缩进必须相同。

注释
单行注释:井号
多行注释:三引号( 3个单引号或者3个双引号)
输入输出
输出

Python 2.7
print namePython 3.X
print(name)



输入

Python 2.7
name = raw_ _input("What is your name?")Python 3.X
name = input


三、条件语句和循环语句

 数据类型

      number (数字)

      支持int、float、 bool、 complex (复数)

      str(字符串)

      Python中的字符串用单引号( )或双引号( ")括起来,同时使用反斜杠()转义特殊字符。

      set(集合)

      集合(set)是一个无序不重复元素的序列。基本功能是进行成员关系测试和删除重复元素。可以使用大括号{}或者set()函数创建集合,

      注意:创建一个空集合必须用set()而不是{} ,因为{ }是用来创建一个空字典。

运算符
Python语言支持以下类型的运算符:
●算术运算符●比较运算符●赋值运算符●逻辑运算符●成员运算符D 身份运算符

运算符优先级

四、数字猜谜
  数字猜谜之需求分析需求分析:
已知:目标数字
目标:仅考虑数字输入,暂不考虑非数字场景输入,例如空白、字符串等
输入:用户输入
输出:猜测结果提示,及异常输入提示终止条件:猜测成功

大数据挖掘架构 大数据挖掘的概念_python