用python进行数据分析,了解python基础语法,掌握容器、条件判断、循环和函数等内容。
1.注释
创建注释:注释以 #号开头
多行注释可以使用:三引号 ''' ''' 或者""" """;
2.变量
变量可以使用短名称(如 x 和 y)或更具描述性的名称(age、carname、total_volume)。
Python 变量命名规则:
- 变量名必须以字母或下划线字符开头
- 变量名称不能以数字开头
- 变量名只能包含字母数字字符和下划线(A-z、0-9 和 _)
- 变量名称区分大小写(age、Age 和 AGE 是三个不同的变量)
3.数据类型
python中一般包含字符串、数值、容器(列表、元祖、集合、字典)、布尔等几种;
1)字符串
字符串是python中最常见的数据类型,可以用单引号或双引号来创建字符串。
# f-string,亦称为格式化字符串常量
# 可以代替%d,%s
name = 'lily'
print(f'他的名字是:{name}')
#输出结果
他的名字是:lily
2)数值
python中的数字类型包括整数int、浮点数float(有小数部分)、复数(用 "j" 作为虚部编写)
#数据类型:数字
age=100 #整型
money=99.9 #浮点型
x= 2+3j #复数
3)容器
包括列表[]、元组()、集合{}、字典{键值对}。
- 列表(List)是一种有序和可更改的集合。允许重复的成员。
- 元组(Tuple)是一种有序且不可更改的集合。允许重复的成员。
- 集合(Set)是一个无序和无索引的集合。没有重复的成员。
- 词典(Dictionary)是一个无序,可变和有索引的集合。没有重复的成员。
容器的四个操作:增加、删除、查询、修改
4.条件判断
# 数值判断
score = 100
if score >90:
print('判断为True')
else:
print('判断为False')
# 逻辑判断
if 'one' in data:
print('Ture')
else:
print('False')
# 多条件判断
if data <0:
print('语句1')
elif data ==0:
print('语句2')
else:
print('语句3')
5.循环遍历
循环有while循环和for循环,一般for循环更加常用。
# 列表中的遍历
for i in data:
执行语句
# 字典中遍历
for key,value in data.items:
执行语句
tip:continue用于跳出当前循环,break退出整个循环
6.函数
1)自定义函数
用户可以自定义函数,其格式为:
def 函数名称(参数1,参数2,...):
函数体
return 输出
# 创建和调用(无参数)
def my_function():
print("Hello from a function")
my_function()
# 参数
def my_function(fname):
print(fname + " Gates")
my_function("Rory John")
# 输出结果
Rory John Gates
tip:参数如果是字符串、元组、数值,则属于不可变数据类型,参数传递的作用相当于复制;
如果参数为列表则可以修改,此时参数传递的变量为引用地址。
7.模块
python中的模块包括内置模块和第三方包,包含不同的功能,需要使用的时候按需导入。
import 包
import 包 as 别名
from 包 import 函数名 #从包中引入特定函数
#常用包
import numpy
import pandas as pd
from matplotlib import pyplot
8、数据结构
集合(collections)是python内建的一个集合模块,提供许多有用的数据结构。包括:
双向链表 queue:队列,栈
排序字典 OrderedDict :可构建一个有序的字典
计数器 Counter :可以方便地实现统计的功能