今日内容:

1.hash模块
2.xml模块
3.configparser模块
4.sheve 模块
5.shutil模块

 

知识点一:hash
什么是hash:
 hash是一种算法,该算法接受传入的的内容,经过运算得到一串hash如果把hash算法比喻一座工厂
 那传给hash算法的内容就是原材料,生产的hash值就是生产出的产品
 
为何用hash算法:
 hash值产品有三大特性:
 1.只要传入的内容一样,得到的hash值必然是一样的
 2.只要我们使用的hash算法固定,无论传入的内容有多大得到的hash值得长度是固定的
 3.不可以用hash值逆推原来的内容
 基于1和2可以在下载文件时做文件一致性校验
 基于1和3可以对密码进行加密
 
 
# 例如:
import hashlib
password=input('密码:')
m=hashlib.md5('天王盖地虎'.encode('utf-8'))  #可以多一层复杂性加密
m.update(password.encode('utf-8'))
print(m.hexdigest())
'''
结果:
密码:123
41046ee2686f6c698c859a13b47cdb1f
'''import hashlib
# 用法1:
#1.造工厂
m=hashlib.md5()     #m=hashlib.sha256() 可以是其他加密个是
#2.运送材料
m.update('你好啊'.encode('utf-8'))
#3.产出hash值
print(m.hexdigest())  #124756ef340daf80196b4124686d651c#用法2:
m=hashlib.md5('你'.encode('utf-8')) #可以在造工厂的时候就添加材料
m.update('好啊'.encode('utf-8'))  
print(m.hexdigest())  #124756ef340daf80196b4124686d651c   hash结果:和上面一样,因为传入的材料是一样的 
 
知识点二:xml
xml是实现不同语言或程序之间进行数据交换的协议,跟json差不多,
但json使用起来更简单
xml的格式如下,就是通过<>节点来区别数据结构的:xml模块:
 1.标签名  root.tag
 2.便签属性 root.attrib
 3.标签文本 root.text以xml.xml文件为例:
<data>
    <country name="Liechtenstein">
        <rank updated="yes">2</rank>
        <year>2008</year>
        <gdppc>141100</gdppc>
        <neighbor direction="E" name="Austria" />
        <neighbor direction="W" name="Switzerland" />
    </country>
    <country name="Singapore">
        <rank updated="yes">5</rank>
        <year>2011</year>
        <gdppc>59900</gdppc>
        <neighbor direction="N" name="Malaysia" />
    </country>
    <country name="Panama">
        <rank updated="yes">69</rank>
        <year>2011</year>
        <gdppc>13600</gdppc>
        <neighbor direction="W" name="Costa Rica" />
        <neighbor direction="E" name="Colombia" />
    </country>
</data>可以对xml文件进行一下操作:
import xml.etree.ElementTree as ETtree=ET.parse('xml.xml')        #parse单词:从语法上分析 理解
root = tree.getroot()#对任何标签都有三个特征:便签名、标签属性、标签的文本内容
print(root.tag)    #data
print(root.attrib)  #标签属性 {}
print(root.text)  #标签文本  空print(list(root.iter('year')))
print(root.iter('year'))for year in root.iter('year'):
    print(year.tag)
    print(year.attrib)
    print(year.text)
    print('========================')# 在root的子节点找,只找一个
print(root.find('country').attrib)     #{'name': 'Liechtenstein'}
print(root.findall('country'))     #[<Element 'country' at 0x055F5CC0>,.. 列表格式
# 在root的子节点找,找所有
# 列表推导式,找出所有二级country本身的属性
print([country.attrib for country in root.findall('country')])
for country in root.findall('country'):
   print(country.attrib)
# 结果:
'''
{'name': 'Liechtenstein'}
{'name': 'Singapore'}
{'name': 'Panama'}
'''# 1.查
# 遍历整个文档
for country in root:
    # print('========>国家%s'%country.attrib)
    for item in country:
        print(item.tag)                                             #year    #rank
        print(item.attrib)      #<year>2008</year>属性标签为空:{}  #{}      #{'updated': 'yes'}
        print(item.text)   #<year>2008</year>文本标签为2008         #2018    #2# 2.改
for year in root.iter('year'):
    print(year.tag)  #year year year
    year.attrib={'update':'yes'}
    year.text=str(int(year.text)+1)tree.write('xml.xml')
# 3.增加
for country in root:
    rank=country.find('rank')
    if int(rank.text)>50:
        tag=ET.Element('egon')        #element单词意思:元素   是否意思为增加一个名为egon的标签???
        tag.attrib={'update':'yes'}
        tag.text='NB'
        country.append(tag)tree.write('xml.xml')
# 4.删除
for country in root:
    tag=country.find('egon')
    # print(tag)             #前两个country下面没有egon,所有没提示 None
    if tag is not None:
        print('====>')
        country.remove(tag)
tree.write('xml.xml') 
知识点三:configparser模块(解析配置文件)
主要所有三项:
 1.config.sections  查看标题
 2.config.options   查看指定标题下面所有key=value的key值
 3.config.get       查看指定标题下面key=value的value值
 4.config.items     查看取所有key、value的值以(key,value)格式显示以文件config.ini格式为例:
[egon]
sex='female'
age=20
salary=31
is_auth=True[alex]
sex='male'
age=20
salary=1
is_auth=True可以进行一下操作:
import configparser
config=configparser.ConfigParser()
config.read('config.ini')取标题
print(config.sections())   # ["'egon'", "'alex'"]取文件标题下面下所有key=value的key
print(config.options('egon'))  #['sex', 'age', 'salary', 'is_auth']取文件标题下面指定的key=value的value
print(config.get('egon','age'))  #20取所有key=value的(key,value)格式
print(config.items('egon'))
[('sex', "'female'"), ('age', '20'), ('salary', '31'), ('is_auth', 'True')] 
 
 
知识点四:sheve 模块(序列化和反序列化)
shelve更简单,也支持所有的的数据类型,但只能在python里面用
import shelvef['stu1_info']={'name':'egon','age':18,'hobby':['piao','smoking','drinking']}
f['stu2_info']={'name':'gangdan','age':53}
1.存文件
f=shelve.open(r'shelve.txt')2.取文件
print(f['stu1_info']['hobby'])
print(f['stu2_info']['name'])3.改文件内容
注意点:
f['stu1_info']['age']=44444  这样看是赋值改动,但是实际没有改,因为没有写入的文件
print(f['stu1_info'])
要想写入,需要添加,writeback=True 将修改的文件写回后台文件
f=shelve.open(r'shelve.txt',writeback=True)
f['stu1_info']['age']=44444
print(f['stu1_info'])
'''
输出结果为:
{'name': 'egon', 'age': 44444, 'hobby': ['piao', 'smoking', 'drinking']} 
 
 
知识点五:shutill模块 
高级的 文件、文件夹、压缩包 处理模块
import shutil拷贝文件
方式一:
with open('config.ini','r')as read_f,open('new.xml','w') as write_f:
    shutil.copyfileobj(read_f,write_f)方式二:shutil.copyfile(src, dst)
源文件事先定义好,目标文件无需存在,
shutil.copyfile('new.xml', r'E:\f2.log') #拷贝到指定文件
shutil.copyfile('new.xml', 'f2.log')  #拷贝到当前文件夹仅拷贝文件权限,内容、组、用户均不变  shutil.copymode(src, dst)
目标文件均不变,只是文件权限变动
shutil.copymode('new.xml', 'f2.log')仅拷贝状态信息,包括:mode bits, atime, mtime, flags
shutil.copystat('new.xml', r'E:\f2.log')拷贝文件和权限
import shutil
shutil.copy('f1.log', 'f2.log')递归的去拷贝文件夹
import shutil
shutil.copytree('folder1', 'folder2', ignore=shutil.ignore_patterns('*.pyc', 'tmp*')) #目标目录不能存在,
# 注意对folder2目录父级目录要有可写权限,ignore的意思是排除递归的取删除文件
import shutil
shutil.rmtree('folder1')#递归的去移动文件夹 shutil.move(src, dst)
import shutil
shutil.move('folder1', 'folder3')创建压缩包并返回文件路径
import shutil
'''
1.base_bak: 压缩后文件的名字,压缩包的文件名(也可以指定压缩好保存的具体文件目录)
    如 data_bak=>保存至当前路径
    如:/tmp/data_bak =>保存至/tmp/
2.gztar: 压缩包种类,“zip”, “tar”, “bztar”,“gztar”
3.root_dir: 被压缩文件的路径(默认当前目录)
4.owner: 用户,默认当前用户
5.group: 组,默认当前组
6.logger: 用于记录日志,通常是logging.Logger对象
'''
#res=shutil.make_archive('data_bak','gztar',root_dir=r'E:\PycharmProjects\untitled\day17\包练习')#解压文件(解压上面刚刚压缩的文件)
import tarfile
t=tarfile.open(r'E:\PycharmProjects\untitled\day20\data_bak.tar.gz','r') #源文件路径
t.extractall(r'E:\PycharmProjects\untitled\day20\dir_tarfile') #解压后文件存放路径
t.close()

知识点六:面向对象

面向对象编程:
对象:特征与技能的集合体,上帝的思维方式

优点:
 可扩展性强
缺点:
 编程的复杂程度要高于面向过程

类;类是一系列具有相同特征、技能对象的集合体
强调:站的角度不同,总结出来的来是截然不同的

现实世界中:先有对象,后才有类
在程序中:必须先定义类,后调用类来产生对象

《类里面尽量用驼峰体》

面向对象初始模板:
class OldboyStudent:   #类的名称OldboyStudent
    school='Oldboy'    #特征(变量表示)    def learn(self):   #就是一个普通函数
        print('is learn skill')  #技能1(函数表示)    def choice(self):
        print('choose course')   #技能2(函数表示)print(OldboyStudent)  #<class '__main__.OldboyStudent'>
print(OldboyStudent.__dict__)  #输出结果:如下
{'__module__': '__main__', 'school': 'Oldboy', 'learn': 
<function OldboyStudent.learn at 0x05A9D810>, 'choice': <function OldboyStudent.choice at 0x05A9D7C8>, 
'__dict__': <attribute '__dict__' of 'OldboyStudent' objects>, '__weakref__': <attribute '__weakref__' of
 'OldboyStudent' objects>, '__doc__': None}
Oldboy
print(OldboyStudent.__dict__['school'])   #'school'是以字符串传值得
print(OldboyStudent.school)
OldboyStudent.learn(123)  #OldboyStudent.learn('aaa')

注意理解:
OldboyStudent.learn(123) .后面跟的是类里面的属性,可以是变量名school和函数名learn

类的代码会在类定义阶段就立即执行,会产生一个类的名称空间
类的本身就是一个容器/名称空间,是用来存放名字的,这是类的用途之一