起步
知识概要
【临时文件(*.tmp)】
【临时文件(*._mp)】
【日志文件(*.log)】
【临时帮助文件(*.gid)】
【磁盘检查文件(*.chk)】
【临时备份文件(*.old)】
【Excel备份文件(*.xlk)】
【临时备份文件(*.bak)】
【COOKIE】 cookies\*.*
【文件使用记录】 recent\*.*
【IE临时文件】 Temporary Internet Files\*.*
【临时文件文件夹】 Temp\*.*
【预读取数据文件夹】 prefetch\*.*
【临时文件】 temp\*.*
获取文件地址
import os
print os.getcwd() # 'E:\\PythonSource\\leanr_py'
os.chdir('d://wamp')
print os.getcwd() # 'd:\\wamp'
os.environ['systemdrive'] # 'C:'
os.environ['userprofile'] # 'C:\\Users\\Administrator'
os.environ['windir'] # 'C:\\Windows'
遍历目录
参数top表示需要遍历的顶级目录的路径。
参数topdown的默认值是“True”表示首先返回顶级目录下的文件,然后再遍历子目录中的文件。当topdown的值为"False"时,表示先遍历子目录中的文件,然后再返回顶级目录下的文件。
参数onerror默认值为"None",表示忽略文件遍历时的错误。如果不为空,则提供一个自定义函数提示错误信息后继续遍历或抛出异常中止遍历。
返回值:函数返回一个元组,含有三个元素。这三个元素分别是:每次遍历的路径名、路径下子目录列表、目录下文件列表。
for roots, dirs, files in os.walk('d://wamp', topdown=False)
# roots 文件夹路径, dirs 该目录下的文件夹列表, files文件列表
print roots # d://wamp
print dirs # ['bin', 'www', 'alias']
print files # ['wampmanage.conf', '1.txt']
判断是否垃圾文件
extension = os.path.splitext(r'aaa\bbb\ccc.ddd') # ('aaa\\bbb\\ccc', '.ddd')
if extension[1] in ['.tmp', '.bak']:
print '是垃圾文件'
删除文件
# 删除文件
os.remove('d:temporary/test/test.txt')
# 删除文件夹
os.rmdir('d:temporary/test/empty')
shutil.rmtree('d:/dir1/dir2/aaa')
def del_dir_or_file(root):
try:
if os.path.isfile(root):
# 删除文件
os.remove(root)
print 'file: ' + root + ' removed'
elif os.path.isdir(root):
# 删除文件夹
shutil.rmtree(root)
print 'directory: ' + root + ' removed'
except WindowsError:
print 'failure: ' + root + " can't remove"
获取文件大小
# 显示文件夹(路径)大小,单位 bite
os.path.getsize('d://temporary/test') # 4096
# 文件大小
os.path.getsize('d://temporary/test/aaa.txt') # 135
完整程序
import os
import json
import shutil
del_extension = {
'.tmp': '临时文件',
'._mp': '临时文件_mp',
'.log': '日志文件',
'.gid': '临时帮助文件',
'.chk': '磁盘检查文件',
'.old': '临时备份文件',
'.xlk': 'Excel备份文件',
'.bak': '临时备份文件bak'
}
del_userprofile = ['cookies', 'recent', 'Temporary Internet Files', 'Temp']
del_windir = ['prefetch', 'temp']
# 获取系统盘
SYS_DRIVE = os.environ['systemdrive'] + '\\'
# 获取用户目录
USER_PROFILE = os.environ['userprofile']
# 获取 Windows 目录
WIN_DIR = os.environ['windir']
# 获取当前路径 os.getcwd() 'E:\\Software\\Python27'
# 跳转至指定的文件目录 os.chdir('d://wamp')
# 获取系统盘符 os.environ['systemdrive'] 'C:'
# 获取用户目录 os.environ['userprofile'] 'C:\\Users\\Administrator'
# 获取 Windows 目录 os.environ['windir'] 'C:\\Windows'
def del_dir_or_file(root):
try:
if os.path.isfile(root):
# 删除文件
os.remove(root)
print 'file: ' + root + ' removed'
elif os.path.isdir(root):
# 删除文件夹
shutil.rmtree(root)
print 'directory: ' + root + ' removed'
except WindowsError:
print 'failure: ' + root + " can't remove"
# 字节bytes转化kb\m\g
def formatSize(bytes):
try:
bytes = float(bytes)
kb = bytes / 1024
except:
print("传入的字节格式不对")
return "Error"
if kb >= 1024:
M = kb / 1024
if M >= 1024:
G = M / 1024
return "%fG" % (G)
else:
return "%fM" % (M)
else:
return "%fkb" % (kb)
class DiskClean(object):
def __init__(self):
self.del_info = {}
self.del_file_paths = []
self.total_size = 0
for k,v in del_extension.items():
self.del_info[k] = dict(name = v, count = 0)
def scan(self):
for roots, dirs, files in os.walk(USER_PROFILE, topdown=False):
# 生成并展开以 root 为根目录的目录树,参数 topdown 设定展开方式从底层到顶层
for file_item in files:
# 获取扩展名
file_extension = os.path.splitext(file_item)[1]
# print os.path.join(roots, file_item)
if file_extension in self.del_info:
# 文件完整路径
file_full_path = os.path.join(roots, file_item)
self.del_file_paths.append(file_full_path)
self.del_info[file_extension]['count'] += 1
self.total_size += os.path.getsize(file_full_path)
def show(self):
print json.dumps(self.del_info, indent=4, ensure_ascii=False)
print '删除可节省:%s 空间' % formatSize(self.total_size)
def delete_files(self):
for i in self.del_file_paths:
del_dir_or_file(i)
if __name__ == '__main__':
cleaner = DiskClean()
cleaner.scan()
cleaner.show()
if_del = raw_input('是否删除y/n:')
if if_del == 'y':
cleaner.delete_files()
总结