目录

1 前言 : 为什么要做这个系列

2 用VBA 实现 遍历文件夹,读取文件内容,写入文件内容等

2.1 打开文件+遍历文件夹的文件名

2.1.1 做事之前先梳理一遍思路

2.1.2 用VBA取得文件名等需要使用 dir mkdir 等类dos的命令

测试这些函数和语句

2.1.3 DIR() 函数的用法

2.1.4 用open语句 打开,close语句 关闭文件:

2.1.5 代码例子1

2.1.5.1 打开文件夹,把文件夹内的文件名,输出到另外一个txt文件内

2.1.5.2 下面是运行的效果

2.1.6 代码例子2

2.2 如何读写:读取文件夹内所有文件内容到指定文件

2.2.1 基本的读取方式 

input语句

input() 函数

对应代码:可看出,input 和  line input语句效果一样,匪夷所思

对应代码:可看出,input() 函数可实现读取指定长度的内容

2.2.2 写入方式

2.3  代码例子:读取文件夹下多个文件内容

2.3.1 读取文件夹下多个文件内容

2.3.2 代码

2.3.3 相关函数和语句

2.4  向(已有)文件夹内的多个已有的多个文件写入

2.4.1 代码

2.5   向新建文件夹内的新文件输出

2.5.1 代码

2.6  向新建文件夹内的新文件输出(先判断是否存在此文件夹)

2.6.1 代码

3 VBA 其他操作文件方法,比如fso的简要了解(未完善,需要整理)

3.1 基础语法

3.2 读文件

3.3 写入文件

3.4  代码如下(逐行读取,逐行写入)

3.5 还可以简单粗暴的一次性读出,写入

3.6  也可以读取文件夹内容

3.7   fso的一些关键语法

3.8 使用fso 如何统计 某种后缀名类型的文件数量

4 用python 读取文件

4.1 我从之前我写的一个解题的代码里弄出一段代码

4.2 函数和语法

4.2.1 导入模块 os

4.2.2  使用地址path找到文件

4.3  打开文件

4.3.1  打开文件方式1:使用 open() 函数打开,file=open()

4.3.2 打开文件方式2: 使用with语句+打开, 就是 with + 文件对象

4.3.3 验证 open() 函数的返回值

4.4 关闭文件 file.close() 函数

4.5 读文件内容

4.5.1  读入内容方法1, file.read()整体读入

4.5.2 读入内容方法1, file.readlines()整体读入,并且直接返回的是列表

4.5.3  读入内容方法3:  for line in file 逐行读入

4.5.4 读入内容方法4: file.readline()逐行读入

4.5.5 关于指针函数seek

4.6  代码例子1:读写文件

4.7 代码例子2:读写文件

4.8 往文件内写入内容

5  VBA 和python 打开文本文件的比较

5.1 VBA处理文件方法总结

5.1.1 文件处理方法1: 函数式编程

5.1.2 也有对象的方法 FSO

5.2 py处理文本文件的方法总结

5.3 比较 VBA 和 python 文件处理的相关代码差别

5.3.1 VBA的内嵌EXCEL天生优势   VS python的各种import模块

5.3.2 VBA里还有很多语句式的命令,python里基本都是函数了

5.3.3 易用性的问题

5.3.4 简洁,方便来看


1 前言 : 为什么要做这个系列

放在第一篇需要先明确下目的

为什么要做这个系列

  • 1 我现在再看之前写的一些VBA或python的学习笔记,有点惨不忍睹的,虽然有些文章还算有用,尤其是解决具体问题的那种,但是那种学习总结的往往很多问题,虽然只要被有些同学顶起来收藏和点赞,我发现了都会尽量改,但总是感觉一言难尽
  • 2 市面上很少有做 python 和VBA对比的,尤其是深入进去每个模块功能进行对比的。原因大概是这几个:VBA太老太弱,python太火太强,真正科班出身的同学很少有看得起VBA的。但是VBA因为附着在EXCEL上,有着强大的生命力,办公人群(多数人不会代码)用的很多,还是需要有人有用VBA的需求,毕竟环境已经集成在office上了。
  • 3 做对比,比较下两种语言的处理方式,也可以比较感性的认识下,后出的语言的牛逼之处在哪,之前写VBA的各种老思路需要更新。
  • 4 做对比,也算是对VBA做个总结吧,听说EXCEL都已经支持python了...

2 用VBA 实现 遍历文件夹,读取文件内容,写入文件内容等

  • 现有文件夹如下
  • 想遍历文件夹里的文件名,文件内容,然后写入其他文件夹
  • 下面是具体的步骤

数据处理 VBA还是python_数据处理 VBA还是python

2.1 打开文件+遍历文件夹的文件名

2.1.1 做事之前先梳理一遍思路

  • 要读写文件,首先要能根据文件位置找到文件,找到文件地址即可
  1. 如果是文件夹内的多个文件又该怎么办?  dir(path)+ 循环多次dir() 可以取得文件夹内的文件名
  2. 如果文件不存在又该怎么办?创建呗,用mkdir
  • 文件地址怎么写?
  1. 用相对地址,默认是同一个文件夹内的
  2. 直接用绝对地址
  • 怎么打开文件呢
  1. 知道了地址怎么打开文件呢?用 open path for output as #1

数据处理 VBA还是python_数据处理 VBA还是python_02

2.1.2 用VBA取得文件名等需要使用 dir mkdir 等类dos的命令

文件操作函数或者语句,类DOS

  • dir:   dir(path1)   和 继续 dir()
  • mkdir:MkDir (path1)  创建文件/文件夹
  • CurDir :CurDir() 函数
  • ChDir :ChDir path 语句
  • ChDrive: 语句
测试这些函数和语句
Sub testp1()
    Debug.Print CurDir()
    
    Debug.Print Dir("C:\Users\Administrator\Desktop\ptest1.txt")
    
    ChDir "d:\123"
    Debug.Print CurDir()
    
    ChDrive "d:\"
    Debug.Print CurDir()

    ChDrive "c:\"
    Debug.Print CurDir()
    
    ChDir "C:\Users\Administrator\Desktop"
    Debug.Print CurDir()
End Sub

数据处理 VBA还是python_数据处理 VBA还是python_03

2.1.3 DIR() 函数的用法

  • 'dir() 后面只能用dir(),不能 Dir(path)否则会重置,重新开始从第一个文件名开始输出
  • 'dir获得是文件名,(包含文件名=后缀)像这种  ppp1.txt,但是不包含完整路径
  • '循环dir,会导致ppp1 ppp10 ppp2.txt这种文件名排序,需要注意不是按数字排序的
  • '文件如果没有会自动创建
  • 有个问题:chdir如果和当前目录相比已经跨盘符了,必须要先chdirve 后才行,否则切换不过去

总结dir()的特点

  • 参数
  • dir(path=文件路径)  ,可以直接返回文件名,返回文件名.后缀
  • dir(path=文件夹路径)  其中参数path 可以是文件夹,必须有\*.*这一级,否则取不到文件夹内的内容返回文件夹内的第一个文件名.后缀
  • 比如fp = "C:\Users\Administrator\Desktop\ppp\*.txt"


  • dir()   也可以不带参数的,但是需要配合 dir(path文件夹) 使用,dir(path)  配合 dir() 使用
  • 会接着显示当前文件夹当前指针后面的文件名,可以逐个显示文件夹内的文件名,但是排序是 1.txt 10.xtxt 2.txt  这样的次序


  • 返回值
  • dir(path)  的返回值,一定是文件名.后缀格式名(非绝对路径)

2.1.4 用open语句 打开,close语句 关闭文件:

  • 打开文件:open path for input as #别名
  • 关闭文件:   close #别名

吐槽:open path for mode  as # 居然没有一个支持既可读又可写的模式。。。。不可想象,要想又读又写,只能分开!


官方解释

Open pathname For mode [Access access] [lock] As [#] filenumber [Len = reclength]

参数:

1)pathname 必填。 指定文件名的字符串表达式,可包括目录或文件夹和驱动器。

2)mode 必填。 指定文件模式的关键字:Append、Binary、Input、Output 或 Random。 如果未指定,则以 Random 访问模式打开文件。

  1. Input:以输入方式打开,即读取方式。
  2. Output:以输出方式打开,即写入方式。
  3. Append:以追加方式打开,即添加内容到文件末尾。
  4. Binary:以二进制方式打开。
  5. Random:以随机方式打开,如果未指定方式,则以 Random 方式打开文件。

3)access 可选。 指定可对打开的文件执行的操作的关键字:Read、Write 或 Read Write。

4)lock 可选。 指定由其他进程限制在打开的文件上的操作的关键字:共享、锁定读取、锁定写入和锁定读写。

5)filenumber 必填。 一个有效文件号,范围为1到511(含1和511)。 使用FreeFile 函数可获取下一个可用的文件编号。

6)reclength 可选。 小于或等于 32,767(字节)的数。 对于以随机访问模式打开的文件,此值为记录长度。 对于序列文件,此值为缓冲的字符数。

  1. 如果pathname指定的文件不存在,那么在以 Append、Binary、Output 或 Random 模式打开文件时,即会创建它。
  2. 如果文件已由另一个进程打开,并且不允许指定的访问类型,则打开操作将失败,并将发生错误。
  3. 如果mode为Binary,则忽略Len子句。
  4. 在Binary,Input,Random模式中,你可以使用不同的文件号打开文件,而无需先关闭文件。 在 Append 和 Output 模式中,必须先关闭该文件,然后才能用不同文件号打开它。

2.1.5 代码例子1

2.1.5.1 打开文件夹,把文件夹内的文件名,输出到另外一个txt文件内
'指定读取文件夹的路径内的 多个文字名字
Sub print1001()

    '指定输出路径
    path1 = "C:\Users\Administrator\Desktop\ptest1.txt"
    
    fp = "C:\Users\Administrator\Desktop\ppp\*.*"
    fn = Dir(fp)
    
    '打印文件夹内的文件名
    Do While fn <> ""
       'VBE调试窗口输出
       Debug.Print fn
       
       '向文件输出
       Open path1 For Append As #2
            Print #2, fn
       Close #2
       fn = Dir
    Loop
    Debug.Print "文件夹内的文件名已经遍历完毕,并且已经追加写入了" & path1 & "内"
    MsgBox ("文件夹内的文件名已经遍历完毕,并且已经追加写入了" & path1 & "内")
End Sub


'dir总结
'总结1:'dir 后面只能用dir,不能 Dir(fp)否则会重置会第一个文件名
'总结2:'dir获得是文件名,(包含文件名=后缀)像这种  ppp1.txt,但是不包含完整路径
'总结3:循环dir,会导致ppp1 ppp10 ppp2.txt这种文件名排序,需要注意不是按数字排序的
'总结4:'文件如果没有会自动创建, output, input
'Append、Binary、Input、Output 或 Random。 如果未指定,则以 Random 访问模式打开文件。

'打开文件:open 完整路径 for input/output/append as #别名
'关闭文件:close #别名
'写入文件内容: print
2.1.5.2 下面是运行的效果

数据处理 VBA还是python_文件名_04

数据处理 VBA还是python_python_05

数据处理 VBA还是python_读取文件_06

2.1.6 代码例子2

  • 和上面的稍微有改写
  • 比如fp = "C:\Users\Administrator\Desktop\ppp\*.txt" ,可以利用*.* 改写为*.txt 筛选某一类文件,而不是全部文件。
Sub test205()
    '指定输出路径
    path1 = "C:\Users\Administrator\Desktop\ptest1.txt"
    
    fp = "C:\Users\Administrator\Desktop\ppp\*.txt"    '必须有\*.*这一级,否则取不到文件夹内的内容
    fn = Dir(fp)
    
    Open path1 For Output As #2
    '打印文件夹内的文件名
    Do While fn <> ""
       'VBE调试窗口输出
       Debug.Print fn
       '向文件输出
            Print #2, fn
       fn = Dir
    Loop
    Close #2
End Sub

2.2 如何读写:读取文件夹内所有文件内容到指定文件

可以参考我自己之前写的一篇文章




line input可直接识别

line input不可识别

但是可以通过split()分行



文件分多行

文件分多行

文件内未分行

input

只能读到第1行

只能读到第1行

全部内容读成为1行

line input不可识别的多行

全部内容读成为1行

全部内容读成为1行

全部内容读成为1行

line input可识别的多行

读成为多行

全部内容读成为1行

全部内容读成为1行

line input+split()可处理的多行

读成为多行

读成为多行

全部内容读成为1行

2.2.1 基本的读取方式 

要读到文件夹内容

input语句
  • 这2个居然效果一样,都是读取文件内容的一行,但是实际上有差别。。。。
  • input 语句    Input #1, s
  • line input 语句  Line Input #1, s
  • line input + split() 处理分隔为行
input() 函数
  • input() 函数,指定读多少数量的内容
  • LOF(1), 指定多少长度的内容,比如lof(1) -100 ,就是去掉最后100个字符的内容
  • input(LOF(1), #1) 
对应代码:可看出,input 和  line input语句效果一样,匪夷所思
Sub test206()
    '指定输出路径
    path1 = "C:\Users\Administrator\Desktop\ptest1.txt"
    Open path1 For Input As #2
    '打印文件夹内的文件名
    Do While Not EOF(2)
       '从文件内读入
        Input #2, curr1
        Debug.Print "Input #2, curr1=" & curr1

        Line Input #2, curr1
        Debug.Print "Line Input #2, curr1=" & curr1
    Loop
    Close #2
End Sub

数据处理 VBA还是python_文件名_07

对应代码:可看出,input() 函数可实现读取指定长度的内容
Sub test207()
    '指定输出路径
    path1 = "C:\Users\Administrator\Desktop\ptest1.txt"
    Open path1 For Input As #2
    '打印文件夹内的文件名
    Do While Not EOF(2)
       '从文件内读入
        curr1 = Input(LOF(2), #2)
        Debug.Print " curr1 = input(LOF(2), #2)" & curr1
    Loop
    Close #2
End Sub

数据处理 VBA还是python_python_08

 2.2.1.1 line input + split() 处理分隔为行
  • line input + split() 处理分隔为行

例子

Sub test2207()     '尝试把文件内容已经分行,但是line input 无法直接识别的内容,变为分行后读入

    Dim sh1 As Object
    fnum = FreeFile
    Set sh1 = ThisWorkbook.Worksheets("a")
    m = 1
    Open "C:\Users\Administrator\Desktop\k\62" For Input As #fnum
    Do While Not EOF(fnum)
         Line Input #fnum, aaa1
         lll1 = Split(aaa1, Chr(10))                     'split()返回一个数组,以chr(10)为间隔分行
'         For i = 0 To UBound(lll1) Step 1               'split()返回一个数组,index从0开始,千万别写成1,会少1个数据
         For i = LBound(lll1) To UBound(lll1) Step 1
             Debug.Print lll1(i)
             sh1.Cells(m, 2) = lll1(i)
             m = m + 1
         Next
         
     Loop
         Debug.Print "test207结束"
     Close fnum
         

End Sub

2.2.2 写入方式

写入文件内容的语句:

  • print 语句,Print #2, curr1 ,内容
  • write语句 ,Write #1, 888,输出内容会自带 "" 引号

函数

  • 好像没有对应函数
Sub test208()
    '指定输出路径
    path1 = "C:\Users\Administrator\Desktop\ptest1.txt"
    Open path1 For Append As #2
        Print #2, "ok1"
        Print #2, "OK2"
        Write #2, "ok1"
        Write #2, "ok1" & "OK2"
        
'        Print (#2,"你好")
'        write (#2,"你好")
        
    Close #2
End Sub

数据处理 VBA还是python_文件名_09

2.3  代码例子:读取文件夹下多个文件内容

数据处理 VBA还是python_前端_10

 

数据处理 VBA还是python_数据处理 VBA还是python_11

2.3.1 读取文件夹下多个文件内容

  • 要读取的文件,打开时用input即可
  1. 需要循环到文本结尾,读取全部内容
  2. 用eof(1)判断是否到文件结尾
  3. '用lof(别名文件号) 判断长度,可以直接 lof(1)-10 取部分内容
  • 要写入的文件,使用append
  1. 每次找循环里的下一个文件 path3 = path2 & "\" & fn  (有些语言需要注意windows的文件符号\相反的问题)
  2. input函数(长度,别名)
  3. '需要input函数,可用变量暂存内容=input(长度,别名)
  4. 用中间变量,倒一下内容
  5.             curr1 = input(LOF(1), #1)
                Print #2, curr1

2.3.2 代码

'读取文件夹内的每个文件内容到另外一个指定的txt里
Sub print1002()
    '指定输出路径
    path1 = "C:\Users\Administrator\Desktop\ptest1.txt"

    '指定读取文件夹的路径
    fp = "C:\Users\Administrator\Desktop\ppp\*.*"
    fn = Dir(fp)
    path2 = "C:\Users\Administrator\Desktop\ppp"
    
    
    '打印文件夹内的文件名
    Open path1 For Append As #2
    Do While fn <> ""
       'VBE调试窗口输出
       Debug.Print fn
       
       '向文件输出
       path3 = path2 & "\" & fn
       Open path3 For Input As #1
       Do While Not EOF(1)
            curr1 = input(LOF(1), #1)
            Print #2, curr1
       Loop
       Close #1
       fn = Dir
    Loop
    Close #2
End Sub

'读取文件,打开时用input即可
'用lof(别名文件号) 判断长度,可以直接 lof(1)-10 取部分内容
'用eof(1)判断是否到文件结尾
'需要input函数,可用变量暂存内容=input(长度,别名)

2.3.3 相关函数和语句

Input() 函数

  1. input函数,input(长度,别名)
  2. Input #1, MyString, MyNumber ' 将数据读入两个变量。

Input() 语句

  1. 语法:Input #filenumber, varlist
  2. 功能:从已打开的顺序文件中读出数据并将数据指定给变量。
  3. 说明:通常用 Write # 将 Input # 语句读出的数据写入文件。为了能够用 Input # 语句将文件的数据正确读入到变量中,在将数据写入文件时,要使用 Write # 语句而不使用 Print # 语句。使用 Write # 语句可以确保将各个单独的数据域正确分隔开。

EOF 函数

  1. 语法:EOF(filenumber)
  2. 功能:返回一个 Integer,它包含 Boolean 值 True,表明已经到达为 Random 或顺序 Input 打开的文件的结尾。

LOF 函数

  1. 语法:LOF(filenumber)
  2. 功能:返回一个 Long,表示用 Open 语句打开的文件的大小,该大小以字节为单位。

Loc 函数

  1. 语法:LOc(filenumber)
  2. 功能:返回一个 Long,在已打开的文件中指定当前读/写位置

数据处理 VBA还是python_数据处理 VBA还是python_12

2.4  向(已有)文件夹内的多个已有的多个文件写入

  • 目标:已有文件夹内的所有文件
  • 发现几个文件写入几个文件,全部覆盖
  • 写入内容,用print 语句写入

2.4.1 代码

'向文件夹内的多个文件输出内容,已有的多个文件,发现几个文件写入几个文件
Sub print1003()

    path1 = "C:\Users\Administrator\Desktop\ppp1"
    fp1 = "C:\Users\Administrator\Desktop\ppp1\*.*"
    fn1 = Dir(fp1)
    
    x = 1
    Do While fn1 <> ""
       path2 = path1 & "\" & fn1
       '向文件输出
       Open path2 For Output As #1
            Print #1, x & "第" & x & "句内容XXX"
       Close #1
       x = x + 1
       fn1 = Dir
    Loop
End Sub

2.5   向新建文件夹内的新文件输出

  • 目标:一般针对新文件夹,重新创建文件夹和新文件
  • 指定要输出到文件夹里的文件个数,
  •  为这些新文件写入内容

2.5.1 代码

'指定要输出到文件夹里的文件个数,一般针对新文件夹,重新创建文件夹和新文件
Sub print1004()
    '如果已有文件夹里有其他文件夹应该会忽略掉
     path2 = "C:\Users\Administrator\Desktop\ppp2"
 
     y = 1
     For i = 1 To 10
         path6 = path2 & "\" & i & ".txt"
         '向文件输出
         Open path6 For Output As #1
             Print #1, y & "第" & y & "句内容YYYYY"
         Close #1
         y = y + 1
     Next

End Sub

2.6  向新建文件夹内的新文件输出(先判断是否存在此文件夹)

  •  目标:严谨的输出到新文件夹内,严谨点先判断是否是空文件夹
  • 指定要输出到文件夹里的文件个数

2.6.1 代码

'指定要输出到文件夹里的文件个数,严谨点先判断是否是空文件夹
Sub print1005()
    path1 = "C:\Users\Administrator\Desktop\ppp3"

    '先判断文件夹是否存在
    If Dir(path1) <> "" Then
'       MsgBox ("请注意此文件夹已存在,里面可能已经包含其他文件",vbYesNo)
       MsgBox ("请注意此文件夹已存在,里面可能已经包含其他文件")
    Else
        MkDir (path1)
        
    End If
     
    Z = 1
    '因为确定了是新文件夹,肯定是空文件夹了
    For i = 1 To 10
        path7 = path1 & "\" & i & ".txt"
        '向文件输出
        Open path7 For Output As #1
            Print #1, Z & "第" & Z & "句内容ZZZZ"
        Close #1
        Z = Z + 1
    Next
    

End Sub

3 VBA 其他操作文件方法,比如fso的简要了解(未完善,需要整理)

3.1 基础语法

3.2 读文件

  • readtext = f1.readline
  • readtext = f1.readall

Set fso = CreateObject("scripting.filesystemobject")
Set f1 = fso.opentextfile(filepath1, 1, True)
Do Until f1.AtEndOfLine

        readtext = f1.readline

  • 1 判断文件结尾   Do Until f1.AtEndOfLine
  • 2 逐行读入内容,可以暂存入变量,readtext = f1.readline

readtext = f1.readall
f2.write (readtext)

  • 一次性读入也可以
  • 也可以一次性写入

3.3 写入文件

  • f2.write (readtext)
  • f2.writeline (readtext)

Set fso = CreateObject("scripting.filesystemobject")
Set f2 = fso.opentextfile(filepath2, 2, True)
f2.writeline (readtext)

  • fso.opentextfile(filepath2, 2, True)
  • 参数1:文件路径
  • 参数2:文件模式,1读,2写
  • 参数3:

3.4  代码如下(逐行读取,逐行写入)

Sub test202()

Dim fso As Object
Dim f1
Dim filepath1
Dim i

filepath1 = "C:\Users\Administrator\Desktop\wateranswer.txt"
filepath2 = "C:\Users\Administrator\Desktop\111.txt"
Set fso = CreateObject("scripting.filesystemobject")
Set f1 = fso.opentextfile(filepath1, , , tristate = 1)
Set f2 = fso.opentextfile(filepath2, 2, True)
 
i = 1
readtext = ""


Do Until f1.AtEndOfLine
    readtext = f1.readline
    Debug.Print readtext
    ThisWorkbook.Worksheets("sheet1").Cells(i, 1).Value = readtext
    
    f2.writeline (readtext)
    
    i = i + 1
Loop


Debug.Print "读取完成"
End Sub

3.5 还可以简单粗暴的一次性读出,写入

  • 这种简单粗暴,只适合文本文件,不适合EXCEL等表格格式内容

readtext = f1.readall
f2.write (readtext)

  • 方法
  • fso.readall 即可
  • 也不用循环了,也不要判断到文档结尾了
Sub test203()

Dim fso As Object
Dim f1
Dim filepath1
Dim i

filepath1 = "C:\Users\Administrator\Desktop\wateranswer.txt"
filepath2 = "C:\Users\Administrator\Desktop\111.txt"
Set fso = CreateObject("scripting.filesystemobject")
Set f1 = fso.opentextfile(filepath1, , , tristate = 1)
Set f2 = fso.opentextfile(filepath2, 2, True)
 

readtext = f1.readall
Debug.Print readtext
f2.write (readtext)
    

Debug.Print "读取完成"
End Sub

3.6  也可以读取文件夹内容

Sub test204()
 
Dim fso
Dim f1
'fso对象可以返回文件夹名或者文件名,但是打开文件夹需要用fso.getfolder()方法fso.opentextfile()不同
Set fso = CreateObject("scripting.filesystemobject")
Set f1 = fso.getfolder("C:\Users\Administrator\Desktop\ppp")
Debug.Print f1
Debug.Print f1.Name
Debug.Print f1.Files.Count
 
'dir 只能返回文件的名字,不能返回文件夹名字
f2 = Dir("C:\Users\Administrator\Desktop\ppp")
Debug.Print f2
'Debug.Print f2.Name   'f1是fso对象,但是f2不是,f2只是1个变量
 
f3 = Dir("C:\Users\Administrator\Desktop\ppp\ppp1.txt")
Debug.Print f3

End Sub
  • dir(文件名) 可以返回 文件名
  • dir(文件夹) 返回空,不能返回文件夹名字,但是不报错
  • dir(文件名) 不是对象
  • fso对象,可以取对象属性,如 fso.name
  • 'fso对象可以返回文件夹名或者文件名
  • 打开文件夹方法:fso.getfolder()
  • 打开文件方法:    fso.opentextfile()

3.7   fso的一些关键语法

fso的属性

  • f1.AtEndOfLine
  • f1.name
  • AtEndOfLine: 文件指针正好在行尾标记,则返回TRUE
  • AtEndOfStream: 文件指针在文件末尾,则返回TRUE
  • Line: 返回一个 TextStream 文件中的当前行号。
  • Column: 返回 TextStream 文件中当前字符位置的列号。
  • write 语句     
  • writeline  
  • fso.write      不能这样空行       
  • fso.writeline         
  • 没有这样的方法  fso.print          
  • f.close        (见上面)
  • f.write         (见上面)
  • f.writeline    (见上面)
  • f.read
  • f.readall
  • f.readline
  • f.skipline       光标跳到下一行
  • f.skip   5        光标往后跳几个字节
  • line input 语句
  • all input ?
  • readall
  • readline

3.8 使用fso 如何统计 某种后缀名类型的文件数量

Sub jackma101()
Dim path1
path1 = "C:\Users\Administrator\Desktop\test1"
 
Call ponyma101(path1)
 
End Sub
 
 
 
Function ponyma101(path1)
' 先查某类型的文件数量
 
Dim fso As Object
Dim fd1 As Object
Dim f1 As Object
 
 
Set fso = CreateObject("scripting.filesystemobject")
Set fd1 = fso.getfolder(path1)
 
x1 = fd1.Files.Count
Debug.Print "所有文件数为:" & x1
 
For Each f1 In fd1.Files
  If fso.getextensionname(path1 & "\" & f1.Name) = "txt" Then
'  fso.getfile(path1).getextensionname
'  f1.getextensionname
'只有一种语法可这么用
  y1 = y1 + 1
  End If
Next
 
Debug.Print ".txt文件数为:" & y1
 
End Function
Sub jackma101()
Dim path1
path1 = "C:\Users\Administrator\Desktop\test1"
 
Call ponyma101(path1)
 
End Sub
 
 
 
Function ponyma101(path1)
' 先查某类型的文件数量
 
Dim fso As Object
Dim fd1 As Object
Dim f1 As Object
 
 
Set fso = CreateObject("scripting.filesystemobject")
Set fd1 = fso.getfolder(path1)
 
x1 = fd1.Files.Count
Debug.Print "所有文件数为:" & x1
 
For Each f1 In fd1.Files
  If f1.Name Like "*.txt" Then
'只有一种语法可这么用
'  If fso.getextensionname(path1 & "\" & f1.Name) = "txt" Then
'  fso.getfile(path1).getextensionname
'  f1.getextensionname
  y1 = y1 + 1
  End If
Next
 
Debug.Print ".txt文件数为:" & y1
 
End Function

3.9 如果用VBA判断文件/文件夹 路径是否存在

VBA

判断文件是否存在,文件夹是否存在,直接

  •  if  dir(path1)=""
  •  if  dir(path1)=vbNullString


 如果是fso这种对象

  • Set fso = CreateObject("Scripting.FileSystemObject")
  • If fso.folderExists(strFullPath) Then FileFolderExists = True
  • Set fso = Nothing

4 用python 读取文件

4.1 我从之前我写的一个解题的代码里弄出一段代码

import copy
import os
import xlwt
import openpyxl

#中间省略了很多代码


#从文件夹里逐个读文件,逐个判断,结果输出到EXCEL里   

test = Puzzle()
folder_path=r"C:\Users\Administrator\Desktop\ppp"
file_names = os.listdir(r"C:\Users\Administrator\Desktop\ppp")
y=1

with open(r"C:\Users\Administrator\Desktop\wateranswer.txt",'a') as f:
    # 遍历文件名列表,逐个读取文件内容
    for file_name in file_names:
        print(file_name)
   
        file_path = os.path.join(folder_path, file_name)  # 应该会自动加\吧
        #if os.path.isfile(file_path):
        test.readfile(file_path)
        test.print()
        
        a = A_star(test)

        if a == None:
            print("None!")
            f.write("第%d题无解" %y)   #组合参数字符串?
            f.write("\n")
        else:
            print("%d steps"%len(a[0]))
            print(a[0])
            a[1].print()
            f.write("第%d题有解" %y) 
            f.write("%d steps"%len(a[0])+"\n")
            f.write(" ".join(str(x) for x in a[0])+"\n")  #数组转字符串
        y=y+1

4.2 函数和语法

4.2.1 导入模块 os

  • import os
  • 导入专门进行文件处理的的os模块

4.2.2  使用地址path找到文件

  • 文件地址path
  • 但是注意:rawdata,需要加 r"...."

path1=r"C:\Users\Administrator\Desktop\ptest1.txt"

with open(path1,"a") as file2:

  • 直接取文件夹内的文本名---直接返回文件名列表!
  • file_names = os.listdir(r"C:\Users\Administrator\Desktop\ppp")  可以得到一个文件名的列表!
  • 直接就是列表,方便操作
  • 文件名连接
  • file_path = os.path.join(folder_path, file_name)  # 应该会自动加\吧

4.3  打开文件

  •  open(path,"a") 
  • 参数1:path
  • 参数2:mode 打开模式,比如现在填的"a" 即可 mode="a",表示 append模式,如果缺省,默认是read模式
  • 有兼容读写的模式:"r+","w+","a+"
  • 返回值: open(path,"a") 返回的是文件对象,可以复制给一个变量

r

只读模式,打开一个文件用于读取。如果文件不存在,则会发生错误。

w

写入模式,打开一个文件用于写入。如果文件已经存在,则清空文件内容;如果文件不存在,则创建新文件。

a

追加模式,打开一个文件用于追加内容。如果文件不存在,则创建新文件。

x

创建模式,创建一个新文件用于写入。如果文件已经存在,则会发生错误。

b

二进制模式,用于读取或写入二进制数据。与其他模式配合使用,如rb、wb、ab等。

t

文本模式,默认模式,用于读取或写入文本数据。与其他模式配合使用,如rt、wt、at等。

+

读写模式,用于既能读取又能写入文件的操作。与其他模式配合使用,如r+、w+、a+等。

4.3.1  打开文件方式1:使用 open() 函数打开,file=open()

  • file=open(path1,"a") 
  • 错误 open(path1,"a") as file:

4.3.2 打开文件方式2: 使用with语句+打开, 就是 with + 文件对象

  • 正确  with open(path1,"a") as file2:

4.3.3 验证 open() 函数的返回值

file3=open(path1,"a")
print(file3)


可以看到会返回这样的一个对象<_io.TextIOWrapper name='C:\\Users\\Administrator\\Desktop\\ptest1.txt' mode='a' encoding='cp936'>


4.4 关闭文件 file.close() 函数

  • 使用 with open() as f  不需要再关闭文件
  • 但是如果只 open打开,没有使用with则需要 file.close()

4.5 读文件内容

4.5.1  读入内容方法1, file.read()整体读入

  • file.read() 函数,整体读入文件内容

file3=open(path1,"a+")
file3.seek(0)
content1=file3.read()
print(content1)

4.5.2 读入内容方法1, file.readlines()整体读入,并且直接返回的是列表

  • file.readlines() 函数,整体读入文件内容
  • 返回内容是列表,可以直接切片操作
  • 比如下面这个取到的就是内容数组的0,1,2前3个内容

file3=open(path1,"a+")
file3.seek(0)
lines=file3.readlines()
print(lines)
print(lines[:3])

数据处理 VBA还是python_读取文件_13

4.5.3  读入内容方法3:  for line in file 逐行读入

  • file 本身可以是一个 可迭代对象(列表?),天生按行分隔
  • 直接用 for line in file + print(line) 可以逐行读入
  • 但是这样每行之间都会空一行

file3=open(path1,"a+")
file3.seek(0)
for line in file3:
    print(line)

4.5.4 读入内容方法4: file.readline()逐行读入

  • 直接用 file3.readline() 可以逐行读入
  • 但是这样每行之间都会空一行
  • file3.readline(2)  还可以指定读入某行的几个字符,这里是前2个字符

file3=open(path1,"a+")
file3.seek(0)
for line in file3:
    print(line)

4.5.5 关于指针函数seek

  • file3.seek(0)
  • fileObject.seek(offset[, whence])
  • offset:表示开始的偏移量,也就是需要偏移的字节数。
  • whence为可选参数,默认值为0,表示要从哪个位置开始偏移。
  • 0代表将文件开头作为起点,1代表从当前位置开始算起,2代表从文 件末尾算起。
  • 为什么要用seek()
  • 因为使用 读写文件,包括read() ,for line in file ,甚至是write 写文件,都会修改文件的指针,如果要读文件全部内容,必须用seek(0) 进行复位

4.6  代码例子1:读写文件

import os
path1=r"C:\Users\Administrator\Desktop\ptest2.txt"
path2=r"C:\Users\Administrator\Desktop\ppp"
file_names=os.listdir(path2)

#for file_name in file_names:
    #print(file_name)

with open(path1,"a") as file2:  # open必须连着 with open ?
    file2.write("新增一句")
    file2.write("\n")

file3=open(path1,"a+")
print(file3)
file3.write("再新增一句")
file3.write("\n")

file3=open(path1,"a+")
file3.seek(0)
content1=file3.read()
print(content1)

file3=open(path1,"a+")
file3.seek(0)
for line in file3:
    print(line)

file3=open(path1,"a+")
file3.seek(0)
print(file3.readline())
print(file3.readline())
print(file3.readline(2))   #只要这行的前2个字符


file3=open(path1,"a+")
file3.seek(0)
lines=file3.readlines()
print(lines)
print(lines[:3])

数据处理 VBA还是python_数据处理 VBA还是python_14

数据处理 VBA还是python_文件名_15

4.7 代码例子2:读写文件

  • 使用with open ()  as 别名 打开文件
  • 使用write 往文件内写入内容 
import os
path1=r"C:\Users\Administrator\Desktop\ptest1.txt"
path2=r"C:\Users\Administrator\Desktop\ppp"
#file_names = os.listdir(path2) 
file_names=os.listdir(path2)

for file_name in file_names:
    print(file_name)


with open(path1,"a") as file2:  # open必须连着 with open ?
    file2.write("新增一句")
    file2.write("\n")

数据处理 VBA还是python_python_16

4.8 往文件内写入内容

  •  f.write("第%d题无解" %y)   
  •  f.write("\n")
  • write()写入的内容是一个字符串,如果不是,则需要提前转换。
  • f.write(str(a)) # 强制类型转换
     

5  VBA 和python 打开文本文件的比较

5.1 VBA处理文件方法总结

5.1.1 文件处理方法1: 函数式编程

  • 用dir() 读文件名,
  • 用 open () for  output as #1 取得文件
  • 用print写入,或者用=input 读入
  • 注意close

5.1.2 也有对象的方法 FSO

  • 需要set 对象
  • 其他流程类似

5.2 py处理文本文件的方法总结

  • 处理流程和VBA差不多
  • 处理逻辑差不多
  • file 一定是对象
  • 使用 file=open()  打开文件
  • 使用 file.write() 往文件内写入内容 

5.3 比较 VBA 和 python 文件处理的相关代码差别

5.3.1 VBA的内嵌EXCEL天生优势   VS python的各种import模块

  • 先撇开VBA的编辑器VBE内嵌在EXCEL里,处理EXCEL有近水楼台的效果,比较python和VBA处理一般文件,比如文本文件的差别。
  • python的方法,还是他各种各样的import的轮子,对比封闭的VBA,扩展性是无敌的

5.3.2 VBA里还有很多语句式的命令,python里基本都是函数了

  • VBA里有很多语句和函数并存,甚至语句为主,函数次之
  • 比如  input() 和 input  write 和 write()
  • 历史原因
  • 代码用的人少了
  • 只是office占用还很高,否则VBA早没了

5.3.3 易用性的问题

VBA

  • 吐槽:open path for mode  as # 居然没有一个支持既可读又可写的模式。。。。不可想象,要想又读又写,只能分开!

python

  • 兼容模式 python 可以用  open (path,r+) 等模式即可
  • file_names = os.listdir(r"C:\Users\Administrator\Desktop\ppp")  可以得到一个文件名的列表!直接就是列表,方便操作
  • lines=file.readlines()  可以直接返回一个列表!

5.3.4 简洁,方便来看

  • 优势在于,py语言本身的简洁,毕竟是新语言