今天工作中需要读取CSV文件,之前对Excel文件操作的比较多,第一次碰到需要操作CSV文件的情况。

CSV文件的介绍

刚开始想着自己写一个工具类,于是上网搜了下CSV,只有详细了解文件结构后,才能写出正确的程序。

逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本(NOTE)来开启,再则先另存新档后用EXCEL开启,也是方法之一。

这是一段来自百度百科的介绍,看完这段我觉得我已经足够了解CSV文件了。我觉得如果存纯文本类型的数据,反而用CSV比Excel来得方便。

使用JavaCSV api

毕竟第一次用,自己写肯定不够全面,想找个参考的,于是百度找到了JavaCSV api,看了下用起来足够方便,因为这个需求比较紧,所以先拿来用,等以后有空闲的时间了,再试着自己写个玩玩吧。

导包

我现在基本上都是Maven构建项目,相信大家也是,就不提供jar包了。

<dependency>
      <groupId>net.sourceforge.javacsv</groupId>
      <artifactId>javacsv</artifactId>
      <version>2.0</version>
    </dependency>

写CSV文件

CsvWriter api手册

public static void writer() throws IOException {

        // 第一参数:新生成文件的路径 第二个参数:分隔符(不懂仔细查看引用百度百科的那段话) 第三个参数:字符集
        CsvWriter csvWriter = new CsvWriter("F:/demo.csv", ',', Charset.forName("UTF-8"));

        // 表头和内容
        String[]  headers = {"姓名", "年龄", "性别"};
        String[] content = {"张三", "18", "男"};

        // 写表头和内容,因为csv文件中区分没有那么明确,所以都使用同一函数,写成功就行
        csvWriter.writeRecord(headers);
        csvWriter.writeRecord(content);

        // 关闭csvWriter
        csvWriter.close();

    }

java写入kafka java写入csv文件_java

读CSV文件

CsvReader api手册

public static void read() throws IOException {

        // 第一参数:读取文件的路径 第二个参数:分隔符(不懂仔细查看引用百度百科的那段话) 第三个参数:字符集
        CsvReader csvReader = new CsvReader("F:/demo.csv", ',', Charset.forName("UTF-8"));

        // 如果你的文件没有表头,这行不用执行
        // 这行不要是为了从表头的下一行读,也就是过滤表头
        csvReader.readHeaders();

        // 读取每行的内容
        while (csvReader.readRecord()) {
            // 获取内容的两种方式
            // 1. 通过下标获取
            System.out.print(csvReader.get(0));

            // 2. 通过表头的文字获取
            System.out.println(" " + csvReader.get("年龄"));
        }
    }

java写入kafka java写入csv文件_百度_02

其他

这两个类中还有很多其他的方法,如果有需要使用,可以阅读相关的api手册