今天工作中需要读取CSV文件,之前对Excel文件操作的比较多,第一次碰到需要操作CSV文件的情况。
CSV文件的介绍
刚开始想着自己写一个工具类,于是上网搜了下CSV,只有详细了解文件结构后,才能写出正确的程序。
逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本(NOTE)来开启,再则先另存新档后用EXCEL开启,也是方法之一。
这是一段来自百度百科的介绍,看完这段我觉得我已经足够了解CSV文件了。我觉得如果存纯文本类型的数据,反而用CSV比Excel来得方便。
使用JavaCSV api
毕竟第一次用,自己写肯定不够全面,想找个参考的,于是百度找到了JavaCSV api,看了下用起来足够方便,因为这个需求比较紧,所以先拿来用,等以后有空闲的时间了,再试着自己写个玩玩吧。
导包
我现在基本上都是Maven构建项目,相信大家也是,就不提供jar包了。
<dependency>
<groupId>net.sourceforge.javacsv</groupId>
<artifactId>javacsv</artifactId>
<version>2.0</version>
</dependency>
写CSV文件
public static void writer() throws IOException {
// 第一参数:新生成文件的路径 第二个参数:分隔符(不懂仔细查看引用百度百科的那段话) 第三个参数:字符集
CsvWriter csvWriter = new CsvWriter("F:/demo.csv", ',', Charset.forName("UTF-8"));
// 表头和内容
String[] headers = {"姓名", "年龄", "性别"};
String[] content = {"张三", "18", "男"};
// 写表头和内容,因为csv文件中区分没有那么明确,所以都使用同一函数,写成功就行
csvWriter.writeRecord(headers);
csvWriter.writeRecord(content);
// 关闭csvWriter
csvWriter.close();
}
读CSV文件
public static void read() throws IOException {
// 第一参数:读取文件的路径 第二个参数:分隔符(不懂仔细查看引用百度百科的那段话) 第三个参数:字符集
CsvReader csvReader = new CsvReader("F:/demo.csv", ',', Charset.forName("UTF-8"));
// 如果你的文件没有表头,这行不用执行
// 这行不要是为了从表头的下一行读,也就是过滤表头
csvReader.readHeaders();
// 读取每行的内容
while (csvReader.readRecord()) {
// 获取内容的两种方式
// 1. 通过下标获取
System.out.print(csvReader.get(0));
// 2. 通过表头的文字获取
System.out.println(" " + csvReader.get("年龄"));
}
}
其他
这两个类中还有很多其他的方法,如果有需要使用,可以阅读相关的api手册