昨天写作业时遇到的问题,因为储存数据的txt文件是使用UTF-8编码的,用平常常用的FileReader去读取的话部分中字符号(eg: “ ”)会出现乱码的现象。一开始有点头疼,后来浏览SStack Overflow时找到了解决方案
(https://stackoverflow.com/questions/37940919/scan-input-with-utf-8/37940968)
try {
FileReader file = new FileReader(filePath);
BufferedReader br = new BufferedReader(file);
String temp = br.readLine();
while (temp != null) {
...
temp = br.readLine();
}
} catch(Exception e) {
e.printStackTrace();
}
因为这个作业一行行获取data的话会方便,所以我选择了用BufferedReader来读取数据。但是当我把读完数据打印后,发现一大堆乱码(扑街···)。接着我把data.txt打开对比后,发现乱码的基本都是中字符号,感觉应该时encoding的问题,所以一开始我尝试能不能在FileReader里加上编码,像这样的:
FileReader file = new FileReader(filePath, encoding = "UTF-8");
Emmm…报错了。转而投向广大网友的帮助。
在Stack Overflow上看到了一个比较简单且不错的方法。运用InputStreamReader来读取文件,因为其自带encoding。
try {
InputStreamReader file = new InputStreamReader(new FileInputStream(FilePath), "UTF-8");
BufferedReader br = new BufferedReader(file);
String temp = br.readLine();
while (temp != null) {
...
temp = br.readLine();
}
} catch(Exception e) {
System.out.println("Errors in reading test-files!");
e.printStackTrace();
}
迎刃而解。记录一下方便以后回来查看!