1、实现目标
读取文件,将文件中的数据一行行的取出。
2、代码实现
1)、方式1:
通过BufferedReader的readLine()方法。
/**
* 功能:Java读取txt文件的内容 步骤:1:先获得文件句柄 2:获得文件句柄当做是输入一个字节码流,需要对这个输入流进行读取
* 3:读取到输入流后,需要读取生成字节流 4:一行一行的输出。readline()。 备注:需要考虑的是异常情况
*
* @param filePath
* 文件路径[到达文件:如: D:\aa.txt]
* @return 将这个文件按照每一行切割成数组存放到list中。
*/
public static List<String> readTxtFileIntoStringArrList(String filePath)
{
List<String> list = new ArrayList<String>();
try
{
String encoding = "GBK";
File file = new File(filePath);
if (file.isFile() && file.exists())
{ // 判断文件是否存在
InputStreamReader read = new InputStreamReader(
new FileInputStream(file), encoding);// 考虑到编码格式
BufferedReader bufferedReader = new BufferedReader(read);
String lineTxt = null;
while ((lineTxt = bufferedReader.readLine()) != null)
{
list.add(lineTxt);
}
bufferedReader.close();
read.close();
}
else
{
System.out.println("找不到指定的文件");
}
}
catch (Exception e)
{
System.out.println("读取文件内容出错");
e.printStackTrace();
}
return list;
}
2)、方式2
通过文件byte数组暂存文件中内容,将其转换为String数据,再按照 “回车换行” 进行分割。
/**
* 读取filePath的文件,将文件中的数据按照行读取到String数组中
* @param filePath 文件的路径
* @return 文件中一行一行的数据
*/
public static String[] readToString(String filePath)
{
File file = new File(filePath);
Long filelength = file.length(); // 获取文件长度
byte[] filecontent = new byte[filelength.intValue()];
try
{
FileInputStream in = new FileInputStream(file);
in.read(filecontent);
in.close();
} catch (FileNotFoundException e)
{
e.printStackTrace();
} catch (IOException e)
{
e.printStackTrace();
}
String[] fileContentArr = new String(filecontent).split("\r\n");
return fileContentArr;// 返回文件内容,默认编码
}
3)、测试
public static void main(String[] args)
{
List<String> stringList = readTxtFileIntoStringArrList("C:\\soft\\java\\tomcat\\apache-tomcat-7.0.40\\webapps\\appDataGenerate\\log4j\\lepai_recognize_cache.log");
System.out.println("-------使用BufferedReader读取-----------");
for(String str : stringList)
{
System.out.println(str);
}
System.out.println("\n---------使用byte直接缓存整个文件到内存----------------");
String[] stringArr = readToString("C:\\soft\\java\\tomcat\\apache-tomcat-7.0.40\\webapps\\appDataGenerate\\log4j\\lepai_recognize_cache.log");
for(int i = 0 ; i < stringArr.length ; i ++)
{
System.out.println(stringArr[i]);
}
}
结果:
-------使用BufferedReader读取-----------
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-12-01 14:52:04] [RecognizeCache] [INFO] : 读取文件:4209bad42de0f6e55c0daf0bd24b635a.txt
---------使用byte直接缓存整个文件到内存----------------
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-11-30 13:21:28] [RecognizeCache] [INFO] : RecogizeCache init
[2015-12-01 14:52:04] [RecognizeCache] [INFO] : 读取文件:4209bad42de0f6e55c0daf0bd24b635a.txt
3、比较
方式1是将文件的一部分或全部数据读取出来用BufferReader缓存起来,需要再冲缓存中取数据,这样比要得时候去文件中读取要快一些。
方式2是一次把文本的原始内容直接读取到内存中再做处理(暂时不考虑内存大小),这样做效率也会提高。同时,可以处理当你使用第1方式用readLine()方法时,文件又有线程在不断的向文件中写数据【只处理现在已经在文件中的数据】。另外,用readline()之类的方法,可能需要反复访问文件,而且每次readline()都会调用编码转换,降低了速度,所以,在已知编码的情况下,按字节流方式先将文件都读入内存,再一次性编码转换是最快的方式。
有错误的希望大牛不吝赐教。 想了解一下,
1、通过ftp取一个文件到本地,我如何判断对方的文件是否已经写完了。
2、当我使用上面的BufferedReader的readLine()方法一行行读取文件的时候,我还向文件中添加数据,会不会出现文件读取结束不了的情况。
源码下载:
https://github.com/zcr1007391008/demo 的TestReadAllFileToMemory。
致谢:感谢您的阅读!