作为数据库工程师,跟数据打交道是常见的事情,数据导入导出

也是常遇到的事情。下面对mysql的load data 作一些学习和总结。

通过对5.1官方文档学习,并记录一下

工具使用语法

LOAD DATA [LOW_PRIORITY | CONCURRENT] [LOCAL] INFILE 'file_name.txt'
[REPLACE | IGNORE]
INTO TABLE tbl_name
[FIELDS
[TERMINATED BY 'string']
[[OPTIONALLY] ENCLOSED BY 'char']
[ESCAPED BY 'char' ]
]
[LINES
[STARTING BY 'string']
[TERMINATED BY 'string']
]
[IGNORE number LINES]
[(col_name_or_user_var,...)]
[SET col_name = expr,...)]

LOAD DATA INFILE语句用于高速地从一个文本文件中读取行,并装入一个表中。文件名称必须为一个文字字符串

LOW_PRIORITY & CONCURRENT

LOW_PRIORITY: LOAD DATA语句的执行被延迟,直到没有其它的客户端从表中读取为止.

CONCURRENT :如果一个MyISAM表满足同时插入的条件(即该表在中间有空闲块),LOAD

DATA正在执行时,其它线程会从表中重新获取数据。即使没有其它线程在同时使用本表格

使用本选项也会略微影响LOAD DATA的性能

LOCAL : 如果指定了LOCAL,则被认为与连接的客户端有关,如果指定了LOCAL,则文件会被客户主机上的客户端读取,并被发送到服务器。文件会被给予一个完整的路径名称,以指定确切的位置。如果给定的是一个相对的路径名称,则此名称会被理解为相对于启动客户端时所在的目录

如果LOCAL没有被指定,则文件必须位于服务器主机上,并且被服务器直接读取。

当在服务器主机上为文件定位时,服务器使用以下规则:

1. 如果给定了一个绝对的路径名称,则服务器使用此路径名称。

2. 如果给定了带有一个或多个引导组件的相对路径名称,则服务器会搜索相对于服务器数据目录的文件。

3. 如果给定了一个不带引导组件的文件名称,则服务器会在默认数据库的数据库目录中寻找文件。

注释

如果使用了LOCAL 参数,其实会比直接操作数据库文件慢,毕竟每次都会通过mysql客户

端来处理文件,再发送给sever 处理。

####REPLACE & IGNORE

如果您指定了REPLACE,则输入行会替换原有行(换句话说,与原有行一样,对一个主索引或唯一索引具有相同值的行)

如果您指定IGNORE,则把原有行复制到唯一关键字值的输入行被跳过

如果您这两个选项都不指定,则运行情况根据LOCAL关键词是否被指定而定。不使用LOCAL

时,当出现重复关键字值时,会发生错误,并且剩下的文本文件被忽略。使用LOCAL时,

默认的运行情况和IGNORE被指定时的情况相同;这是因为在运行中间,服务器没有办法中

止文件的传输。

如果您希望在载入运行过程中忽略外键的限制,您可以在执行LOAD DATA前发送一个SET FOREIGN_KEY_CHECKS=0语句

注释

当您有许多索引时,这通常会使LOAD DATA INFILE大大加快。通常,LOAD DATA INFILE的速度会非常快,但是在某些极端情况下,您可以在把文件载入到表中之前使用ALTER TABLE...DISABLE KEYS关闭LOAD DATA INFILE,或者在载入文件之后使用ALTER TABLE...ENABLE KEYS再次创建索引,使创建索引的速度更快

LOAD DATA INFILE &SELECT…INTO OUTFILE

LOAD DATA INFILE是SELECT…INTO OUTFILE的补语,要从一个表中把数据

写入一个文件中,应使用SELECT…INTO OUTFILE。要读取文件,放回到表中,

应使用LOAD DATA INFILE。FIELDS和LINES子句的语法对于两个语句是一样的。

两个子句都是自选的,但是如果两个都被指定了,FIELDS必须位于LINES的前面。

如果您指定了一个FIELDS子句,则每个亚子句(TERMINATED BY, [OPTIONALLY] ENCLOSED BY和ESCAPED BY)也是自选的。不过,您必须指定其中至少一个。如果您不指定FIELDS

子句,则默认值为假设您写下如下语句时的值:

FIELDS TERMINATED BY '\t' ENCLOSED BY '' ESCAPED BY '\\'

如果您不指定LINES子句,则默认值为假设您写下如下语句时的值:

LINES TERMINATED BY '\n' STARTING BY '

换句话说,当读取输入值时,默认值会使LOAD DATA INFILE按如下方式运行:

用例如下:

示例1:

mysql> LOAD DATA INFILE '/tmp/test.txt'

-> INTO TABLE test LINES STARTING BY "xxx";

使用此语句,您可以读入包含有如下内容的文件:

xxx"row",1

something xxx"row",2

并只得到数据("row",1)和("row",2)。

示例 2 :

IGNORE number LINES选项可以被用于在文件的开始处忽略行。例如,您可以使用IGNORE 1 LINES来跳过一个包含列名称的起始标题行

mysql> LOAD DATA INFILE ‘/tmp/test.txt’

-> INTO TABLE test IGNORE 1 LINES;

示例 3 :当您联合使用SELECT…INTO OUTFILE和LOAD DATA INFILE来从一个数据库中把数据写入一个文件中,然后再读取文件,返回到数据库中时,用于两个语句的field-和line-handling 选项必须匹配。否则,LOAD DATA INFILE不会正确地理解文件的内容。

假设您使用SELECT…INTO OUTFILE来编写一个的文件,字段由逗号分隔:

mysql> SELECT * INTO OUTFILE 'data.txt'

-> FIELDS TERMINATED BY ','

-> FROM table2;

要读取由逗号分隔的文件并返回,则正确的语句应该是:

mysql> LOAD DATA INFILE 'data.txt' INTO TABLE table2

-> FIELDS TERMINATED BY ',';

如果您尝试使用以下所示的语句读入文件,则不会运行,因为该语句命令LOAD DATA INFILE寻找位于字段之间的制表符:

mysql> LOAD DATA INFILE 'data.txt' INTO TABLE table2

-> FIELDS TERMINATED BY '\t';

结果很可能是,每个输入行被理解为一个单一字段。

###LOAD DATA INFILE也可以被用于读取从外源中获取的文件。

示例 4 :一个dBASE格式的文件具有以逗号分隔并且包含在双引号中的字段。如果文件中的各行以新行为结尾,则此处所示的语句描述了您可以用于载入文件的field-和line-handling选项:

mysql> LOAD DATA INFILE 'data.txt' INTO TABLE tbl_name

-> FIELDS TERMINATED BY ',' ENCLOSED BY '"'

-> LINES TERMINATED BY '\n';

所有field-或line-handling选项都可以指定一个空字符串(‘’) 如果字符串不是空的,

则FIELDS [OPTIONALLY] ENCLOSED BY和FIELDS ESCAPED BY值必须为单一字符。FIELDS TERMINATED BY, LINES STARTING BY和LINES TERMINATED BY值可以超过一个字符。例如,要编写由回车/换行成对字符作为结尾的行,或读取包含这类行的文件,则应指定一个LINES TERMINATED BY ‘\r\n’子句。

FIELDS [OPTIONALLY] ENCLOSED BY用于控制字段的引号。对于(SELECT…INTO OUTFILE),如果您忽略了词语OPTIONALLY,则所有的字段都被包含在ENCLOSED BY字符串中。此处展示了此类输出的一个示例(使用逗号作为字段分隔符):

"1","a string","100.20"

"2","a string containing a , comma","102.20"

"3","a string containing a \" quote","102.20"

"4","a string containing a \", quote and comma","102.20"

如果您指定了OPTINALLY,则ENCLOSED BY字符只被用于包含具有字符串数据类型

(比如CHAR, BINARY, TEXT或ENUM)的列中的值:

1,"a string",100.20

2,"a string containing a , comma",102.20

3,"a string containing a \" quote",102.20

4,"a string containing a \", quote and comma",102.20

...

实际生产中用到 的和字段对应关系

load data infile '/data/tmp/load/test.vp' replace into table mdm_biz_list_interface fields terminated by ',' LINES TERMINATED BY '\n' ( $cols ) ;

总结

load data 对于mysql 来讲 就相当于oracle的 sql loader ,这些都是作为一个DBA

的基本工作技能。 mark一下,记做笔记 ...