LightDB 23.3 版本修复无法使用mysql_fdw查询超过64K字段的问题。
注:笔者使用的是mysql_fdw REL-2_7_0,这个bug已在REL-2_8_0中修复,我们来复盘一下造成这个问题的原因所在。
问题复现
-- mysql上创建测试表
create table fdwtest(a longtext);
insert into fdwtest select repeat('a',65534);
insert into fdwtest select repeat('b',65535);
insert into fdwtest select repeat('c',65536);
insert into fdwtest select repeat('d',65537);
insert into fdwtest select repeat('e',65538);
mysql> select substr(a,1,10),length(a) from fdwtest;
+----------------+-----------+
| substr(a,1,10) | length(a) |
+----------------+-----------+
| aaaaaaaaaa | 65534 |
| bbbbbbbbbb | 65535 |
| cccccccccc | 65536 |
| dddddddddd | 65537 |
| eeeeeeeeee | 65538 |
+----------------+-----------+
5 rows in set (0.00 sec)
-- 在pg中使用mysql_fdw查询mysql表
-- load extension first time after install
CREATE EXTENSION mysql_fdw;
-- create server object
CREATE SERVER mysql_server
FOREIGN DATA WRAPPER mysql_fdw
OPTIONS(host '127.0.0.1', port '3306');
-- create user mapping
CREATE USER MAPPING FOR lightdb
SERVER mysql_server
OPTIONS (username 'ludeng', password 'ludeng');
-- create foreign table
CREATE FOREIGN TABLE fdwtest
(
a text
)
SERVER mysql_server
OPTIONS (dbname 'ludeng', table_name 'fdwtest');
-- 在msyql中的长度超过64k
lightdb@postgres=# select substr(a,1,10),length(a) from fdwtest;
substr | length
------------+--------
aaaaaaaaaa | 65534
bbbbbbbbbb | 65535
cccccccccc | 65536
(3 rows)
可以看到,对于长度超过64K的字段,已经无法通过mysql_fdw来查询到了。
mysql_fdw工作原理
我们知道mysql数据库对外提供了一套c语言的API接口libmysqlclient,相关资料可以参考官网MySQL :: MySQL 8.0 C API Developer Guide。而mysq_fdw作为postgresql的一个插件,正是使用了libmysqlclient API来实现在postgresql上直接查询mysql数据库表的目的,使得postgresql用户可以像直接查询postgresql数据库一样查询mysql数据库,大致的执行流程如下
libmysqlclient使用
现在我们知道了mysql_fdw的大致工作原理是通过libmysqlclient与mysql去交互,那么我们就来简单使用一下libmysqlclient提供的c语言API,对libmysqlclient有个大致的了解。由于mysql_fdw的实现是基于C API Prepared Statement Interface的,那么我们就简单使用下相关的API,细节可参考官网
在mysql上使用c语言prepared statement API的大致步骤如下
1、使用mysql_stmt_init创建一个prepared statement处理器,调用mysql_stmt_prepare时传入一个字符串(sql语句)来创建一个prepared statement。当调用mysql_stmt_prepare时,mysql客户端/服务端协议执行了如下操作:
1-服务端解析(包括词法和语法解析)传入的sql语句,并返回给客户端OK状态(返回值为0),同时还返回一个statement ID(该statement ID是正整数,用于标识所有本次sql执行的各个步骤),以及参数个数、列数和结果集元数据
2-客户端使用statement ID来进行接下来的操作,以便服务器知道这是针对那个sql语句的
2、通过mysql_stmt_bind_param来设置参数,所有参数必须均被设置,否则执行时会报错或返回不可预期的结果。
3、调用mysql_stmt_execute()执行sql语句,具体步骤为
1-客户端发送sql语句的参数给服务器,即绑定参数步骤
2-服务端用客户端提供的statment ID找到是哪个sql语句,用客户端提供的参数替换占位符并执行sql语句。若sql语句需要返回结果集,服务端返回结果数据给客户端,否则只需要返回OK状态,以及几行数据被更新/删除/插入
4、如果sql语句是一个select语句或者其它返回结果的语句,那么可以调用mysql_stmt_result_metadata获取结果集的元数据。结果集元数据是个MYSQL_RES结构,而结果集本身也是MYSQL_RES结构,结果集元数据中包含了查询的列数以及每列的相关信息。
5、若一个sql语句会产生结果集,需要通过调用mysql_stmt_bind_result来绑定数据缓冲区(data buffer),而数据缓冲区将用于后续获取数据。
6、调用mysql_stmt_fetch将数据逐行获取到缓冲区,直到所有数据行均被获取到。
7、如有必要,重复步骤3至6。通过调用mysql_stmt_bind_param更改prepared statement的参数值,可以重复mysql_stmt_execute来重新执行该语句。
8、当sql语句执行结束时,调用mysql_stmt_close关闭处理器(statement handler),这将释放所有资源,且handler此时已处于无效状态。
9、若使用mysql_stmt_result_metadata获取了结果集的元数据,需调用mysql_free_result来释放元数据相关资源防止内存泄露。
在了解了API的大致使用之后,我们直接上一个hello world例子:
#include <stdio.h>
#include "mysql/mysql.h"
#include <stdlib.h>
#include <string.h>
#define STRING_SIZE 50
#define SELECT_SAMPLE "select length(a),substr(a,1,10) from fdwtest limit 5"
#define COLUMN_NUMS 2
typedef char bool;
int main()
{
MYSQL *mysql; // connection
MYSQL_STMT *stmt;
MYSQL_BIND bind[COLUMN_NUMS];
MYSQL_RES *prepare_meta_result;
MYSQL_TIME ts;
unsigned long length[COLUMN_NUMS];
int param_count, column_count, row_count;
short small_data;
int int_data;
char str_data[STRING_SIZE];
bool is_null[COLUMN_NUMS];
bool error[COLUMN_NUMS];
// create connection to MySQL
mysql = mysql_init(NULL);
if(mysql_real_connect(mysql, "127.0.0.1", "ludeng", "ludeng", "ludeng", 3306, NULL, 0) == NULL) {
fprintf(stderr, "sorry, no database connection ...\n");
return 1;
}
/* Prepare a SELECT query to fetch data from test_table */
stmt = mysql_stmt_init(mysql);
if (!stmt)
{
fprintf(stderr, " mysql_stmt_init(), out of memory\n");
exit(0);
}
if (mysql_stmt_prepare(stmt, SELECT_SAMPLE, strlen(SELECT_SAMPLE)))
{
fprintf(stderr, " mysql_stmt_prepare(), SELECT failed\n");
fprintf(stderr, " %s\n", mysql_stmt_error(stmt));
exit(0);
}
fprintf(stdout, " prepare, SELECT successful\n");
/* Get the parameter count from the statement */
param_count= mysql_stmt_param_count(stmt);
fprintf(stdout, " total parameters in SELECT: %d\n", param_count);
if (param_count != 0) /* validate parameter count */
{
fprintf(stderr, " invalid parameter count returned by MySQL\n");
exit(0);
}
/* Execute the SELECT query */
if (mysql_stmt_execute(stmt))
{
fprintf(stderr, " mysql_stmt_execute(), failed\n");
fprintf(stderr, " %s\n", mysql_stmt_error(stmt));
exit(0);
}
/* Fetch result set meta information */
prepare_meta_result = mysql_stmt_result_metadata(stmt);
if (!prepare_meta_result)
{
fprintf(stderr," mysql_stmt_result_metadata(), returned no meta information\n");
fprintf(stderr, " %s\n", mysql_stmt_error(stmt));
exit(0);
}
/* Get total columns in the query */
column_count= mysql_num_fields(prepare_meta_result);
fprintf(stdout," total columns in SELECT statement: %d\n", column_count);
if (column_count != 2) /* validate column count */
{
fprintf(stderr, " invalid column count returned by MySQL\n");
exit(0);
}
/* Bind the result buffers for all 2 columns before fetching them */
memset(bind, 0, sizeof(bind));
/* INTEGER COLUMN */
bind[0].buffer_type= MYSQL_TYPE_LONG;
bind[0].buffer= (char *)&int_data;
bind[0].is_null= &is_null[0];
bind[0].length= &length[0];
bind[0].error= &error[0];
/* STRING COLUMN */
bind[1].buffer_type= MYSQL_TYPE_STRING;
bind[1].buffer= (char *)str_data;
bind[1].buffer_length= STRING_SIZE;
bind[1].is_null= &is_null[1];
bind[1].length= &length[1];
bind[1].error= &error[1];
/* Bind the result buffers */
if (mysql_stmt_bind_result(stmt, bind))
{
fprintf(stderr, " mysql_stmt_bind_result() failed\n");
fprintf(stderr, " %s\n", mysql_stmt_error(stmt));
exit(0);
}
/* Now buffer all results to client (optional step) */
if (mysql_stmt_store_result(stmt))
{
fprintf(stderr, " mysql_stmt_store_result() failed\n");
fprintf(stderr, " %s\n", mysql_stmt_error(stmt));
exit(0);
}
/* Fetch all rows */
row_count= 0;
fprintf(stdout, "Fetching results ...\n");
while (!mysql_stmt_fetch(stmt))
{
row_count++;
fprintf(stdout, " row %d\n", row_count);
/* column 1 */
fprintf(stdout, " column1 (integer) : ");
if (is_null[0])
fprintf(stdout, " NULL\n");
else
fprintf(stdout, " %d(%ld)\n", int_data, length[0]);
/* column 2 */
fprintf(stdout, " column2 (string) : ");
if (is_null[1])
fprintf(stdout, " NULL\n");
else
fprintf(stdout, " %s(%ld)\n", str_data, length[1]);
}
/* Validate rows fetched */
fprintf(stdout, " total rows fetched: %d\n", row_count);
if (row_count != 5)
{
fprintf(stderr, " MySQL failed to return all rows\n");
exit(0);
}
/* Free the prepared result metadata */
mysql_free_result(prepare_meta_result);
/* Close the statement */
if (mysql_stmt_close(stmt))
{
/* mysql_stmt_close() invalidates stmt, so call */
/* mysql_error(mysql) rather than mysql_stmt_error(stmt) */
fprintf(stderr, " failed while closing the statement\n");
fprintf(stderr, " %s\n", mysql_error(mysql));
exit(0);
}
return 0;
}
//cc -o testLibMysqlClientStmt testLibMysqlClientStmt.c -I/usr/include/mysql/ -L /usr/lib64/mysql/ -lmysqlclient -g
[lightdb@node101 libmysqlclient]$ ./testLibMysqlClientStmt
prepare, SELECT successful
total parameters in SELECT: 0
total columns in SELECT statement: 2
Fetching results ...
row 1
column1 (integer) : 65534(4)
column2 (string) : aaaaaaaaaa(10)
row 2
column1 (integer) : 65535(4)
column2 (string) : bbbbbbbbbb(10)
row 3
column1 (integer) : 65536(4)
column2 (string) : cccccccccc(10)
row 4
column1 (integer) : 65537(4)
column2 (string) : dddddddddd(10)
row 5
column1 (integer) : 65538(4)
column2 (string) : eeeeeeeeee(10)
total rows fetched: 5
mysql_fdw源码分析
注:这是2-8-0版本的mysql_fdw源码
在mysql_fdw源码中,大致可以认为在mysqlBeginForeignScan中连接mysql数据库,而在mysqlIterateForeignScan中就是从mysql数据库获取查询数据,调用栈如下
mysqlBeginForeignScan
mysql_get_connection
mysql_stmt_init
mysql_stmt_prepare
mysql_stmt_result_metadata
mysql_fetch_fields
若查询表存在类型为text的字段, 设置festate->has_var_size_col = true #本次新增#
mysql_bind_result
mysql_stmt_attr_set 设置stmt属性 #本次新增#
mysql_stmt_bind_result
mysqlIterateForeignScan
ExecClearTuple
bind_stmt_params_and_exec
mysql_stmt_execute
mysql_stmt_store_result 在客户端结果集中缓存查询返回的全量结果,这里将field->max_length置为63358 #本次新增#
mysql_bind_result(loop) 对TEXT类型重新绑定对应的内存 #本次新增#
mysql_stmt_bind_result 为结果集中的输出字段建立缓冲(数据和长度的缓冲) #本次新增#
mysql_stmt_fetch
mysql_convert_to_pg
heap_form_tuple
ExecStoreHeapTuple
内存释放和返回TupleTableSlot
所以造成数据查询不到的本质就在于:
rc = mysql_stmt_fetch(festate->stmt); //返回101(MYSQL_DATA_TRUNCATED),导致查询结果不再返回给客户端了
if (rc == 0)
{
foreach(lc, festate->retrieved_attrs)
{
int attnum = lfirst_int(lc) - 1;
Oid pgtype = TupleDescAttr(attinmeta->tupdesc, attnum)->atttypid;
int32 pgtypmod = TupleDescAttr(attinmeta->tupdesc, attnum)->atttypmod;
nulls[attnum] = festate->table->column[attid].is_null;
if (!festate->table->column[attid].is_null)
dvalues[attnum] = mysql_convert_to_pg(pgtype, pgtypmod,
&festate->table->column[attid]);
attid++;
}
ExecClearTuple(tupleSlot);
if (list_length(fdw_private) >= mysqlFdwPrivateScanTList)
{
/* Construct tuple with whole-row references. */
tup = mysql_get_tuple_with_whole_row(festate, dvalues, nulls);
}
else
{
/* Form the Tuple using Datums */
tup = heap_form_tuple(attinmeta->tupdesc, dvalues, nulls);
}
...
}
查看libmysqlclient官方对于mysql_stmt_attr_set的注解:If STMT_ATTR_UPDATE_MAX_LENGTH set to 1, causes mysql_stmt_store_result() to update the metadata MYSQL_FIELD->max_length value。调用mysql_stmt_attr_set将属性STMT_ATTR_UPDATE_MAX_LENGTH设置为true后,使得调用mysql_stmt_store_result后会更新结果集中字段的长度。对于我们的案例,长度为65537的字段来说,经过上述2个步骤后,会将MYSQL_FIELD->max_length value的值设置为65537,这时我们根据MYSQL_FIELD->max_length value重新申请长度为65537字节的内存,并再次将输出字段绑定到刚申请的内存即可,后续就能正常输出长度为65537的字段了。
总结
这个问题当然是mysql_fdw的bug,修改本身也比较简单。通过使用mysql_stmt_attr_set设置STMT_ATTR_UPDATE_MAX_LENGTH为1,调用mysql_stmt_store_result更新结果集中字段的长度即可。
但是mysql_fdw的官方修复只是针对在pg上创建text类型的字段时的场景,并未包含对varchar和char字段的类似处理,也就是说若pg表中存在varchar和char字段,且varchar或char对应的mysql表的字段长度超过64KB,无法查询mysql_fdw表超长字段的问题依然存在。因为pg的字符类型字段最大可以支持10485760(the length must be greater than zero and cannot exceed 10485760),远超64KB。
实际的修复也很简单,当表中存在varchar和char字段时,只要保持跟text一样的处理方式即可,在lightdb中23.3版本,我们修复了这个问题。
因此,若lightdb用户碰到mysql fdw表字段超过64K而无法正确查询时,只需将lightdb升级到23.3即可。