Inceptor
[WARP-7124] - [ODBC] "一次绑定,多次执行" TDH 4.6 以后版本中的 ODBC 仅需绑定一次参数,就可以多次执行语句,简化了编写任务。
[WARP-6982] - Holodesk GlobalIndex 为 Holodesk 新增了 GlobalIndex 特性。
[WARP-6899] - 图检索 TDH 4.6 推出了图检索功能,用函数 graph_path 指定待检索的图以及定义检索规则。
[WARP-7275] - [PLSQL] SQL 的语义检查 在存储过程的编译期对 SQL 的语义进行检查,例如对表不存在的情况报“TableNot Found”。
[WARP-5759] - Inceptor 数据库级别的权限管理 在 Inceptor 中实现数据库级别的权限管理,对一个数据库的权限管理操作等价于对该数据库中所有表的管理权限。
[WARP-6405] - 支持以 CSV 文件为数支持以 CSV 据源 文件为表的数据源,解决了字段中换行符的问题。
[WARP-7115] - 支持将内表数据导出 CSV 文件 支持将数据序列化为 CSV 文件格式。
[WARP-6533] - 将反序列化 CSV 的错误录入日志 4.6 及以后版本会将反序列化 CSV 文件时出现的错误写在日志里,以更好的支持以 CSV 文件为数据源的场景。
[WARP-7094] - 支持可变长的 CHAR 类型 支持长度可变的字符字符串类型。
[WARP-6295] - [SQL] 用 SQL 语句创建永久函数 可以通过 SQL 语句创建永久函数。创建语法形如:
CREATE FUNCTION [db_name.]function_nameAS class_name[USING JAR|FILE|ARCHIVE 'file_uri' [,JAR|FILE|ARCHIVE'file_uri'] ]
[WARP-6728] - [SQL] 允许 Unicode 编码的表名
允许表名中出现 Unicode 编码。[WARP-6449] - [PLSQL] 预编译优化 对带参数的 PL/SQL 语句块进行预编译优化,可以一次编译多次使用,以提高并发的性能。
[WARP-7049] - Inceptor Library
设计并实现了 Inceptor Library 架构以帮助管理嵌套于 Inceptor 的组件。
[WARP-7395] - [Holodesk] Holodesk 支持定长 CHAR 类型 在 Holodesk 中支持定长的 CHAR 类型。
[WARP-7329] - 支持开源 Spark Python 4.6 及之后版本的 Discover 支持开源的 Spark Python。
[WARP-7779] - 支持用户自主开发 实现了 rJava,允许用户在 Rstudio 中调用并共享自主开发的类和方法。
[WARP-8198] - txSqlConnect 函数支持 Discover Library 支持用户通过 txSqlConnect 函数在 Discover Library 中进行注册,完成注册之后 用户可以对 Library 中的内容进行访问。
Manageability
[WARP-2965] - 节点磁盘管理 用户可以根据需求通过修改以下若干配置,以添加或者删除磁盘:
[WARP-6931] - 节点删除功能扩展 扩展了节点删除功能:删除节点时,如果节点不能被删除,界面将提示禁止删除的原因;如果节点允许被删除,系统将判断节点上是否有角色需要迁移,若有则将角色迁移到其他节点上。
[WARP-6738] - SSH 允许私钥认证方式 通过 SSH 登录节点时不仅允许用户使用密码,还可以通过私钥认证。
[WARP-6351] - 对集群时间不同步的警告 如果集群时间不同步,系统将发出警告。默认情况下,时间偏移量若超过 3s将发送 WARNING 级别警告,一旦超过 10s 就发送 CRITICAL 警告。
[WARP-5281] - 默认安装 ElasticSearch 2.0 ES2.0 的安装集成到 TDH 4.6 界面,默认安装 2.0 版本的 ElasticSearch。
[WARP-7424] - ElasticSearch 角色的添加/删除 可通过界面增加、删除 ES 角色,包括:增加、删除 Data Node;增加、删除Master Node。
[WARP-6711] - Hyperbase 和 Kafka 的权限管理 API 可利用 Transwarp Manager REST API 实现对 Hyperbase 以及 Kafka 的权限管理。
[WARP-7425] - 支持添加 Hyperbase 对 ElasticSearch 的依赖 支持用户在安装 Hyperbase 时选择依赖的 ElasticSearch 服务。并且可在Hyperbase 安装完成之后,通过 “更多操作” —> “更新依赖”再次添加对ElasticSearch 的依赖。
[WARP-7429] - Manager HA 角色页面的功能扩充 Manager HA 添加角色的页面可以显示所有的 Manager 角色及其状态。
Bug Inceptor
[WARP-6142] - [JDBC] HiveServer2在JDBC 端的内存泄漏HiveServer2 为每种操作定义了操作句柄以方便执行,但是在执行完后如果没有及时关闭操作就会造成内存泄漏。对此,TDH 4.6 设计并实现了一些机制以尽可能的避免资源泄漏。 [WARP-6079] - BloomFilter 支持DATE 类型字段修复了当BloomFilter 作用于DATE 类型字段时查询会出错的现象。 [WARP-5375] - 可插入TINYINT、SHORT、BIGINT 的最小值修复了不能向报表插入TINYINT、SHORT、BIGINT 数据类型的最小值的问题。 [WARP-6801] - [SQL] RowFilter 会影响MinMaxFilter 对于LIKE 的优化之前版本中,当启动MinMaxFilter 后再使用RowFilter,会负面影响MinMaxFilter对于LIKE 操作的优化,导致执行失败,现已修复。 [WARP-6829] - [SQL] 合理处理无效窗口函数之前版本中,在SELECT 语句中调用一个无效的窗口函数将抛NPE,现在在生成执行计划前会先检查窗口函数的有效性。 [WARP-6367] - [SQL] 允许在不同With-As 从句中定义相同别名不同With-As 短语中可能会用相同的别名指代不同表或子查询,TDH 4.6 及以后版本将支持这样的语句。例句如下:
[WARP-5717] - [PL/SQL] PL/SQL 引擎不再计算DML 中的UDF如果在PL/SQL 中引擎计算DML 语句中的UDF,很可能导致之后执行结果的错误。现在DML 语句中的UDF 不再于PL/SQL 引擎中执行,以保证查询结果的准确性。 [WARP-7171] - [Inceptor] 切换YARN HA 或退出AM 时Inceptor 异常退出如题,修复了当切换YARN HA 或者退出ApplicationMaster 时Inceptor 会自动退出的异常现象。 [WARP-7708] - [Inceptor] 事务Task 如果失败再次Retry 也失败之前版本中,在向事务表插入数据时,如果某些Task 失败,Retry 也不会成功,必须重新开始执行。现在已修复,Retry 会成功。 [WARP-7736] - [Inceptor] 成功Stage 被误标为未完成之前版本中,由于对执行时间的计算方法不完善,耗时极短的Stage 会被系统错误的标记为未完成,目前已修复。 [WARP-6921] - [Stargate] 允许Stargate Partition 在Cluster 模式下读取数据之前版本中,Stargate Partition 在Cluster 模式下读取数据时,返回为空。现在能够正常读取。 [WARP-8212] - [Stargate] 修正Stargate 过滤下推的处理逻辑对于某些过滤条件,Stargate 在处理时会做出不适当的下推判断,现在已经修正。
Hyperbase
[WARP-6945] - [Hyperbase] 用一个HConnection 向多个Index 插入数据
TDH 4.6 及以后版本中,允许用户在向多个Index 插入数据时可以共用一个HConnection,简化了编写任务。 [WARP-7567] - [Hyperbase] Master 会因Split Log 无法启动之前版本中,Master 如果在启动时发现了需要被拆分的Region 并尝试拆分,就可能无法正常启动,现在已经在处理流程中修复。 [WARP-8258] - [Hyperbase] 减少插入Index 时的内存占用量为了减少内存占用量,新插入Index 的生成过程现在由Flush 阶段而不是Put阶段实现。 [WARP-7945] - [ESDrive] ESDrive 无法处理Bulk Insert Exception目前ESDrive 可以对ES 进行Bulk Insert 时抛出的Exception 进行有效处理。Stream
[WARP-6214] - [StreamSQL] 优化了涉及Stream 表的Auto MapJoin原来当开启Auto MapJoin 时,如果JOIN 涉及Stream 表,系统给出的执行计划没有正确的实现优化,现在对此进行了改进。 [WARP-6242] - [StreamSQL] Stream Task 处理MapJoin 时的资源泄漏Stream Task 处理Mapjoin 时,每批次的任务都会分发小表数据,然后由Executor读取,最后只有在Task 完成之后才回收数据,这使得之前读到的数据一直不能得到释放。现在对此进行了处理,使尽可能的避免资源泄漏。 [WARP-6215] - [StreamSQL][Kafka] 有效处理无效kafka.brokers.list之前版本中,如果kafka.brokers.list 的参数值无效,在获取Kafka Topic Partition数量时,会抛出Exception。现在对kafka.brokers.list 无效的情况做了合理处理,使任务能正常运行。 [WARP-7482] - [StreamSQL][Kafka] 必须为Kafka 输出流指明kafka.broker.listTDH 4.6 及以后版本要求用户必须为Kafka Output Stream 指定Brokers,以避免不必要的错误。 [WARP-7668] - [StreamSQL][Kafka] 支持用KeyTab 登录Kafka允许用户用特定的KeyTab 安全登录Kafka。
Discover
[WARP-8328] - txRemove 函数可释放Spark Context调用txRemove 函数会释放掉为执行语句申请的所有资源。
Improvement Inceptor
[WARP-7897] - [JDBC] 增加翻页功能JDBC 支持前后来回翻页查看查询结果。 [WARP-5681] - [ODBC] 提升ODBC 获取数据的性能提升了ODBC 在fetch 数据时的速度,对fetchSize 的最大/小值做了限制。 [WARP-5684] - [ODBC] BatchInsert 的API为用户提供用于实现BatchInsert 功能的API。 [WARP-8146] - [SQL] 支持NOT NULL 限制允许在DDL 中对指定字段做NOT NULL 限制,并对该字段的NOT NULL 限制进行监督和维护。 [WARP-8147] - [SQL] 支持DEFAULT VALUE允许在DDL 中对指定字段定义Default Value,并在导入数据时把它作为对应字段的默认值。 [WARP-5834] - [SQL] 支持zeroifnull() 和nullif()增加了两个UDF:zeroifnull 和nullif,分别用来实现以0 取代NULL、比较两个表达式的值是否相等。 [WARP-6101] - [PL/SQL] PL/SQL 支持CHAR 和VARCHAR 类型为PL/SQL 增加了对CHAR、VARCHAR 两种数据类型的支持。 [WARP-7961] - [Dictionary] 数据字典提供SplitKey 信息支持通过数据字典查询SplitKey 的信息。 [WARP-5612] - [Inceptor] 支持临时事务表新增了对临时事务表的支持。 [WARP-7499] - [Inceptor] CBO 优化覆盖CRUD 业务TDH 4.6 及之后版本中,CBO 的优化能力会覆盖CRUD 业务,即对CRUD 任务也可以做优化。 [WARP-6030] - [Inceptor] 为Compactor 服务提供HA从TDH 4.6 开始我们把Compactor 服务独立出来,并为其提供HA,以保证系统的正常运行和稳定性。 [WARP-7588]- [Inceptor Error] 标准化报错信息对报错信息的格式和内容进行了统一和修订,并移除了冗余报错。 [WARP-7104] - [DBLink] 提升DBLink 可靠性之前版本中,DBLink 对某些函数支持度没有足够好,或者某些函数在极端情况下结果的可靠性没有足够高,现在对DBLink 的可靠度进行全面巩固和提升。 [WARP-6023] - [DBLink] 扩充DBLink 支持的数据类型DBLink 目前支持JDBC 中的所有标准数据类型,对于特定数据库中非标准类型,将被转变为NULL。 [WARP-6874] - [Perf] 删除无用的临时表很多临时表创建之后没有SQL 对它们进行访问,占用了不必要的资源,现在会删除在一定时间内没有被访问过的的临时表。 [WARP-7052] - [Perf] 提升RowFilter 性能新版TDH 对RowFilter 的性能进行了进一步的提升。 [WARP-6050] - [Perf] 脚本实现ANALYZE支持通过执行脚本的方式对指定表、指定列进行预分析,也就是ANALYZE 操作,减少了编写任务的工作量。 [WARP-5819] - [Perf] 自动预分析被增删改的表、列被ANALYZE 过的表、列中数据如果发生变化,系统会自动对对应表、列重新ANALYZE 以更新预分析的信息。 [WARP-7100] - [Perf] 提升Outer Join 性能通过强化条件下推,提升了Outer Join 的执行性能。 [WARP-5782] - [Perf] 提升UNION ALL 性能对UNION ALL 的任务数量进行了一定改进和控制,使它的性能获得了提升。 [WARP-7587] - [Perf] 提升MERGE INTO 性能在执行MERGE INTO 时避免对不必要表的扫描以提升它的性能。 [WARP-6377] - [Holodesk] 提升FastSkip 模式的性能提升了Holodesk 在FastSkip 模式下的性能。 [WARP-7958] - [Holodesk] 优化GlobalIndex 元信息的管理如题,对GlobalIndex 相关元信息的管理进行了优化。 [WARP-7000] - [Stargate] 支持增加分区支持分区的添加,在通过ADD PARTITION 增加Stargate Partition 表的分区时,实现对Stargate 数据源的建表操作。 [WARP-7325] - [Stargate] 支持创建范围分区支持通过Stargate 创建范围分区。 [WARP-7547] - [Stargate] 支持对分区建索引支持通过Stargate 对分区表创建索引,对主表创建索引时将直接会对子分区表创建对应索引结构。 [WARP-7715] - 查询Spark Context 各Executor 状态的API提供用于查询Spark Context 中各Executor 状态的REST API。 [WARP-7716] - 查询Spark Context 各Task 的状态的API提供用于查询Spark Context 中各Task 状态的REST API。
Guardian
[WARP-4513] - 列级权限控制在TDH 4.6 中,我们为Inceptor 开发了列级权限控制功能,通过一条简单的授权SQL,管理员或者表的Owner 可以灵活地设定列级的访问权限规则。 [WARP-7048] - 用SQL 实现对组权限控制支持通过SQL 设置Inceptor 表所对应的HDFS 文件的ACL,以满足对组的支持。 [WARP-7152] - CREATE TABLE LIKE/ AS SELECT 的权限控制当用户执行CREATE TABLE LIKE 或者CREATE TABLE AS SELECT 时,系统将检查用户对于源表的访问权限,如果不可访问,该语句会被禁止执行。
Hyperbase
[WARP-4859] - ElasticSearch API 升级至2.0.0如题,ElasticSearch API 从版本1.3.1 升级至2.0.0。 [WARP-6336] - [Hyperdrive] Full-Text 索引的rowkey 支持所有类型如题,Full-Text Index 的rowkey 允许是任何类型。 [WARP-6809] - [ESDrive] 支持LookUp JoinTDH 4.6 及以后版本会支持LookUp Join。
Stream
[WARP-5744] - [StreamSQL][HA] 避免旧任务重放进行了一些改进来尽量避免对已成功任务的重新执行。 [WARP-5496] - [StreamSQL][Compiler] 完善与改进Window 语法对现有窗口语法进行了改进,并新增了一些相关实用语法。 [WARP-5497] - [StreamSQL][Compiler] 支持和完善Application 功能扩展了Application 相关功能,主要包括以下几点:完善了对Application 的操作SQL;为用户提供了操作Application 的API;允许在Inceptor 中使用Application 保存、获取配置;支持Application 的安全隔离。 [WARP-5504] - [StreamSQL][Infra] 提升HBase 插入性能向HBase 插入数据时支持共用HBase Client 以避免每次插入都需建立新的连接。 [WARP-5507] - [StreamSQL][Infra] 提升插入ORC 性能可以通过切换至Batch Flush 模式提升向ORC 插入数据的性能。 [WARP-5509] - [StreamSQL][Core] PL/SQL 优化器实现了PL/SQL 优化器,使得PL/SQL 的执行在运行时得到优化。 [WARP-5261] - [StreamSQL][PL/SQL] PL/SQL 任务支持窗口如题,TDH 4.6 开始将在PL/SQL 中支持窗口,并支持一个SQL 中有多个窗口。 [WARP-4986] - [StreamSQL] Output Job 结果检查使用EventTime 之后,如果在同一个Application 中使用同一个Stream,当使用的时间间隔不同,系统将会发出警告。 [WARP-5330] - [StreamSQL][HA] CheckPoint 输出任务支持对StreamSQL 输出任务进行CheckPoint,以尽量保证数据、处理状态不被丢失。 [WARP-5333] - [StreamSQL][HA] 支持Inceptor 服务器Auto Failover能够应对Inceptor 服务器Auto Failover 带来的状态变化或影响。 [WARP-6013] - [StreamSQL][Performance] 减少被持久化的数据一些流式分析只是为了Ad-Hoc 查询,因此没有必要每次都对查询结果进行持久化处理。这是对性能提升的考虑。
Discover
[WARP-5914] - PCA完成txPCA 和R 原生模型的适配,并实现模型中print、summary、plot、predict等方法。 [WARP-5915] - SVD完成txSVD 和R 原生模型的适配,并实现txSVD 模型的print、summary 方法。 [WARP-5933] - Apriori完成txApriori 和R 原生模型的适配。 [WARP-5934] - FP-Growth完成txFPGrowth 和R 原生模型的适配。 [WARP-5936] - 协同过滤完成协同过滤算法函数txRecommender 和R 原生模型的适配。 [WARP-5938] - ANN完成txAnn 和R 原生模型的适配。 [WARP-5939] - NaiveBayes完成txNb 和R 原生模型的适配。 [WARP-5940] - DecisionTree完成txDecisionTree 和R 原生模型的适配。 [WARP-6941] - RandomForest完成txRandomForest 和R 原生模型的适配。 [WARP-6821] - Normalize实现函数txNormalization 对指定列的数据进行归一化。并对z-transformation、range-transformation 和proportion transformation 三种Normalize 方法分别提供了UDTF,以支持用SQL 调用计算。 [WARP-6822] - txFill 的UDTF对txFill(自动填充缺失值)功能提供了对应UDTF—replace_data,以允许用户通过SQL 调用访问。
Graphene
[WARP-6153] - 度的计算
通过函数graph_degree 计算图中各节点的度,包括出度、入度、出入度。 [WARP-6154] - 网络节点快速分类实现了FastUnfolding 算法,用于快速分类网络节点,将图划分为多个社区。通过函数graph_fastunfolding 调用。 [WARP-7057] - 最短路径实现了Shortest Path 算法,用于计算网络中两点简单额最短距离。通过函数graph _shortestpath 调用。 [WARP-7076] - 强连通子图实现了Strongly Connected Components 算法,用于求解图中的所有强连通子图。通过函数graph_strongly_connected_component 调用。 [WARP-7225] - 图中三角形数量实现了Triangle Counting 算法,用于计算图中三角形数量。通过函数graph_triangle_count 调用。 [WARP-7285] - 网络整体紧密程度实现了Global Cluster Coefficient 算法,用于衡量图整体紧密程度,多用于社交网络分析。通过函数graph_global_cluster_coefficient 调用。 [WARP-7290] - 局部网络紧密程度实现了Local Cluster Coefficient 算法,用于衡量图中各节点和其邻居节点的紧密程度。通过函数graph_local_cluster_coefficient 调用。 [WARP-7296] - 平均紧密程度实现了Average Cluster Coefficient 算法,用于衡量图中节点的平均紧密程度。通过函数graph_average_cluster_coefficient 调用。 [WARP-7299] - 图直径支持通过函数graph_diameter 计算图的直径。 [WARP-7414] - 图半径支持通过函数graph_diameter 计算图的半径。 [WARP-7415] - 离心指数通过函数graph_eccentricity 计算图中节点和其他节点距离之间的最大值。 [WARP-8010] - 节点相关性与重要性实现了Page Rank 算法,用于计算网络中节点的相关性和重要性。通过函数graph_pagerank 调用。Manageability
[WARP-7834] - 服务、角色配置相关的API提供实现以下功能的API:保存配置;刷新配置文件;可根据更新的配置重启受影响的角色或服务。 [WARP-7918] - 支持添加Guardian Client 角色支持用户在Guardian 页面上添加Guardian Client 角色。
[WARP-7655] - [Koalas] 界面版会兼容后端处理失败时的异常
在界面版Koalas 前端添加了对后端异常的处理,异常发生时会自动在特定文件中记录本次运行的信息,内容包括节点与运行时的参数。同时界面会兼容对异常结果的显示,以提升用户使用的友好度。 [WARP-5752] - [Koalas] 支持suse增加对Koalas 对suse 操作系统的支持。 [WARP-7964] - [TM] 在界面启动停止节点和任务在界面上为节点添加启动停止按钮,以及未任务添加启动停止页面。 [WARP-7965] - [TM] 提供启动/停止节点和角色的API提供可以实现启动停止节点和启动停止角色功能的API。 [WARP-6498] - [TM] 支持迁移Guardian 节点如题,TDH 4.6 及以后版本将支持Guardian 节点的迁移,并在Transwarp Manager上提供实现Guardian 节点迁移的接口。 [WARP-2963] - [TM] 增加Datanode 对损坏磁盘数量的容忍度新版TDH 允许Datanode 有1/4~1/3 的磁盘损坏,超过此范围后Datanode 才会真正宕掉。当任意磁盘被损坏时,Transwarp Manager 会在界面作出严重告警。 [WARP-3010] - [TM] 节点失联警告HA 模式下,如果两个节点发生失联,Transwarp Manager 会报告相关信息情况。 [WARP-5545] - [TM] 自定义审计告警策略支持用户对敏感或重要指标自定义告警阈值,当指定指标或者特定类型事件累计超过设定值时,就触发警告。 [WARP-7272] - [TM] 提供Meatstore Salve 到Master 的切换支持在界面上实现Metastore 从Salve 到Master 切换。Flume
[WARP-5810] - Flume 升级至1.6.0Flume 从1.5.x 升级至1.6.0 版。
Sqoop
[WARP-4884] - Sqoop 升级TDH 4.6 对Sqoop 再次进行了升级,强化了各种文件类型的套接转换、各种数据类型的对接、各种类型字符的转义处理等,使数据的传递更流畅。