StarRocks version 2.2
2.2.13
发布日期: 2023 年 4 月 6 日
功能优化
问题修复
修复了以下问题:
- 提交 Stream Load 作业 时如果提供了错误的 URL 请求地址,导致 FE 内部卡住并且无法接收 HTTP 请求。(#18468)
- FE 收集统计信息导致内存消耗过多,甚至可能发生 OOM。(#16331)
- 一些查询中内存释放处理有问题,导致 BE 崩溃。(#11395)
- TRUNCATE TABLE 后可能发生空指针问题,导致 FE 无法重启。(#16773)
2.2.10
发布日期: 2022 年 12 月 2 日
功能优化
- 优化 Routine Load 错误提示信息。(#12203)
- 支持逻辑算子
&&
。 (#11819) - BE crash 时,快速取消查询,避免长时间查询超时卡住。(#12954)
- 优化 FE 启动脚本,检查 Java 版本。(#14094)
- 支持 Primary Key 中大批量数据删除。(#4772)
问题修复
修复了如下问题:
- 多表合并 (union) 视图时,如果左深节点存在 NULL 常量,会导致 BE crash。(#13792)
- Parquet 文件和 Hive 表 中的列类型不一致时,会导致查询过程中 BE crash。(#8848)
- 太多 OR 语句导致 Planner 过多递归引发查询超时。(#12788)
- 子查询中有 LIMIT 可能导致结果错误。(#12466)
- 创建视图时语句中无法包含引号。(#13102)
2.2.9
发布日期: 2022 年 11 月 15 日
功能优化
- 增加参数
hive_partition_stats_sample_size
,用于限制获取统计信息的分区数,防止分区数过多导致 FE 获取 Hive 元数据异常。(#12700) - Elasticsearch 外表支持自定义时区。(#12662)
问题修复
修复了如下问题:
- 外表元数据同步问题导致下线节点 (Decommission) 卡住。(#12369)
- 在做增加列操作时如果删除该列可能导致 compaction crash。(#12907)
- SHOW CREATE VIEW 没有展示注释字段。(#4163)
- UDF 中可能存在内存泄漏导致 OOM 的问题。(#12418)
- Follower FE 上存储的节点存活状态 (alive) 依赖于
heartbeatRetryTimes
,某些场景下不准确。新版本在HeartbeatResponse
中新增属性aliveStatus
来表示节点存活状态。(#12481)
行为变更
Hive 外表字符串支持的长度从 64 KB 扩展为 1 MB。长度超过 1 MB 时,查询设置成 Null。(#12986)
2.2.8
发布日期: 2022 年 10 月 17 日
问题修复
修复了如下问题:
- 表达式在初始化阶段发生错误时可能导致 BE 停止服务。 (#11395)
- 导入时无效的 JSON 可能会导致 BE 停止服务。(#10804)
- 开启 Pipeline 引擎会导致并行写入出错。(#11451)
- ORDER BY NULL LIMIT 会导致 BE 停止服务。(#11648)
- 外表的列类型和 Parquet 表中类型不一致时导致 BE 停止服务。(#11839)
2.2.7
发布日期: 2022 年 9 月 23 日
问题修复
修复了如下问题:
- 导入 JSON 数据时可能出现数据丢失。 (#11054)
- SHOW FULL TABLES 返回结果错误。 (#11126)
- 视图权限问题,之前版本需要同时拥有 base 表和视图的权限才能访问视图的数据,修复后只需要拥有视图权限就可以访问。 (#11290)
- 复杂查询中一个 exists/in 子查询的bug。 (#11415)
- REFRESH EXTERNAL TABLE 在 Hive 中做过 schema change 以后会失败。(#11406)
- FE在回放创建 bitmap 索引操作时可能出错。(#11261)
2.2.6
发布日期: 2022 年 9 月 14 日
问题修复
修复了如下问题:
- 子查询中有 LIMIT 时,
order by...limit...offset...
结果不准确。(#9698) - 大规模数据的 Partial update 导致 BE crash。(#9809)
- 当 Bitmap 超过 2 GB 时,compaction 会导致 crash。(#11159)
- like() 和 regexp() 函数中 pattern 超过 16 KB 无法使用。(#10364)
行为调整
- 修改返回结果中
ARRAY<JSON>
的展示形式,输出结果使用单引号而不是转义符。 (#10790)
2.2.5
发布日期: 2022 年 8 月 18 日
功能优化
问题修复
修复了如下问题:
- BE 在执行 Routine Load 时可能在
get_partition_offset
时卡住。 #9937 - 不同集群使用 Broker Load 导入相同的 HDFS 文件导致出错。 #9507
2.2.4
发布日期: 2022 年 8 月 3 日
功能优化
问题修复
修复了如下问题:
- 通过 Kerberos 认证使用 Broker Load 时无法使用多个 keytab 文件。#8820 #8837
- 执行 stop_be.sh 后立刻退出进程,Supervisor 重新拉起服务可能失败。#9175
- 错误的 Join Reorder 优先级导致 Join 字段报错 “Column cannot be resolved”。#9063 #9487
2.2.3
发布日期: 2022 年 7 月 24 日
问题修复
修复了如下问题:
- 修复资源组删除过程中的错误。#8036
- 线程资源不足导致 Thrift server 退出。#7974
- CBO 在一些场景下 join reorder 会无法输出结果。 #7099 #7831 #6866
2.2.2
发布日期: 2022 年 6 月 29 日
功能优化
-
优化表结构变更 (Schema Change) 等内部处理的并发控制,降低对 FE 元数据的压力,减少在高并发、大数据量导入场景下容易发生导入积压和变慢的问题。#6838
问题修复
修复了如下问题:
-
执行 CTAS 时创建的新表副本数错误(
replication_num
)。#7036 -
执行 ALTER ROUTINE LOAD 后可能造成元数据丢失。 #7068
-
Pipeline 中潜在的内存泄漏问题。 #7295
-
停止 Routine Load 任务可能导致死锁。#6849
-
get_json_string 函数对 JSON 数组处理错误。 #7671
2.2.1
发布日期: 2022 年 6 月 2 日
功能优化
- 通过重构部分热点代码和降低锁粒度优化导入性能,减少长尾延迟。 #6641
- 在 FE 的审计日志中添加每个查询所消耗部署 BE 机器的 CPU 和内存信息。 #6208 #6209
- 支持在主键表和更新表中使用 JSON 数据类型。 #6544
- 通过降低锁粒度和 BE 汇报 (report) 请求去重减少 FE 负荷,优化部署大量 BE 时的汇报性能并解决大规模集群中 Routine Load 任务卡住的问题。 #6293
问题修复
修复了如下问题:
- 修复 SHOW FULL TABLES FROM DatabaseName 语句中转义字符解析报错的问题。 #6559
- FE 磁盘空间占用过快的问题(通过回滚 BDBJE 版本修复该bug)。#6708
- 修复启用列式扫描 (
enable_docvalue_scan=true
) 后,因返回的数据中没有相关字段导致 BE 宕机的问题。#6600
2.2.0
发布日期: 2022 年 5 月 22 日
新功能
- 【公测中】发布资源组管理功能。通过使用资源组来控制 CPU、内存的资源使用,让不同租户的大小查询在同一集群执行时,既能实现资源隔离,又能合理使用资源。相关文档,请参见资源组。
- 【公测中】实现 Java UDF 框架,支持使用 Java 语法编写 UDF(用户自定义函数),扩展 StarRocks 的函数功能。相关文档,请参见 Java UDF。
- 【公测中】导入数据至主键表时,支持更新部分列。在订单更新、多流 JOIN 等实时数据更新场景下,仅需要更新与业务相关的列。相关文档,请参见 主键表支持部分更新。
- 【公测中】支持 JSON 数据类型和函数。相关文档,请参见 JSON。
- 支持通过外表查询 Apache Hudi 的数据,进一步完善了数据湖分析的功能。相关文档,请参见 Apache Hudi 外表。
- 新增如下函数:
- ARRAY 函数,array_agg、array_sort、array_distinct、array_join、reverse、array_slice、array_concat、array_difference、arrays_overlap、array_intersect。
- BITMAP 函数,包括 bitmap_max、bitmap_min。
- 其他函数:retention、square。