跳到主要内容
版本:Candidate-3.4

cardinality

计算 Map 中元素的个数,返回值类型是 INT。MAP 中保存的是键值对 (key-value pair),比如 {"a":1, "b":2}。一个键值对算作一个元素,{"a":1, "b":2} 的元素个数为 2。

该函数从 3.0 版本开始支持。函数别名为 map_size

语法

INT cardinality(any_map)

参数说明

any_map: 要获取元素个数的 MAP 值。

返回值说明

返回 INT 类型的值。如果输入参数是 NULL,结果也是 NULL。

MAP 中的 Key 和 Value 可以为 NULL,会正常计算。

示例

查询 StarRocks 本地表中的 MAP 数据

3.1 版本支持在建表时定义 MAP 类型的列,以创建表 test_map 为例。

CREATE TABLE test_map(
col_int INT,
col_map MAP<VARCHAR(50),INT>
)
DUPLICATE KEY(col_int);

INSERT INTO test_map VALUES
(1,map{"a":1,"b":2}),
(2,map{"c":3}),
(3,map{"d":4,"e":5});

SELECT * FROM test_map ORDER BY col_int;
+---------+---------------+
| col_int | col_map |
+---------+---------------+
| 1 | {"a":1,"b":2} |
| 2 | {"c":3} |
| 3 | {"d":4,"e":5} |
+---------+---------------+

计算 col_map 列每行的元素个数。

SELECT cardinality(col_map) FROM test_map ORDER BY col_int;
+----------------------+
| cardinality(col_map) |
+----------------------+
| 2 |
| 1 |
| 2 |
+----------------------+

查询外部数据湖中的 MAP 数据

假设 Hive 中有表 hive_map,数据如下:

SELECT * FROM hive_map ORDER BY col_int;
+---------+---------------+
| col_int | col_map |
+---------+---------------+
| 1 | {"a":1,"b":2} |
| 2 | {"c":3} |
| 3 | {"d":4,"e":5} |
+---------+---------------+
3 rows in set (0.05 sec)

通过在 StarRocks 集群中创建 Hive catalog 来访问该表,计算 col_map 列每行的元素个数。

SELECT cardinality(col_map) FROM hive_map ORDER BY col_int;
+----------------------+
| cardinality(col_map) |
+----------------------+
| 2 |
| 1 |
| 2 |
+----------------------+
3 rows in set (0.05 sec)