跳到主要内容
版本:Candidate-3.4

percentile_approx_raw

计算给定参数 x 的百分位数。x 可以是列或者数值。如果 x 是列,则先对该列进行升序排序,然后取精确的第 y 位百分数。

语法

PERCENTILE_APPROX_RAW(x, y);

参数说明

x: 可以为列或数值。支持的数据类型为 PERCENTILE。

y: 指定的百分位,支持的数据类型为 DOUBLE,取值为 [0.0,1.0]。

返回值说明

返回值的数据类型为 DOUBLE。

示例

创建一张表 aggregate_tbl。其中 percent 列为 percentile_approx_raw() 函数的输入。

CREATE TABLE `aggregate_tbl` (
`site_id` largeint(40) NOT NULL COMMENT "id of site",
`date` date NOT NULL COMMENT "time of event",
`city_code` varchar(20) NULL COMMENT "city_code of user",
`pv` bigint(20) SUM NULL DEFAULT "0" COMMENT "total page views",
`percent` PERCENTILE PERCENTILE_UNION COMMENT "others"
) ENGINE=OLAP
AGGREGATE KEY(`site_id`, `date`, `city_code`)
COMMENT "OLAP"
DISTRIBUTED BY HASH(`site_id`)
PROPERTIES ("replication_num" = "3");

向表中插入数据。

insert into aggregate_tbl values (5, '2020-02-23', 'city_code', 555, percentile_hash(1));
insert into aggregate_tbl values (5, '2020-02-23', 'city_code', 555, percentile_hash(2));
insert into aggregate_tbl values (5, '2020-02-23', 'city_code', 555, percentile_hash(3));
insert into aggregate_tbl values (5, '2020-02-23', 'city_code', 555, percentile_hash(4));

计算第 0.5 百分位对应的值。

mysql> select percentile_approx_raw(percent, 0.5) from aggregate_tbl;
+-------------------------------------+
| percentile_approx_raw(percent, 0.5) |
+-------------------------------------+
| 2.5 |
+-------------------------------------+
1 row in set (0.03 sec)