バージョン: 2.5

CBO の統計情報を収集する

このトピックでは、StarRocks CBO の基本概念と CBO のための統計情報の収集方法について説明します。StarRocks 2.4 では、ヒストグラムを導入して正確なデータ分布統計を収集します。

CBO とは

コストベースオプティマイザ (CBO) は、クエリ最適化において重要な役割を果たします。SQL クエリが StarRocks に到着すると、それは論理実行プランに解析されます。CBO は論理プランを複数の物理実行プランに書き換え、変換します。その後、CBO はプラン内の各オペレーターの実行コスト（CPU、メモリ、ネットワーク、I/O など）を推定し、最もコストの低いクエリパスを最終的な物理プランとして選択します。

StarRocks CBO は StarRocks 1.16.0 で導入され、1.19 以降はデフォルトで有効になっています。Cascades フレームワークに基づいて開発された StarRocks CBO は、さまざまな統計情報に基づいてコストを推定します。数万の実行プランの中から最もコストの低い実行プランを選択でき、複雑なクエリの効率とパフォーマンスを大幅に向上させます。

統計情報は CBO にとって重要です。これにより、コスト推定が正確で有用であるかどうかが決まります。以下のセクションでは、統計情報の種類、収集ポリシー、および統計情報の収集方法と統計情報の表示方法について詳しく説明します。

統計情報の種類

StarRocks は、コスト推定の入力としてさまざまな統計情報を収集します。

基本統計情報

デフォルトで、StarRocks は定期的にテーブルとカラムの以下の基本統計情報を収集します。

row_count: テーブル内の総行数
data_size: カラムのデータサイズ
ndv: カラムのカーディナリティ、つまりカラム内の異なる値の数
null_count: カラム内の NULL 値を持つデータの量
min: カラム内の最小値
max: カラム内の最大値

基本統計情報は _statistics_.table_statistic_v1 テーブルに保存されます。このテーブルは、StarRocks クラスターの _statistics_ データベースで確認できます。

ヒストグラム

StarRocks 2.4 は、基本統計情報を補完するためにヒストグラムを導入しました。ヒストグラムは、データを効果的に表現する方法と考えられています。データが偏っているテーブルに対して、ヒストグラムはデータ分布を正確に反映できます。

StarRocks は等高ヒストグラムを使用し、いくつかのバケットで構成されます。各バケットには同量のデータが含まれます。頻繁にクエリされ、選択性に大きな影響を与えるデータ値に対して、StarRocks はそれらに個別のバケットを割り当てます。バケットが多いほど推定が正確になりますが、メモリ使用量がわずかに増加する可能性があります。ヒストグラム収集タスクのバケット数と最も一般的な値 (MCV) を調整できます。

ヒストグラムは、データが非常に偏っていて頻繁にクエリされるカラムに適しています。テーブルデータが均一に分布している場合、ヒストグラムを作成する必要はありません。ヒストグラムは、数値型、DATE、DATETIME、または文字列型のカラムにのみ作成できます。

現在、StarRocks はヒストグラムの手動収集のみをサポートしています。ヒストグラムは _statistics_ データベースの histogram_statistics テーブルに保存されます。

収集タイプと方法

テーブル内のデータサイズとデータ分布は常に変化します。統計情報は、データの変化を表すために定期的に更新する必要があります。統計収集タスクを作成する前に、ビジネス要件に最適な収集タイプと方法を選択する必要があります。

StarRocks は、完全収集とサンプル収集の両方をサポートしており、どちらも自動および手動で実行できます。デフォルトで、StarRocks はテーブルの完全統計情報を自動的に収集します。5 分ごとにデータの更新をチェックします。データの変更が検出されると、データ収集が自動的にトリガーされます。自動完全収集を使用したくない場合は、FE 設定項目 enable_collect_full_statistic を false に設定し、収集タスクをカスタマイズできます。

収集タイプ	収集方法	説明	利点と欠点
完全収集	自動/手動	テーブル全体をスキャンして統計情報を収集します。統計情報はパーティションごとに収集されます。パーティションにデータの変更がない場合、そのパーティションからデータは収集されず、リソース消費が削減されます。完全統計情報は `_statistics_.column_statistics` テーブルに保存されます。	利点: 統計情報が正確であり、CBO が正確な推定を行うのに役立ちます。欠点: システムリソースを消費し、遅いです。2.5 以降、StarRocks は自動収集期間を指定できるようになり、リソース消費が削減されます。
サンプル収集	自動/手動	テーブルの各パーティションから `N` 行のデータを均等に抽出します。統計情報はテーブルごとに収集されます。各カラムの基本統計情報は 1 レコードとして保存されます。カラムのカーディナリティ情報 (ndv) はサンプルデータに基づいて推定され、正確ではありません。サンプル統計情報は `_statistics_.table_statistic_v1` テーブルに保存されます。	利点: システムリソースを消費せず、高速です。欠点: 統計情報が完全ではなく、コスト推定の正確性に影響を与える可能性があります。

統計情報の収集

StarRocks は柔軟な統計収集方法を提供します。自動、手動、またはカスタム収集のいずれかを選択し、ビジネスシナリオに適したものを選択できます。

自動収集

基本統計情報については、StarRocks はデフォルトでテーブルの完全統計情報を自動的に収集し、手動操作を必要としません。統計情報が収集されていないテーブルについては、StarRocks はスケジューリング期間内に自動的に統計情報を収集します。統計情報が収集されたテーブルについては、StarRocks はテーブル内の総行数と変更された行数を更新し、この情報を定期的に保持して自動収集をトリガーするかどうかを判断します。

2.5 以降、StarRocks は自動完全収集の収集期間を指定できるようになり、自動完全収集によるクラスターのパフォーマンスの揺れを防ぎます。この期間は、FE パラメータ statistic_auto_analyze_start_time と statistic_auto_analyze_end_time によって指定されます。

自動収集をトリガーする条件:

前回の統計情報収集以降にテーブルデータが変更された。
収集時間が設定された収集期間の範囲内にある。（デフォルトの収集期間は終日です。）
前回の収集ジョブの更新時間がパーティションの最新の更新時間よりも早い。
テーブル統計情報の健康度が指定されたしきい値 (statistic_auto_collect_ratio) を下回っている。

統計情報の健康度を計算するための式:

データが更新されたパーティションの数が 10 未満の場合、式は 1 - (前回の収集以降に更新された行数/総行数) です。データが更新されたパーティションの数が 10 以上の場合、式は 1 - MIN(前回の収集以降に更新された行数/総行数, 前回の収集以降に更新されたパーティション数/総パーティション数) です。

さらに、StarRocks はテーブルサイズとテーブルの更新頻度に基づいて収集ポリシーを設定することができます。

データ量が少ないテーブルについては、**統計情報はリアルタイムで制限なく収集されます。たとえテーブルデータが頻繁に更新されていても。statistic_auto_collect_small_table_size パラメータを使用して、テーブルが小さいか大きいかを判断できます。また、statistic_auto_collect_small_table_interval を使用して、小さいテーブルの収集間隔を設定できます。
データ量が多いテーブルについては、以下の制限が適用されます。
- デフォルトの収集間隔は 12 時間以上であり、statistic_auto_collect_large_table_interval を使用して設定できます。
- 収集間隔が満たされ、統計情報の健康度が自動サンプル収集のしきい値 (statistic_auto_collect_sample_threshold) を下回る場合、サンプル収集がトリガーされます。
- 収集間隔が満たされ、統計情報の健康度が自動サンプル収集のしきい値 (statistic_auto_collect_sample_threshold) を上回り、自動収集のしきい値 (statistic_auto_collect_ratio) を下回る場合、完全収集がトリガーされます。
- データを収集する最大パーティションのサイズ (statistic_max_full_collect_data_size) が 100 GB を超える場合、サンプル収集がトリガーされます。
- 更新時間が前回の収集タスクの時間よりも遅いパーティションの統計情報のみが収集されます。データに変更がないパーティションの統計情報は収集されません。

ヒント

テーブルのデータが変更された後、このテーブルに対してサンプル収集タスクを手動でトリガーすると、サンプル収集タスクの更新時間がデータ更新時間よりも遅くなり、このスケジューリング期間内にこのテーブルの自動完全収集がトリガーされません。

自動完全収集はデフォルトで有効になっており、システムがデフォルト設定を使用して実行します。

以下の表はデフォルト設定を示しています。これらを変更する必要がある場合は、ADMIN SET CONFIG コマンドを実行してください。

FE 設定項目	タイプ	デフォルト値	説明
enable_statistic_collect	BOOLEAN	TRUE	統計情報を収集するかどうか。このスイッチはデフォルトでオンになっています。
enable_collect_full_statistic	BOOLEAN	TRUE	自動完全収集を有効にするかどうか。このスイッチはデフォルトでオンになっています。
statistic_collect_interval_sec	LONG	300	自動収集中のデータ更新をチェックする間隔。単位: 秒。
statistic_auto_collect_ratio	FLOAT	0.8	自動収集の統計情報が健康かどうかを判断するしきい値。統計情報の健康度がこのしきい値を下回る場合、自動収集がトリガーされます。
statistic_auto_analyze_start_time	STRING	00:00:00	自動収集の開始時間。値の範囲: `00:00:00` - `23:59:59`。
statistic_auto_analyze_end_time	STRING	23:59:59	自動収集の終了時間。値の範囲: `00:00:00` - `23:59:59`。
statistic_auto_collect_small_table_size	LONG	5368709120	自動完全収集のためにテーブルが小さいかどうかを判断するしきい値。この値を超えるテーブルは大きいテーブルと見なされ、この値以下のテーブルは小さいテーブルと見なされます。単位: バイト。デフォルト値: 5368709120 (5 GB)。
statistic_auto_collect_small_table_interval	LONG	0	小さいテーブルの完全統計情報を自動的に収集する間隔。単位: 秒。
statistic_auto_collect_large_table_interval	LONG	43200	大きいテーブルの完全統計情報を自動的に収集する間隔。単位: 秒。デフォルト値: 43200 (12 時間)。
statistic_auto_collect_sample_threshold	DOUBLE	0.3	自動サンプル収集をトリガーするための統計情報の健康度のしきい値。統計情報の健康度がこのしきい値を下回る場合、自動サンプル収集がトリガーされます。
statistic_max_full_collect_data_size	LONG	107374182400	自動収集のためにデータを収集する最大パーティションのサイズ。単位: バイト。デフォルト値: 107374182400 (100 GB)。パーティションがこの値を超える場合、完全収集は破棄され、サンプル収集が実行されます。
statistic_full_collect_buffer	LONG	20971520	自動収集タスクによって使用される最大バッファサイズ。単位: バイト。デフォルト値: 20971520 (20 MB)。
statistic_collect_max_row_count_per_query	INT	5000000000	単一の分析タスクでクエリする最大行数。この値を超える場合、分析タスクは複数のクエリに分割されます。
statistic_collect_too_many_version_sleep	LONG	600000	収集タスクが実行されるテーブルにデータバージョンが多すぎる場合の自動収集タスクのスリープ時間。単位: ミリ秒。デフォルト値: 600000 (10 分)。

統計情報の収集の大部分を自動ジョブに依存できますが、特定の要件がある場合は、ANALYZE TABLE ステートメントを実行して手動でタスクを作成するか、CREATE ANALYZE ステートメントを実行して自動タスクをカスタマイズできます。

手動収集

ANALYZE TABLE を使用して手動収集タスクを作成できます。デフォルトで、手動収集は同期操作です。非同期操作に設定することもできます。非同期モードでは、ANALYZE TABLE を実行した後、システムはこのステートメントが成功したかどうかをすぐに返します。ただし、収集タスクはバックグラウンドで実行され、結果を待つ必要はありません。SHOW ANALYZE STATUS を実行してタスクのステータスを確認できます。非同期収集はデータ量が多いテーブルに適しており、同期収集はデータ量が少ないテーブルに適しています。手動収集タスクは作成後に 1 回だけ実行されます。手動収集タスクを削除する必要はありません。

基本統計情報を手動で収集する

ANALYZE [FULL|SAMPLE] TABLE tbl_name (col_name [,col_name])
[WITH SYNC | ASYNC MODE]
PROPERTIES (property [,property]);

パラメータの説明:

収集タイプ
- FULL: 完全収集を示します。
- SAMPLE: サンプル収集を示します。
- 収集タイプが指定されていない場合、デフォルトで完全収集が使用されます。
col_name: 統計情報を収集するカラム。複数のカラムをカンマ (,) で区切ります。このパラメータが指定されていない場合、テーブル全体が収集されます。
PROPERTIES: カスタムパラメータ。PROPERTIES が指定されていない場合、fe.conf ファイルのデフォルト設定が使用されます。実際に使用されるプロパティは、SHOW ANALYZE STATUS の出力の Properties 列で確認できます。

PROPERTIES	タイプ	デフォルト値	説明
statistic_sample_collect_rows	INT	200000	サンプル収集のために収集する最小行数。このパラメータの値がテーブルの実際の行数を超える場合、完全収集が実行されます。

例

手動完全収集

-- デフォルト設定を使用してテーブルの完全統計情報を手動で収集します。
ANALYZE TABLE tbl_name;

-- デフォルト設定を使用してテーブルの完全統計情報を手動で収集します。
ANALYZE FULL TABLE tbl_name;

-- デフォルト設定を使用してテーブル内の指定されたカラムの統計情報を手動で収集します。
ANALYZE TABLE tbl_name(c1, c2, c3);

手動サンプル収集

-- デフォルト設定を使用してテーブルの部分統計情報を手動で収集します。
ANALYZE SAMPLE TABLE tbl_name;

-- 収集する行数を指定して、テーブル内の指定されたカラムの統計情報を手動で収集します。
ANALYZE SAMPLE TABLE tbl_name (v1, v2, v3) PROPERTIES(
    "statistic_sample_collect_rows" = "1000000"
);

ヒストグラムを手動で収集する

ANALYZE TABLE tbl_name UPDATE HISTOGRAM ON col_name [, col_name]
[WITH SYNC | ASYNC MODE]
[WITH N BUCKETS]
PROPERTIES (property [,property]);

パラメータの説明:

col_name: 統計情報を収集するカラム。複数のカラムをカンマ (,) で区切ります。このパラメータが指定されていない場合、テーブル全体が収集されます。ヒストグラムの場合、このパラメータは必須です。
WITH N BUCKETS: ヒストグラム収集のためのバケット数 N。指定しない場合、fe.conf のデフォルト値が使用されます。
PROPERTIES: カスタムパラメータ。PROPERTIES が指定されていない場合、fe.conf のデフォルト設定が使用されます。

PROPERTIES	タイプ	デフォルト値	説明
statistic_sample_collect_rows	INT	200000	収集する最小行数。このパラメータの値がテーブルの実際の行数を超える場合、完全収集が実行されます。
histogram_buckets_size	LONG	64	ヒストグラムのデフォルトバケット数。
histogram_mcv_size	INT	100	ヒストグラムの最も一般的な値 (MCV) の数。
histogram_sample_ratio	FLOAT	0.1	ヒストグラムのサンプリング比率。
histogram_max_sample_row_count	LONG	10000000	ヒストグラムのために収集する最大行数。

ヒストグラムのために収集する行数は、複数のパラメータによって制御されます。それは statistic_sample_collect_rows とテーブル行数 * histogram_sample_ratio の間の大きい値です。この数は histogram_max_sample_row_count で指定された値を超えることはできません。値を超えた場合、histogram_max_sample_row_count が優先されます。

実際に使用されるプロパティは、SHOW ANALYZE STATUS の出力の Properties 列で確認できます。

例

-- デフォルト設定を使用して v1 のヒストグラムを手動で収集します。
ANALYZE TABLE tbl_name UPDATE HISTOGRAM ON v1;

-- 32 バケット、32 MCV、および 50% のサンプリング比率で v1 と v2 のヒストグラムを手動で収集します。
ANALYZE TABLE tbl_name UPDATE HISTOGRAM ON v1,v2 WITH 32 BUCKETS 
PROPERTIES(
   "histogram_mcv_size" = "32",
   "histogram_sample_ratio" = "0.5"
);

カスタム収集

自動収集タスクをカスタマイズする

CREATE ANALYZE ステートメントを使用して、自動収集タスクをカスタマイズできます。

カスタム自動収集タスクを作成する前に、自動完全収集を無効にする必要があります (enable_collect_full_statistic = false)。そうしないと、カスタムタスクが有効になりません。

-- すべてのデータベースの統計情報を自動的に収集します。
CREATE ANALYZE [FULL|SAMPLE] ALL PROPERTIES (property [,property]);

-- データベース内のすべてのテーブルの統計情報を自動的に収集します。
CREATE ANALYZE [FULL|SAMPLE] DATABASE db_name
PROPERTIES (property [,property]);

-- テーブル内の指定されたカラムの統計情報を自動的に収集します。
CREATE ANALYZE [FULL|SAMPLE] TABLE tbl_name (col_name [,col_name])
PROPERTIES (property [,property]);

パラメータの説明:

収集タイプ
- FULL: 完全収集を示します。
- SAMPLE: サンプル収集を示します。
- 収集タイプが指定されていない場合、デフォルトで完全収集が使用されます。
col_name: 統計情報を収集するカラム。複数のカラムをカンマ (,) で区切ります。このパラメータが指定されていない場合、テーブル全体が収集されます。
PROPERTIES: カスタムパラメータ。PROPERTIES が指定されていない場合、fe.conf のデフォルト設定が使用されます。

PROPERTIES	タイプ	デフォルト値	説明
statistic_auto_collect_ratio	FLOAT	0.8	自動収集の統計情報が健康かどうかを判断するしきい値。統計情報の健康度がこのしきい値を下回る場合、自動収集がトリガーされます。
statistics_max_full_collect_data_size	INT	100	自動収集のためにデータを収集する最大パーティションのサイズ。単位: GB。パーティションがこの値を超える場合、完全収集は破棄され、サンプル収集が実行されます。
statistic_sample_collect_rows	INT	200000	収集する最小行数。このパラメータの値がテーブルの実際の行数を超える場合、完全収集が実行されます。
statistic_exclude_pattern	String	null	ジョブで除外する必要があるデータベースまたはテーブルの名前。ジョブで統計情報を収集しないデータベースとテーブルを指定できます。これは正規表現パターンであり、マッチする内容は `database.table` です。

例

自動完全収集

-- すべてのデータベースの完全統計情報を自動的に収集します。
CREATE ANALYZE ALL;

-- データベースの完全統計情報を自動的に収集します。
CREATE ANALYZE DATABASE db_name;

-- データベース内のすべてのテーブルの完全統計情報を自動的に収集します。
CREATE ANALYZE FULL DATABASE db_name;

-- テーブル内の指定されたカラムの完全統計情報を自動的に収集します。
CREATE ANALYZE TABLE tbl_name(c1, c2, c3); 

-- 指定されたデータベース 'db_name' を除外して、すべてのデータベースの統計情報を自動的に収集します。
CREATE ANALYZE ALL PROPERTIES (
   "statistic_exclude_pattern" = "db_name\."
);

自動サンプル収集

-- デフォルト設定でデータベース内のすべてのテーブルの統計情報を自動的に収集します。
CREATE ANALYZE SAMPLE DATABASE db_name;

-- 指定されたテーブル 'db_name.tbl_name' を除外して、データベース内のすべてのテーブルの統計情報を自動的に収集します。
CREATE ANALYZE SAMPLE DATABASE db_name PROPERTIES (
   "statistic_exclude_pattern" = "db_name.tbl_name"
);

-- 統計情報の健康度と収集する行数を指定して、テーブル内の指定されたカラムの統計情報を自動的に収集します。
CREATE ANALYZE SAMPLE TABLE tbl_name(c1, c2, c3) PROPERTIES (
   "statistic_auto_collect_ratio" = "0.5",
   "statistic_sample_collect_rows" = "1000000"
);

カスタム収集タスクを表示する

SHOW ANALYZE JOB [WHERE predicate]

WHERE 句を使用して結果をフィルタリングできます。このステートメントは以下の列を返します。

列名	説明
Id	収集タスクの ID。
Database	データベース名。
Table	テーブル名。
Columns	カラム名。
Type	統計情報のタイプ。`FULL` と `SAMPLE` を含みます。
Schedule	スケジューリングのタイプ。自動タスクの場合は `SCHEDULE` です。
Properties	カスタムパラメータ。
Status	タスクのステータス。PENDING、RUNNING、SUCCESS、FAILED を含みます。
LastWorkTime	最後の収集時間。
Reason	タスクが失敗した理由。タスクの実行が成功した場合は NULL が返されます。

例

-- すべてのカスタム収集タスクを表示します。
SHOW ANALYZE JOB

-- データベース `test` のカスタム収集タスクを表示します。
SHOW ANALYZE JOB where `database` = 'test';

カスタム収集タスクを削除する

DROP ANALYZE <ID>;

タスク ID は SHOW ANALYZE JOB ステートメントを使用して取得できます。

例

DROP ANALYZE 266030;

収集タスクのステータスを表示する

SHOW ANALYZE STATUS ステートメントを実行して、すべての現在のタスクのステータスを表示できます。このステートメントはカスタム収集タスクのステータスを表示するために使用できません。カスタム収集タスクのステータスを表示するには、SHOW ANALYZE JOB を使用してください。

SHOW ANALYZE STATUS [WHERE predicate];

LIKE または WHERE を使用して返す情報をフィルタリングできます。

このステートメントは以下の列を返します。

リスト名	説明
Id	収集タスクの ID。
Database	データベース名。
Table	テーブル名。
Columns	カラム名。
Type	統計情報のタイプ。FULL、SAMPLE、HISTOGRAM を含みます。
Schedule	スケジューリングのタイプ。`ONCE` は手動、`SCHEDULE` は自動を意味します。
Status	タスクのステータス。
StartTime	タスクが実行を開始した時間。
EndTime	タスクの実行が終了した時間。
Properties	カスタムパラメータ。
Reason	タスクが失敗した理由。実行が成功した場合は NULL が返されます。

統計情報を表示する

基本統計情報のメタデータを表示する

SHOW STATS META [WHERE];

このステートメントは以下の列を返します。

列名	説明
Database	データベース名。
Table	テーブル名。
Columns	カラム名。
Type	統計情報のタイプ。`FULL` は完全収集、`SAMPLE` はサンプル収集を意味します。
UpdateTime	現在のテーブルの最新の統計情報更新時間。
Properties	カスタムパラメータ。
Healthy	統計情報の健康度。

ヒストグラムのメタデータを表示する

SHOW HISTOGRAM META [WHERE];

このステートメントは以下の列を返します。

列名	説明
Database	データベース名。
Table	テーブル名。
Column	カラム。
Type	統計情報のタイプ。ヒストグラムの場合、値は `HISTOGRAM` です。
UpdateTime	現在のテーブルの最新の統計情報更新時間。
Properties	カスタムパラメータ。

統計情報を削除する

不要な統計情報を削除できます。統計情報を削除すると、統計情報のデータとメタデータ、および期限切れのキャッシュ内の統計情報が削除されます。自動収集タスクが進行中の場合、以前に削除された統計情報が再び収集される可能性があることに注意してください。収集タスクの履歴を表示するには、SHOW ANALYZE STATUS を使用できます。

基本統計情報を削除する

DROP STATS tbl_name

ヒストグラムを削除する

ANALYZE TABLE tbl_name DROP HISTOGRAM ON col_name [, col_name];

収集タスクをキャンセルする

KILL ANALYZE ステートメントを使用して、実行中の 収集タスクをキャンセルできます。手動およびカスタムタスクを含みます。

KILL ANALYZE <ID>;

手動収集タスクのタスク ID は SHOW ANALYZE STATUS から取得できます。カスタム収集タスクのタスク ID は SHOW ANALYZE SHOW ANALYZE JOB から取得できます。

FE 設定項目

FE 設定項目	タイプ	デフォルト値	説明
enable_statistic_collect	BOOLEAN	TRUE	統計情報を収集するかどうか。このパラメータはデフォルトでオンになっています。
enable_collect_full_statistic	BOOLEAN	TRUE	自動完全統計情報収集を有効にするかどうか。このパラメータはデフォルトでオンになっています。
statistic_auto_collect_ratio	FLOAT	0.8	自動収集の統計情報が健康かどうかを判断するしきい値。統計情報の健康度がこのしきい値を下回る場合、自動収集がトリガーされます。
statistic_max_full_collect_data_size	LONG	107374182400	自動収集のためにデータを収集する最大パーティションのサイズ。単位: バイト。パーティションがこの値を超える場合、完全収集は破棄され、サンプル収集が実行されます。
statistic_collect_max_row_count_per_query	INT	5000000000	単一の分析タスクでクエリする最大行数。この値を超える場合、分析タスクは複数のクエリに分割されます。
statistic_collect_interval_sec	LONG	300	自動収集中のデータ更新をチェックする間隔。単位: 秒。
statistic_auto_analyze_start_time	STRING	00:00:00	自動収集の開始時間。値の範囲: `00:00:00` - `23:59:59`。
statistic_auto_analyze_end_time	STRING	23:59:59	自動収集の終了時間。値の範囲: `00:00:00` - `23:59:59`。
statistic_sample_collect_rows	LONG	200000	サンプル収集のために収集する最小行数。このパラメータの値がテーブルの実際の行数を超える場合、完全収集が実行されます。
statistic_collect_concurrency	INT	3	並行して実行できる手動収集タスクの最大数。デフォルト値は 3 で、最大 3 つの手動収集タスクを並行して実行できます。この値を超えると、受信タスクは PENDING 状態になり、スケジュールを待ちます。
histogram_buckets_size	LONG	64	ヒストグラムのデフォルトバケット数。
histogram_mcv_size	LONG	100	ヒストグラムの最も一般的な値 (MCV) の数。
histogram_sample_ratio	FLOAT	0.1	ヒストグラムのサンプリング比率。
histogram_max_sample_row_count	LONG	10000000	ヒストグラムのために収集する最大行数。
statistic_manager_sleep_time_sec	LONG	60	メタデータがスケジュールされる間隔。単位: 秒。システムはこの間隔に基づいて以下の操作を実行します: 統計情報を保存するテーブルを作成します。削除された統計情報を削除します。期限切れの統計情報を削除します。
statistic_analyze_status_keep_second	LONG	259200	収集タスクの履歴を保持する期間。デフォルト値は 3 日です。単位: 秒。

参考文献

FE 設定項目をクエリするには、ADMIN SHOW CONFIG を実行します。
FE 設定項目を変更するには、ADMIN SET CONFIG を実行します。

CBO とは​

統計情報の種類​

基本統計情報​

ヒストグラム​

収集タイプと方法​

統計情報の収集​

自動収集​

手動収集​

基本統計情報を手動で収集する​

ヒストグラムを手動で収集する​

カスタム収集​

自動収集タスクをカスタマイズする​

カスタム収集タスクを表示する​

カスタム収集タスクを削除する​

収集タスクのステータスを表示する​

統計情報を表示する​

基本統計情報のメタデータを表示する​

ヒストグラムのメタデータを表示する​

統計情報を削除する​

基本統計情報を削除する​

ヒストグラムを削除する​

収集タスクをキャンセルする​

FE 設定項目​

参考文献​

このドキュメントについてどう思いましたか？

CBO とは

統計情報の種類

基本統計情報

ヒストグラム

収集タイプと方法

統計情報の収集

自動収集

手動収集

基本統計情報を手動で収集する

ヒストグラムを手動で収集する

カスタム収集

自動収集タスクをカスタマイズする

カスタム収集タスクを表示する

カスタム収集タスクを削除する

収集タスクのステータスを表示する

統計情報を表示する

基本統計情報のメタデータを表示する

ヒストグラムのメタデータを表示する

統計情報を削除する

基本統計情報を削除する

ヒストグラムを削除する

収集タスクをキャンセルする

FE 設定項目

参考文献