メインコンテンツまでスキップ
バージョン: 3.1

Information Schema

StarRocks の information_schema は、各 StarRocks インスタンス内のデータベースです。information_schema には、StarRocks インスタンスが管理するすべてのオブジェクトの広範なメタデータ情報を格納する、いくつかの読み取り専用のシステム定義テーブルが含まれています。

Information Schema を介したメタデータの表示

StarRocks インスタンス内のメタデータ情報は、information_schema のテーブルの内容をクエリすることで表示できます。

次の例では、StarRocks のテーブル sr_member に関するメタデータ情報を、テーブル tables をクエリすることで表示します。

mysql> SELECT * FROM information_schema.tables WHERE TABLE_NAME like 'sr_member'\G
*************************** 1. row ***************************
TABLE_CATALOG: def
TABLE_SCHEMA: sr_hub
TABLE_NAME: sr_member
TABLE_TYPE: BASE TABLE
ENGINE: StarRocks
VERSION: NULL
ROW_FORMAT: NULL
TABLE_ROWS: 6
AVG_ROW_LENGTH: 542
DATA_LENGTH: 3255
MAX_DATA_LENGTH: NULL
INDEX_LENGTH: NULL
DATA_FREE: NULL
AUTO_INCREMENT: NULL
CREATE_TIME: 2022-11-17 14:32:30
UPDATE_TIME: 2022-11-17 14:32:55
CHECK_TIME: NULL
TABLE_COLLATION: utf8_general_ci
CHECKSUM: NULL
CREATE_OPTIONS: NULL
TABLE_COMMENT: OLAP
1 row in set (1.04 sec)

Information Schema テーブル

StarRocks は、tablestables_configload_tracking_logs テーブルによって提供されるメタデータ情報を最適化し、v3.1 以降の information_schemaloads テーブルを提供しています。

Information Schema テーブル名説明
tablesテーブルの一般的なメタデータ情報を提供します。
tables_configStarRocks に固有の追加のテーブルメタデータ情報を提供します。
load_tracking_logsロードジョブのエラー情報(ある場合)を提供します。
loadsロードジョブの結果を提供します。このテーブルは v3.1 以降でサポートされています。現在、このテーブルから Broker LoadInsert ジョブの結果のみを表示できます。

loads

loads には次のフィールドが提供されています。

フィールド説明
JOB_IDロードジョブを識別するために StarRocks によって割り当てられた一意の ID。
LABELロードジョブのラベル。
DATABASE_NAME宛先の StarRocks テーブルが属するデータベースの名前。
STATEロードジョブの状態。 有効な値:
  • PENDING: ロードジョブが作成されました。
  • QUEUEING: ロードジョブがスケジュール待ちのキューにあります。
  • LOADING: ロードジョブが実行中です。
  • PREPARED: トランザクションがコミットされました。
  • FINISHED: ロードジョブが成功しました。
  • CANCELLED: ロードジョブが失敗しました。
詳細は Asynchronous loading を参照してください。
PROGRESSロードジョブの ETL ステージと LOADING ステージの進行状況。
TYPEロードジョブのタイプ。 Broker Load の場合、返される値は BROKER です。INSERT の場合、返される値は INSERT です。
PRIORITYロードジョブの優先度。 有効な値: HIGHEST, HIGH, NORMAL, LOW, LOWEST
SCAN_ROWSスキャンされたデータ行の数。
FILTERED_ROWSデータ品質が不十分なためにフィルタリングされたデータ行の数。
UNSELECTED_ROWSWHERE 句で指定された条件によりフィルタリングされたデータ行の数。
SINK_ROWSロードされたデータ行の数。
ETL_INFOロードジョブの ETL 詳細。Spark Load の場合のみ値が返されます。他のタイプのロードジョブの場合、空の値が返されます。
TASK_INFOロードジョブのタスク実行詳細、例えば timeoutmax_filter_ratio 設定など。
CREATE_TIMEロードジョブが作成された時間。フォーマット: yyyy-MM-dd HH:mm:ss。例: 2023-07-24 14:58:58
ETL_START_TIMEロードジョブの ETL ステージの開始時間。フォーマット: yyyy-MM-dd HH:mm:ss。例: 2023-07-24 14:58:58
ETL_FINISH_TIMEロードジョブの ETL ステージの終了時間。フォーマット: yyyy-MM-dd HH:mm:ss。例: 2023-07-24 14:58:58
LOAD_START_TIMEロードジョブの LOADING ステージの開始時間。フォーマット: yyyy-MM-dd HH:mm:ss。例: 2023-07-24 14:58:58
LOAD_FINISH_TIMEロードジョブの LOADING ステージの終了時間。フォーマット: yyyy-MM-dd HH:mm:ss。例: 2023-07-24 14:58:58
JOB_DETAILSロードされたデータの詳細、例えばバイト数やファイル数など。
ERROR_MSGロードジョブのエラーメッセージ。エラーが発生しなかった場合、NULL が返されます。
TRACKING_URLロードジョブで検出された不適格なデータ行サンプルにアクセスできる URL。curl または wget コマンドを使用して URL にアクセスし、不適格なデータ行サンプルを取得できます。不適格なデータが検出されなかった場合、NULL が返されます。
TRACKING_SQLロードジョブのトラッキングログをクエリするために使用できる SQL ステートメント。ロードジョブに不適格なデータ行が含まれる場合のみ SQL ステートメントが返されます。不適格なデータ行が含まれない場合、NULL が返されます。
REJECTED_RECORD_PATHロードジョブでフィルタリングされたすべての不適格なデータ行にアクセスできるパス。ログに記録される不適格なデータ行の数は、ロードジョブで設定された log_rejected_record_num パラメータによって決まります。wget コマンドを使用してパスにアクセスできます。不適格なデータ行が含まれない場合、NULL が返されます。

tables

tables には次のフィールドが提供されています。

フィールド説明
TABLE_CATALOGテーブルを格納するカタログの名前。
TABLE_SCHEMAテーブルを格納するデータベースの名前。
TABLE_NAMEテーブルの名前。
TABLE_TYPEテーブルのタイプ。有効な値: "BASE TABLE" または "VIEW"。
ENGINEテーブルのエンジンタイプ。有効な値: "StarRocks", "MySQL", "MEMORY" または空の文字列。
VERSIONStarRocks で利用できない機能に適用されます。
ROW_FORMATStarRocks で利用できない機能に適用されます。
TABLE_ROWSテーブルの行数。
AVG_ROW_LENGTHテーブルの平均行長(サイズ)。これは DATA_LENGTH / TABLE_ROWS に相当します。単位: バイト。
DATA_LENGTHテーブルのデータ長(サイズ)。単位: バイト。
MAX_DATA_LENGTHStarRocks で利用できない機能に適用されます。
INDEX_LENGTHStarRocks で利用できない機能に適用されます。
DATA_FREEStarRocks で利用できない機能に適用されます。
AUTO_INCREMENTStarRocks で利用できない機能に適用されます。
CREATE_TIMEテーブルが作成された時間。
UPDATE_TIMEテーブルが最後に更新された時間。
CHECK_TIMEテーブルに対して整合性チェックが最後に実行された時間。
TABLE_COLLATIONテーブルのデフォルトの照合順序。
CHECKSUMStarRocks で利用できない機能に適用されます。
CREATE_OPTIONSStarRocks で利用できない機能に適用されます。
TABLE_COMMENTテーブルに関するコメント。

tables_config

tables_config には次のフィールドが提供されています。

フィールド説明
TABLE_SCHEMAテーブルを格納するデータベースの名前。
TABLE_NAMEテーブルの名前。
TABLE_ENGINEテーブルのエンジンタイプ。
TABLE_MODELテーブルタイプ。有効な値: "DUP_KEYS", "AGG_KEYS", "UNQ_KEYS", "PRI_KEYS"。
PRIMARY_KEY主キーテーブルまたはユニークキーテーブルの主キー。テーブルが主キーテーブルまたはユニークキーテーブルでない場合、空の文字列が返されます。
PARTITION_KEYテーブルのパーティション列。
DISTRIBUTE_KEYテーブルのバケッティング列。
DISTRIBUTE_TYPEテーブルのデータ分散方法。
DISTRIBUTE_BUCKETテーブルのバケット数。
SORT_KEYテーブルのソートキー。
PROPERTIESテーブルのプロパティ。
TABLE_IDテーブルの ID。

load_tracking_logs

この機能は StarRocks v3.0 以降でサポートされています。

load_tracking_logs には次のフィールドが提供されています。

フィールド説明
JOB_IDロードジョブの ID。
LABELロードジョブのラベル。
DATABASE_NAMEロードジョブが属するデータベース。
TRACKING_LOGロードジョブのエラーログ(ある場合)。
Typeロードジョブのタイプ。有効な値: BROKER, INSERT, ROUTINE_LOAD, STREAM_LOAD。

materialized_views

materialized_views には次のフィールドが提供されています。

フィールド説明
MATERIALIZED_VIEW_IDマテリアライズドビューの ID
TABLE_SCHEMAマテリアライズドビューが存在するデータベース
TABLE_NAMEマテリアライズドビューの名前
REFRESH_TYPEマテリアライズドビューのリフレッシュタイプ。有効な値: ROLLUP (同期マテリアライズドビュー), ASYNC (非同期リフレッシュマテリアライズドビュー), MANUAL (手動リフレッシュマテリアライズドビュー)。値が ROLLUP の場合、アクティベーションステータスとリフレッシュに関連するすべてのフィールドは空です。
IS_ACTIVEマテリアライズドビューがアクティブかどうかを示します。非アクティブなマテリアライズドビューはリフレッシュまたはクエリできません。
INACTIVE_REASONマテリアライズドビューが非アクティブである理由
PARTITION_TYPEマテリアライズドビューのパーティション戦略のタイプ
TASK_IDマテリアライズドビューをリフレッシュするタスクの ID
TASK_NAMEマテリアライズドビューをリフレッシュするタスクの名前
LAST_REFRESH_START_TIME最新のリフレッシュタスクの開始時間
LAST_REFRESH_FINISHED_TIME最新のリフレッシュタスクの終了時間
LAST_REFRESH_DURATION最新のリフレッシュタスクの期間
LAST_REFRESH_STATE最新のリフレッシュタスクの状態
LAST_REFRESH_FORCE_REFRESH最新のリフレッシュタスクが強制リフレッシュであったかどうかを示します
LAST_REFRESH_START_PARTITION最新のリフレッシュタスクの開始パーティション
LAST_REFRESH_END_PARTITION最新のリフレッシュタスクの終了パーティション
LAST_REFRESH_BASE_REFRESH_PARTITIONS最新のリフレッシュタスクに関与したベーステーブルのパーティション
LAST_REFRESH_MV_REFRESH_PARTITIONS最新のリフレッシュタスクでリフレッシュされたマテリアライズドビューのパーティション
LAST_REFRESH_ERROR_CODE最新のリフレッシュタスクのエラーコード
LAST_REFRESH_ERROR_MESSAGE最新のリフレッシュタスクのエラーメッセージ
TABLE_ROWSバックグラウンド統計に基づくマテリアライズドビューのデータ行数
MATERIALIZED_VIEW_DEFINITIONマテリアライズドビューの SQL 定義