📄️ CBO の統計情報を収集する
このトピックでは、StarRocks CBO の基本概念と CBO のための統計情報の収集方法について説明します。StarRocks 2.4 では、ヒストグラムを導入して正確なデータ分布統計を収集します。
📄️ 同期マテリアライズドビュー
このトピックでは、同期マテリアライズドビュー (Rollup) の作成、使用、および管理方法について説明します。
🗃️ 非同期マテリアライズドビュー
2項目
📄️ Colocate Join
shuffle join と broadcast join では、ジョイン条件が満たされると、2 つのジョインテーブルのデータ行が単一のノードにマージされてジョインが完了します。これら 2 つのジョイン方法のいずれも、ノード間のデータネットワーク伝送によって引き起こされる遅延やオーバーヘッドを回避することはできません。
📄️ Use Lateral Join for column-to-row conversion
列から行への変換は、ETL 処理で一般的な操作です。Lateral は、行を内部サブクエリやテーブル関数と関連付けることができる特別な Join キーワードです。Lateral を unnest() と組み合わせて使用することで、1 行を複数の行に展開できます。詳細は unnest を参照してください。
📄️ Query Cache
Query Cache は StarRocks の強力な機能で、集計クエリのパフォーマンスを大幅に向上させることができます。ローカル集計の中間結果をメモリに保存することで、過去と同一または類似の新しいクエリに対して不要なディスクアクセスや計算を回避できます。Query Cache により、StarRocks は集計クエリに対して迅速かつ正確な結果を提供し、時間とリソースを節約し、スケーラビリティを向上させます。特に、多くのユーザーが大規模で複雑なデータセットに対して類似のクエリを実行する高並行性シナリオで有用です。
🗃️ Index
2項目
🗃️ 異なる値の数の計算
2項目
📄️ Sorted streaming aggregate
データベースシステムにおける一般的な集計方法には、ハッシュ集計とソート集計があります。