TPC-H ベンチマーク
TPC-H は、トランザクション処理性能評議会 (TPC) によって開発された意思決定支援ベンチマークです。ビジネス指向のアドホッククエリと同時データ修正のスイートで構成されています。TPC-H は、実際の生産環境に基づいたモデルを構築し、販売システムのデータウェアハウスをシミュレートするために使用できます。このテストでは、データサイズが 1 GB から 3 TB の 8 つのテーブルを使用します。合計 22 のクエリがテストされ、主な性能指標は各クエリの応答時間であり、クエリが送信されてから結果が返されるまでの時間です。
1. テスト結論
TPC-H 100G スケールデータセットで合計 22 のクエリを使用して比較テストを実施しました。結果は以下の通りです。

StarRocks はローカルストレージと Hive テーブルクエリの 2 つの方法をテストしました。StarRocks Hive テーブルと Trino は同じデータをクエリします。データは ORC 形式で保存され、zlib 形式で圧縮されています。
StarRocks がネイティブストレージからデータをクエリするレイテンシーは 21 秒、StarRocks が Hive 外部テーブルをクエリするレイテンシーは 92 秒、Trino が Hive 外部テーブルをクエリするレイテンシーは 187 秒でした。
2. テスト準備
2.1 ハードウェア環境
| マシン | 4 クラウドホスト |
|---|---|
| CPU | 16core Intel(R) Xeon(R) Platinum 8269CY CPU @ 2.50GHz |
| メモリ | 64 GB |
| ネットワーク帯域幅 | 5 Gbits/s |
| ディスク | ESSD クラウドディスク |
2.2 ソフトウェア環境
StarRocks と Trino は同じ構成のマシンにデプロイされています。StarRocks には 1 FE と 3 BEs がデプロイされています。Trino には 1 コーディネーターと 3 ワーカーがデプロイされています。
-
カーネルバージョン: Linux 3.10.0-1127.13.1.el7.x86_64
-
オペレーティングシステムバージョン: CentOS Linux release 7.8.2003
-
ソフトウェアバージョン: StarRocks Community Edition 3.0, Trino-419, Hive-2.3.9