StarRocks version 4.0
4.0.0
リリース日:2025年10月17日
データレイク分析
- BE メタデータ用の Page Cache と Data Cache を統合し、スケーリングに適応的な戦略を採用。#61640
- Iceberg 統計情報のメタデータファイル解析を最適化し、繰り返し解析を回避。#59955
- Iceberg メタデータに対する COUNT/MIN/MAX クエリを最適化し、データファイルスキャンを効率的にスキップすることで、大規模パーティションテーブルの集約クエリ性能を大幅に向上させ、リソース消費を削減。#60385
- プロシージャ
rewrite_data_files
により Iceberg テーブルの Compaction をサポート。 - 隠しパーティション(Hidden Partition)を持つ Iceberg テーブルをサポート(作成、書き込み、読み取りを含む)。#58914
- Iceberg テーブル作成時のソートキー設定をサポートします。
- Iceberg テーブル向けのシンクパフォーマンスを最適化します。
- Iceberg テーブルのバケット対応実行を強化し、バケット化テーブルの並行処理能力と分散処理能力を向上させました。#61756
- Paimon カタログで TIME データ型をサポート。#58292
- Iceberg バージョンを 1.10.0 にアップグレード。#63667
セキュリティと認証
- JWT 認証と Iceberg REST Catalog を利用するシナリオで、StarRocks は REST Session Catalog を介してユーザーログイン情報を Iceberg に透過し、その後のデータアクセス認証をサポート。#59611 #58850
- Iceberg カタログ用の Vended Credential をサポート。
- Group Provider 経由で取得した外部グループへの StarRocks 内部ロールの付与をサポート。#63385 #63258
- 外部テーブルのリフレッシュ権限を制御するため、外部テーブルに REFRESH 権限を追加しました。#63385
ストレージ最適化とクラスタ管理
- 共有データクラスタのクラウドネイティブテーブルにファイルバンドル(File Bundling)最適化を導入。ロード、Compaction、Publish 操作によって生成されるデータファイルを自動的にバンドルし、外部ストレージシステムへの高頻度アクセスによる API コストを削減。#58316
- 複数テーブル間の Write-Write トランザクション(Multi-Table Write-Write Transaction)をサポートし、INSERT、UPDATE、DELETE 操作のアトミックコミットを制御可能。Stream Load および INSERT INTO インターフェイスをサポートし、ETL やリアルタイム書き込みシナリオにおけるクロステーブルの一貫性を保証。#61362
- Routine Load で Kafka 4.0 をサポート。
- 共有なしクラスタの主キーテーブルに対する全文インバーテッドインデックスをサポート。
- 集約テーブルの集約キーの変更をサポート。#62253s
- カタログ、データベース、テーブル、ビュー、マテリアライズドビューの名前に対して大文字小文字を区別しない処理を有効化可能。#61136
- 共有データクラスタにおける Compute Node のブラックリスト化をサポート。#60830
- グローバル接続 ID をサポート。#57256
- 復元可能な削除済みメタデータを表示するため、Information Schema に
recyclebin_catalogs
メタデータビューを追加しました。#51007
クエリと性能改善
- DECIMAL256 データ型をサポートし、精度の上限を 38 ビットから 76 ビットに拡張。256 ビットのストレージにより、高精度が求められる金融や科学計算シナリオに柔軟に対応し、大規模集約や高次演算での DECIMAL128 の精度オーバーフロー問題を効果的に緩和。#59645
- 基本演算子のパフォーマンスを改善しました。#61691 #61632 #62585 #61405 #61429
- JOIN および AGG 演算子の性能を最適化。#61691
- [Preview] SQL Plan Manager を導入し、クエリとクエリプランをバインド可能に。これにより、システム状態(データ更新や統計更新)の変化によるクエリプランの変動を防止し、クエリ性能を安定化。#56310
- Partition-wise Spillable Aggregate/Distinct 演算子を導入し、従来のソートベース集約による Spill 実装を置き換え。複雑かつ高カーディナリティの GROUP BY シナリオで集約性能を大幅に改善し、読み書き負荷を削減。#60216
- Flat JSON V2:
- STRING データ型向けに適応型 ZoneMap インデックス作成戦略をサポート。#61960
- クエリ可視性の強化:
- マテリアライズドビューの再作成では、元のテーブルの分散キーとソートキーを考慮し、最適なマテリアライズドビューの選択を改善。#62830
関数と SQL 構文
- 以下の関数を追加:
- 以下の構文拡張を提供:
動作変更
- マテリアライズドビューのパラメータ
auto_partition_refresh_number
のロジックを調整し、自動リフレッシュか手動リフレッシュかにかかわらず、リフレッシュ対象のパーティション数を制限します。#62301 - Flat JSON がデフォルトで有効化されました。#62097
- システム変数
enable_materialized_view_agg_pushdown_rewrite
のデフォルト値がtrue
に設定され、マテリアライズドビューのクエリ書き換えにおける集計プッシュダウンがデフォルトで有効化されました。#60976 information_schema.materialized_views
内のいくつかの列の型を変更し、対応するデータとの整合性を高めました。#60054split_part
関数は区切り文字が一致しない場合に NULL を返すように変更。#56967- CTAS/CREATE MATERIALIZED VIEW で固定長 CHAR を STRING に置き換え、誤った列長推論によるマテリアライズドビュー更新失敗を回避。#63114 #63114 #62476
- データキャッシュ関連の構成が簡素化されました。#61640
datacache_mem_size
およびdatacache_disk_size
が有効になりました。storage_page_cache_limit
、block_cache_mem_size
、block_cache_disk_size
は非推奨となりました。
- Hive および Iceberg のメタデータキャッシュに使用するメモリリソースを制限する新しいカタログプロパティを追加(Hive 用
remote_file_cache_memory_ratio
、Iceberg 用iceberg_data_file_cache_memory_usage_ratio
およびiceberg_delete_file_cache_memory_usage_ratio
)。デフォルト値を0.1
(10%)に設定。メタデータキャッシュの TTL を24時間に調整。#63459 #63373 #61966 #62288 - SHOW DATA DISTRIBUTION は、同じバケットシーケンス番号を持つすべてのマテリアライズドインデックスの統計情報を統合しなくなりました。マテリアライズドインデックスレベルでのデータ分散のみを表示します。#59656
- 自動バケットテーブルのデフォルトバケットサイズを4GBから1GBに変更し、パフォーマンスとリソース利用率を改善しました。#63168
- システムは対応するセッション変数と INSERT 文の列数に基づいて部分更新モードを決定します。#62091
- Information Schema 内の
fe_tablet_schedules
ビューを最適化しました。#62073 #59813TABLET_STATUS
列をSCHEDULE_REASON
に、CLONE_SRC
列をSRC_BE_ID
に、CLONE_DEST
列をDEST_BE_ID
に名称変更しました。CREATE_TIME
、SCHEDULE_TIME
およびFINISH_TIME
列のデータ型をDOUBLE
からDATETIME
に変更しました。
- 一部の FE メトリクスに
is_leader
ラベルを追加しました。#63004