StarRocks Version 4.0(KOR)

카테고리

Version

생성자

Untitled

4.0.10
동작 변경
개선 사항
버그 수정
4.0.9
동작 변경
개선 사항
버그 수정
4.0.8
동작 변경
개선 사항
버그 수정
4.0.6
개선 사항
버그 수정
4.0.5
개선 사항
버그 수정
4.0.4
개선 사항
버그 수정
4.0.3
개선 사항
버그 수정
4.0.2
새로운 기능
개선 사항
버그 수정
동작 변경
4.0.1
개선 사항
버그 수정
동작 변경
4.0.0
Data Lake Analytics
Security and Authentication
Storage Optimization and Cluster Management
Query and Performance Improvement
Functions and SQL Syntax
Behavior Changes
4.0.0-RC
데이터 레이크 분석
보안 및 인증
스토리지 최적화 및 클러스터 관리
쿼리 및 성능 개선
함수 및 SQL 구문

4.0.10

출시일: 2026년 5월 9일

동작 변경

INSERT INTO FILES가 생성하는 오류 메시지에서 클라우드 스토리지 자격 증명이 이제 마스킹되어, 오류 로그와 SHOW LOAD 출력에 시크릿이 실수로 노출되는 것을 방지합니다. #71245
StarRocks는 이제 Hive catalog의 insert-only ACID Hive 테이블에 대한 쿼리를 더 이상 허용하지 않습니다. 이전에는 INSERT OVERWRITE 작업이 인식되지 않아 이러한 쿼리가 실제로 보이는 것보다 더 많은 행을 조용히 반환할 수 있었습니다. 영향을 받는 테이블은 이제 잘못된 결과 대신 명시적인 오류를 반환합니다. #71460

개선 사항

파티션이 많은 테이블에서 파티션 로드 중 중복되는 Jackson ObjectMapper 할당을 제거하기 위해 Iceberg PartitionData 생성에 Avro 스키마 캐시를 추가했습니다. #72215
CatalogRecycleBin.getAdjustedRecycleTimestamp를 최적화하여 호출할 때마다 table-id 맵을 다시 구축하지 않도록 함으로써 휴지통 정리 및 tablet 스케줄링 오버헤드를 줄였습니다. #72128
OlapTableSink.createLocation이 이제 shared-data 모드에서 tablet 위치 조회를 일괄 처리하여, 이전에 플래너의 임계 영역(critical section)을 정체시키던 tablet별 StarOS RPC를 제거합니다. #72041
Java UDAF 인스턴스가 이제 쿼리당 한 번 로드 및 초기화되어 여러 파이프라인 드라이버 인스턴스에서 재사용되므로, 높은 pipeline_dop에서 발생하던 선형적인 드라이버 준비 오버헤드가 제거됩니다. #72038
로컬 캐시가 미스되어 StarOS 워커가 starmgr에서 shard 정보를 가져오는 폴백을 수행하는 경우를 추적하기 위해 BE 메트릭 starrocks_be_staros_shard_info_fallback_total 및 starrocks_be_staros_shard_info_fallback_failed_total을 추가했습니다. #71620
파일 번들 쓰기가 이제 tablet 로컬 aggregator를 우선적으로 사용하므로, 번들된 tablet 메타데이터 경로에서 노드 간 shard 정보 조회가 필요하지 않습니다. #71613
감사 로그 항목이 이제 각 쿼리가 참조하는 조회된 테이블과 뷰를 포함합니다. #71596
INSERT INTO FILES의 CSV 내보내기가 이제 필드 인용(quoting) 및 이스케이프를 제어하기 위한 csv.enclose 및 csv.escape 속성을 지원합니다. #71589
DN 패턴을 통한 LDAP 직접 바인드(direct bind) 인증을 추가하여, 단일 테넌트 LDAP 구성에서 관리자 검색 계정 요구 사항을 제거했습니다. #71559
shared-nothing 메트릭 세트와 일치시키기 위해 shared-data 클러스터용 starrocks_fe_tablet_num 메트릭을 추가했습니다. #71444
star_mgr_meta_sync_interval_sec가 이제 ADMIN SET FRONTEND CONFIG를 통해 런타임에 변경 가능하며, 새로운 간격은 FE 재시작 없이 다음 동기화 주기에 적용됩니다. #71675

버그 수정

다음 이슈들이 수정되었습니다:

shared-data combined txn log 모드에서 파티션별 coordinator 디스패치로의 INSERT가 정상적인 txn 로그를 orphan으로 분류하여 삭제함으로써 트랜잭션이 non-VISIBLE 상태로 멈추던 경합(race)을 수정했습니다. #72237
shared-data combined txn log 모드에서 레거시 "sender_id == 0이 모든 로그를 수집한다" 규칙이 incremental 채널에는 적용되지 않아 _incremental_open_node_channel 채널이 txn 로그를 조용히 누락시키던 이슈를 수정했습니다. #71992
프로파일 직렬화 중 다른 스레드가 카운터의 min/max 값을 재설정할 때 RuntimeProfile::to_thrift()가 std::bad_optional_access로 BE를 크래시시킬 수 있던 이슈를 수정했습니다. #72904
한쪽이 빈 값을 제공할 때 flat JSON 병합 결과에서 발생하던 불일치를 수정했습니다. #72973
사용자가 PROPERTIES에 format-version을 명시적으로 지정했을 때 Iceberg 테이블에 대한 CREATE TABLE이 "Multiple entries with same key: format-version" 오류로 실패하던 이슈를 수정했습니다. #72828
단일 테이블 임계 작업 전반에 걸쳐 DB 전체 READ 락을 보유하여 동일 데이터베이스 내 다른 테이블에 대한 동시 DDL을 차단하던 CompactionScheduler.startCompaction의 락 범위를 수정했습니다. DB에 대한 IS 락과 대상 테이블에 대한 READ 락으로 전환했습니다. #72178
StarMgrMetaSyncer.syncTableMetaInternal 및 syncTableColocationInfo가 외부 StarOS RPC 전반에 걸쳐 DB READ/WRITE 락을 보유하여 각 RPC가 지속되는 동안 데이터베이스 내 모든 테이블에 대한 CREATE/DROP/ALTER/RENAME을 멈추게 하던 이슈를 수정했습니다. #72108
StarMgrMetaSyncer.getAllPartitionShardGroupId가 모든 cloud-native 테이블과 물리 파티션을 전체 순회하는 동안 DB READ 락을 보유하여, 대규모 catalog에서 DB write 락을 기다리는 FE 스레드를 정체시키던 이슈를 수정했습니다. #71614
getTableNamesViewWithLock의 불필요한 DB READ 락을 수정했습니다. 기반이 되는 nameToTable은 ConcurrentHashMap이므로, 이를 감싸는 락은 정확성에 대한 이점 없이 경합만 추가했습니다. #72042
proximateRowCount() 계산에는 불필요했던 읽기 전용 /api/{db}/{table}/_count REST 엔드포인트의 DB WRITE 락을 수정했습니다. #72053
tablet split, 스키마 변경, alter 작업 등이 대응되는 publish 없이 nextVersion을 증가시켜 예약함으로써 발생한 파티션 버전 간극으로 인한 배치 publish 데드락을 수정했습니다. #71483
캐시가 가득 차 상태에서 rowset 메타데이터용 LRU 캐시를 워밍업할 때 shared-nothing 모드에서 발생하던 데드락을 수정했습니다. #71459
consumer 등록과 finished 시그널링 간의 잘못된 순서로 인해 waitUtilFinished에서 멈추어 있을 수 있던 PipelineTimerTask를 수정했습니다. #72058
_writer_count에 대한 벡터 범위 초과(out-of-bounds) 접근을 통해 SIGSEGV로 BE를 크래시시키던 ConnectorSinkPassthroughExchanger::accept의 조건 경합(condition race)을 수정했습니다. #71848
임시 shared_ptr의 소멸로 인해 발생한 LoadChannel::get_load_replica_status의 use-after-free를 수정했습니다. #71843
비동기 RPC closure 처리에서 참조 카운트 증가가 누락되어 발생한 information schema sink의 use-after-free를 수정했습니다. #71513
decimal 값 너비의 부적절한 처리로 인해 발생한 reverse(DecimalV3)의 BE 크래시를 수정했습니다. #71834
UNNEST가 define-expression에 ARRAY 타입을 포함하는 컬럼을 생성하여 다운스트림의 전역 사전(global dictionary) 생성과 호환되지 않을 때 발생하던 BE 크래시를 수정했습니다. #72027
bucket(4, region)과 같이 잘못된 transform 인자 순서로 Iceberg 외부 테이블을 생성할 때 FE에서 발생하던 NPE를 수정했습니다. 이제 FE는 일반적인 analyzer 오류를 반환합니다. #71917
테이블에 대한 첫 번째 쿼리가 통계를 요청하지 않은 경우(예: SELECT *) Iceberg manifest 데이터 파일 캐시 항목에 컬럼 통계가 누락되던 이슈를 수정했습니다. #71913
PruneHDFSScanColumnRule이 placeholder 구체화 컬럼을 주입하여, 테이블이 bucket(col, N)으로 파티션된 경우 Iceberg min/max 최적화가 조용히 건너뛰어지던 이슈를 수정했습니다. #71863
identity 대신 Table.getId()가 비교되었고 connector 테이블 id가 플랜 재구축 시 변경될 수 있어 AggregateJoinPushDownRule이 Iceberg 베이스 테이블 위의 구체화 뷰를 재작성(rewrite)하지 못하던 이슈를 수정했습니다. #71856
metastore가 파일 시스템에 더 이상 존재하지 않는 위치를 가진 파티션을 나열할 때 Hive 동적 파티션으로의 INSERT OVERWRITE가 실패하던 이슈를 수정했습니다. 이제 누락된 파티션 디렉터리는 커밋 전에 생성됩니다. #71810
Arrow가 array, struct, map 내부에 중첩된 사전을 포함하여 dictionary 타입의 컬럼을 반환할 때 발생하던 Parquet 스캐너 실패(Illegal converting from arrow type(dictionary) ...)를 수정했습니다. #71855
이전 배치의 오래된 스캔 범위가 ColocatedBackendSelector.Assignment의 incremental 배치에 걸쳐 잔존하여 파일이 다시 배포되고 다시 스캔되던 이슈를 수정했습니다. #71789
PruneShuffleColumnRule이 Exchange shuffle 컬럼을 가지치기(prune)한 후 Join outputProperty를 업데이트하지 않아 잘못된 다운스트림 분배(distribution)를 초래하던 이슈를 수정했습니다. #72003
다단계 MV 재작성의 첫 번째 단계에서 PushDownJoinOnExpressionToChildProject가 비활성화되었을 때 project 노드 누락으로 인해 발생한 잘못된 shuffle 분배를 수정했습니다. #71075
predicate 정규화로 동일한 scalar-subquery placeholder가 여러 번 나타날 때 ReplaceSubqueryRewriteRule에서 발생하던 중복 Apply 첨부(attachment)를 수정했습니다. #71155
완료된 join probe가 파이프라인이 finished 상태로 전환되는 것을 막을 수 있던 EventScheduler의 short-circuit 이슈를 수정했습니다. #71740
aws.s3.iam_role_arn을 통해 구성된 AWS assume-role이 JNI 스캐너(RCFile / Avro / SequenceFile / Hudi)에 적용되지 않아 S3 403 오류를 유발하던 이슈를 수정했습니다. #71422
날짜 리터럴이 Oracle NLS 형식과 일치하지 않아 Oracle JDBC predicate 푸시다운이 잘못된 SQL을 생성하던 이슈를 수정했습니다. 이제 리터럴은 date '...' 형태로 출력됩니다. #71412
shared-data 모드에서 follower FE가 DDL을 leader로 전달하고 FE journal 재생만 기다려 StarMgr journal을 놓치면서, 테이블 생성 직후 이어지는 쿼리에 대해 "no queryable replica" 오류를 발생시키던 이슈를 수정했습니다. #71263
Primary Key tablet에 대한 get_tablet_stats가 get_del_vec_in_meta()를 통해 모든 세그먼트마다 전체 TabletMetadata를 반복적으로 다시 로드하던 이슈를 수정했습니다. #71672
실제 스키마 대신 placeholder 이름이 출력되어 빈 결과 집합이 r이라는 컬럼 이름을 반환하던 Arrow Flight 이슈를 수정했습니다. #71534
CLONE 스레드 풀 크기를 조정할 때 parallel_clone_task_per_path 업데이트가 store-path 수를 포함하지 않던 이슈를 수정했습니다. #71484
리소스 그룹 사용자 분류기(classifier)가 CREATE USER에서는 허용하는 숫자로 시작하는 사용자 이름을 거부하던 이슈를 수정했습니다. 이제 분류기는 CREATE USER와 동일한 검증 규칙을 사용합니다. #71470
isRegistered()가 false일 때 HttpServerHandler.channelInactive가 unregisterConnection을 건너뛰어, 조기에 실패하는 요청에 대한 connection-map 항목이 누수되던 이슈를 수정했습니다. #72006
Java UDF JNI 호출(NewObject, NewArray, NewStringUTF 등)이 예외나 null 반환을 확인하지 않아 조용한 실패 또는 정의되지 않은 동작을 초래하던 이슈를 수정했습니다. #71734
be_tablets.DATA_SIZE가 rowset 컬럼 데이터 바이트 대신 total_disk_size(rowset에 내장된 인덱스 및 lake PK tablet의 영구 PK 인덱스 포함)를 보고하던 이슈를 수정했습니다. #70735
삭제할 shard가 없는 경우에도 StarMgrMetaSyncer가 출력하던 불필요한 "Failed to batch drop tablets" 경고를 수정했습니다. #72209
CVE-2026-42198(pgjdbc) 및 CVE-2026-5598(BouncyCastle): org.postgresql:postgresql을 42.7.11로, BouncyCastle을 1.84로 업그레이드했습니다. #72797
netty의 CVE: netty를 4.1.133.Final로 업그레이드했습니다. #72905
broker의 netty / jetty / awssdk / jackson 의존성을 업그레이드하여 broker의 CVE를 정리했습니다. #72184
이전 jetty-http 버전의 알려진 CVE를 해결하기 위해 jetty-http를 9.4.58.v20250814로 업그레이드했습니다. #71762
jetty 9.x가 EOL이고 업스트림 수정이 게시되지 않았으므로, 빌드 차단을 해제하기 위해 CVE-2026-2332를 임시로 마스킹했습니다. #71914

4.0.9

출시일: 2026년 4월 16일

동작 변경

VARBINARY 컬럼이 중첩 타입(ARRAY, MAP, STRUCT) 내부에 나타날 때, StarRocks는 이제 MySQL 결과 집합에서 해당 값을 바이너리 형식으로 올바르게 인코딩합니다. #71346
Routine Load 작업은 이제 Primary Key 크기 제한을 초과하게 만드는 행과 같은 재시도 불가능한(non-retryable) 오류가 발생하면 자동으로 일시 중지됩니다. #71161
SHOW CREATE TABLE 및 DESC 문이 이제 Paimon 외부 테이블의 Primary Key 컬럼을 표시합니다. #70535
Cloud-native tablet 메타데이터 가져오기 작업(get_tablet_stats 및 get_tablet_metadatas 등)은 이제 공유 UPDATE_TABLET_META_INFO 풀 대신 전용 스레드 풀을 사용합니다. #70492

개선 사항

MySQL 프로토콜 응답에서 VARBINARY 값의 인코딩 동작을 제어하기 위한 세션 변수를 추가했습니다. #71415
스냅샷 복원 전 무결성 검증을 지원하기 위해 클러스터 스냅샷에 snapshot_meta.json 마커 파일을 추가했습니다. #71209
조용한 실패에 대한 관찰 가능성(observability)을 개선하기 위해 WarehouseManager에서 조용히 삼켜지던 예외에 대한 경고 로그를 추가했습니다. #71215
성능 모니터링 및 진단을 지원하기 위해 Iceberg 메타데이터 테이블 쿼리에 대한 메트릭을 추가했습니다. #70825
regexp_replace() 함수가 이제 FE 쿼리 계획 수립 중 상수 폴딩(constant folding)을 지원하여, 상수 문자열 인자를 가진 쿼리의 계획 수립 오버헤드를 줄입니다. #70804
모니터링 및 성능 분석을 개선하기 위해 Iceberg time travel 쿼리에 대한 분류된 메트릭을 추가했습니다. #70788
update compaction이 일시 중단될 때 로그 출력을 추가하여 compaction 수명 주기에 대한 가시성을 개선했습니다. #70538
SHOW COLUMNS가 이제 PostgreSQL 외부 테이블의 컬럼 주석을 반환합니다. #70520
쿼리에서 예외가 발생할 때 쿼리 실행 계획을 덤프하는 기능을 지원하여 런타임 실패의 진단 가능성을 개선했습니다. #70387
DDL 작업 중 tablet 삭제가 이제 일괄 처리되어 tablet 메타데이터에 대한 write 락 경합을 줄입니다. #70052
오류 상태에 멈추 정상적인 방법으로 삭제할 수 없는 동기식 구체화 뷰를 위한 Force Drop 복구 메커니즘을 추가했습니다. #70029

버그 수정

다음 이슈들이 수정되었습니다:

프로파일의 START_TIME 및 END_TIME이 세션 타임존으로 표시되지 않던 이슈를 수정했습니다. #71429
CASE-WHEN/IF 표현식을 처리할 때 잘못된 쿼리 결과를 유발할 수 있던 PushDownAggregateRewriter의 공유 객체 변형(shared-object mutation) 버그를 수정했습니다. #71309
스레드 생성이 실패할 때 발생하던 ThreadPool::do_submit의 use-after-free 버그를 수정했습니다. #71276
information_schema.tables가 등식 predicate에서 특수 문자를 올바르게 이스케이프하지 않아 잘못된 결과를 유발하던 이슈를 수정했습니다. #71273
구체화 뷰가 비활성 상태가 된 후에도 구체화 뷰 스케줄러가 계속 실행되던 이슈를 수정했습니다. #71265
동시 ALTER 작업 간에 스키마 업데이트 작업이 건너뛰어질 수 있던 UpdateTabletSchemaTask의 작업 시그니처 충돌을 수정했습니다. #71242
MCV(Most Common Values) 항목만 포함하는 히스토그램에 대해 행 수 추정이 NaN 값을 생성하던 이슈를 수정했습니다. #71241
AWS SDK 통합에서 AWS S3 Transfer Manager에 대한 누락된 의존성을 수정했습니다. #71230
TaskManager 스케줄러 콜백이 현재 노드가 leader인지 확인하지 않아 follower 노드에서 중복 작업 실행을 유발할 수 있던 이슈를 수정했습니다. #71156
leader로 전달된 요청이 완료된 후 ConnectContext 정보가 정리되지 않던 thread-local 캄텍스트 오염 이슈를 수정했습니다. #71141
short-circuit 포인트 조회에서 파티션 predicate가 누락되어 잘못된 쿼리 결과를 유발하던 이슈를 수정했습니다. #71124
generated 컬럼 표현식이 참조하는 컬럼이 로드 스키마에 없는 경우 Stream Load 또는 Broker Load 중 generated 컬럼을 분석할 때 발생하던 NullPointerException을 수정했습니다. #71116
병렬 세그먼트 및 rowset 로딩의 오류 처리 경로에서 발생하던 use-after-free 버그를 수정했습니다. #71083
동일한 publish 배치에서 쓰기 작업이 compaction보다 먼저 수행될 때 delvec orphan 항목이 남겨지던 이슈를 수정했습니다. #71049
쿼리 진행 상황을 내부적으로 확인할 때 HTTP 루프백을 통해 쿼리가 current_queries 결과에 나타나던 이슈를 수정했습니다. #71032
CVE-2026-33870 및 CVE-2026-33871을 수정했습니다. #71017
SharedDataStorageVolumeMgr의 read 락 누수를 수정했습니다. #70987
locate() 함수의 입력 컬럼과 결과 컬럼이 BinaryColumns 내부에서 동일한 NullColumn 참조를 공유하여 잘못된 결과를 유발하던 이슈를 수정했습니다. #70957
share-nothing 모드에서 ALTER 작업 중 안전 tablet 삭제 검사가 잘못 적용되던 이슈를 수정했습니다. #70934
전역 런타임 필터가 올바르게 적용되지 못하게 할 수 있던 _all_global_rf_ready_or_timeout의 경합 조건(race condition)을 수정했습니다. #70920
메트릭 값이 조용히 오버플로되게 하던 ACCUMULATED 메트릭 매크로의 int32 오버플로를 수정했습니다. #70889
사전 인코딩된 merge GROUP BY 쿼리에서 발생하던 잘못된 집계 결과를 수정했습니다. #70866
CVE-2025-54920을 수정했습니다. #70862
set_finishing 중 잘못된 해시 테이블 상태 처리로 인해 발생한 집계 spill의 잠재적 데이터 손실 이슈를 수정했습니다. #70851
proxy_pass_request_body가 비활성화되었을 때 content-length 헤더가 재설정되지 않던 이슈를 수정했습니다. #70821
로드 작업의 spill 디렉터리가 DeltaWriter::close() 중이 아니라 객체 소멸자에서 정리되어 spill 데이터가 조기에 삭제될 수 있던 이슈를 수정했습니다. #70778
FILES()로부터의 INSERT INTO ... BY NAME이 부분 컬럼 집합에 대해 스키마를 올바르게 푸시다운하지 않던 이슈를 수정했습니다. #70774
connector 스캔 노드가 쿼리 재시도 시 스캔 범위 소스를 재설정하지 않아 재시도 시 잘못된 결과를 유발하던 이슈를 수정했습니다. #70762
A→B→A 형태의 디스크 재마이그레이션 중 GC 경합으로 인해 발생한 Primary Key 모델 tablet의 잠재적 rowset 메타데이터 손실을 수정했습니다. #70727
쿼리 범위의 warehouse 힌트가 ConnectContext의 ComputeResource 객체를 누수시켜 동일 연결의 후속 쿼리에 영향을 줄 수 있던 이슈를 수정했습니다. #70706
MySqlScanNode 및 JDBCScanNode의 중복 conjunct가 VectorizedInPredicate 타입 불일치와 관련된 BE 오류를 유발하던 이슈를 수정했습니다. #70694
Ubuntu 런타임 환경에서 누락된 libssl-dev 의존성을 수정했습니다. #70688
Iceberg manifest 캐시의 완전성이 읽기 시 검증되지 않아 캐시가 부분적으로 채워졌을 때 잘못된 스캔 결과를 초래하던 이슈를 수정했습니다. #70675
use-after-free를 유발할 수 있던 _tablet_multi_get_rpc의 중복 closure 참조를 수정했습니다. #70657
불완전한 캐시 항목과 잘못된 스캔 동작을 초래할 수 있던 Iceberg ManifestReader의 부분 manifest 캐시 쓰기를 수정했습니다. #70652
null 리터럴 요소를 포함하는 배열을 처리할 때 발생하던 array_map()의 크래시를 수정했습니다. #70629
큰 입력을 처리할 때 발생하던 to_base64() 함수의 스택 오버플로를 수정했습니다. #70623
FILES()로부터의 INSERT INTO ... BY NAME이 이름 기반 매핑 대신 위치 기반 컬럼 매핑을 사용하여 데이터가 잘못된 컬럼에 기록되던 이슈를 수정했습니다. #70622
NOT NULL 제약 조건이 FILES()에서 추론된 스키마로 잘못 푸시다운되어 nullable 컬럼에 대한 로드 실패를 유발하던 이슈를 수정했습니다. #70621
정밀(precise) 외부 구체화 뷰 새로 고침이 Iceberg 유형의 connector에 대해 올바르게 폴백하지 않던 이슈를 수정했습니다. #70589
데이터 읽기 오류를 유발할 수 있던, 부분 tablet 스키마 구성 시 발생하던 num_short_key_columns 불일치를 수정했습니다. #70586
MaskMergeIterator에서 자식 iterator가 소진되었을 때 발생하던 BE 크래시를 수정했습니다. #70539
구체화 뷰 새로 고침 작업이 해당 Iceberg 스냅샷이 만료된 파티션을 반복적으로 새로 고치던 이슈를 수정했습니다. #70523
starlet 구성 파라미터를 설정할 수 없던 이슈를 수정했습니다. #70482
lock-free 구체화 뷰 재작성 경로가 live 메타데이터로 잘못 폴백하여 일관되지 않는 재작성 동작을 유발하던 이슈를 수정했습니다. #70475
JoinHashTable::merge_ht에서 표현식 기반 join 키 컬럼에 대해 dummy 행이 건너뛰어지지 않아 잘못된 join 결과를 유발하던 이슈를 수정했습니다. #70465
특정 쿼리에서 잘못된 결과를 생성할 수 있던 InformationFunction의 잘못된 등식 비교를 수정했습니다. #70464
__iceberg_transform_bucket 내부 함수의 컬럼 타입 불일치를 수정했습니다. #70443
Iceberg 스냅샷 타임스탬프가 비단조(non-monotonic)일 때 Iceberg 구체화 뷰 새로 고침이 실패하던 이슈를 수정했습니다. #70382
사용자 인증 자격 증명이 감사 로그 및 SQL 마스킹(redaction) 출력에 노출되던 이슈를 수정했습니다. #70360
물리 분할(physical split)이 활성화된 상태에서 빈 tablet을 스캔할 때 발생하던 CN 크래시를 수정했습니다. #70281
쿼리 최적화 중 중복 CAST가 제거된 후 VARCHAR 컬럼 길이가 보존되지 않던 이슈를 수정했습니다. #70269
brpc 연결 재시도 로직이 래핑된 NoSuchElementException을 올바르게 처리하지 않아 재시도 후 연결 실패를 유발하던 이슈를 수정했습니다. #70203
outer join 컬럼의 null 비율(null fraction)이 통계 추정 중 보존되지 않아 최적이 아닌 쿼리 계획을 초래하던 이슈를 수정했습니다. #70144
poller 스레드에서 실행되는 connector sink 작업의 메모리 트래커 누수를 수정했습니다. #70121

4.0.8

출시일: 2026년 3월 25일

동작 변경

0으로 나누기 및 날짜 파싱 실패에 대한 sql_mode 처리가 강화되었습니다. 이제 조용히 무시되는 대신 오류를 반환합니다. #70004
FORBID_INVALID_DATE 모드 설정 시 INSERT VALUES에서 유효하지 않은 날짜가 거부됩니다. #69803
Expression Partition으로 생성된 컬럼이 DESC 및 SHOW CREATE TABLE 출력에서 숨겨집니다. #69793
감사 로그에서 클라이언트 ID가 제거되었습니다. #69383

개선 사항

Exchange 버퍼 크기를 제한하는 local_exchange_buffer_mem_limit_per_driver 설정이 추가되었습니다. #70393
스토리지 I/O를 줄이기 위해 파일 존재 확인 결과를 캐시합니다. #70364
내림차순 TopN 런타임 필터의 분할 및 역방향 스캔 범위 비활성화를 지원합니다. #70307
Trino 방언에서 INSERT에 대한 EXPLAIN 및 EXPLAIN ANALYZE 지원이 추가되었습니다. #70174
Position delete가 있는 Iceberg 읽기 성능이 최적화되었습니다. #69717
분산 키 기반 Materialized View best-selector 전략이 강화되었습니다. #69679

버그 수정

다음 이슈들이 수정되었습니다:

지원되지 않는 캐스트에 대한 JDBC MySQL 푸시다운 실패. #70415
Materialized View 새로고침 시 타입 불일치; mv_refresh_force_partition_type 설정 추가. #70381
백업 복원 시 dataVersion이 올바르게 설정되지 않는 이슈. #70373
Materialized View 새로고침 작업에서 중복 파티션 이름 이슈. #70354
SLF4J 파라미터화된 로깅 이슈. #70330
Hive 테이블 생성 시 코멘트가 설정되지 않는 이슈. #70318
느린 HDFS 작업에서 FileSystemExpirationChecker가 차단되는 이슈. #70311
파티션 간 Distribute 컬럼 검증이 적용되지 않는 이슈. #70310
상수 폴딩에서 double 오버플로우 시 INF가 생성되는 이슈. #70309
Iceberg 테이블 생성의 "common" vs "comment" 타이핑 오류. #70267
Root 사용자 권한 검사가 불완전한 이슈. #70254
query_pool 메모리 트래커가 음수가 되는 이슈. #70228
AuditEventProcessor 스레드 크래시 이슈. #70206
SplitTopNRule 파티션 프루닝 이슈. #70154
스키마 변경 시 범위 초과 접근 이슈. #70132
삭제된 파티션을 무시하는 Materialized View 재작성 이슈. #70130
타입 불일치로 인한 예상치 못한 파티션 프루닝. #70097
str_to_date 마이크로초 정밀도 손실 이슈. #70068
Join Spill 크래시 이슈. #70030
커넥터 업그레이드 후 GCS 인증 실패 이슈. #70012
DeltaWriter::close()에서 DCHECK 실패. #69960
AsyncDeltaWriter use-after-free 이슈. #69940 #69770
Write 트랜잭션 로깅의 레이스 컨디션. #69899
CVE 보안 취약점 수정. #69863
Follower FE Journal 리플레이 이슈. #69834
백슬래시 이스케이프가 포함된 LIKE 패턴 매칭 이슈. #69775
파티션 컬럼 이름 변경 후 표현식 분석 실패. #69771
Local Partition TopN 크래시. #69752
PartitionColumnMinMaxRewriteRule 동작 이슈. #69751
CSV 압축 파일명 중복 이슈. #69749
lake_capture_tablet_and_rowsets 게이팅 이슈. #69748
Shadow 파티션이 있는 파티션 min 프루닝 이슈. #69641
Java UDTF/UDAF 제네릭 타입 크래시. #69197
쿼리별 메타데이터가 해제되지 않아 FE OOM 발생 이슈. #68444
쿼리 범위 Warehouse 힌트 리소스 누수 이슈. #70706
Lock-free Materialized View 재작성 폴백 이슈. #70475
중복 Closure 참조 이슈. #70657
ReplaceColumnRefRewriter에서 무한 재귀 이슈. #66974
FILES()에 대한 NOT NULL 제약조건 푸시다운 이슈. #70621
num_short_key_columns 불일치 이슈. #70586
COLUMN_UPSERT_MODE 체크섬 오류. #65320
__iceberg_transform_bucket 컬럼 타입 불일치. #70443
Starlet 설정 항목이 적용되지 않는 이슈. #70482
부분 업데이트에서 DCG 데이터 읽기 오류. #61529

4.0.6

출시일: 2026년 2월 14일

개선 사항

괄호를 포함한 파티션 변환 방식(예: PARTITION BY (bucket(k1, 3)))으로 Iceberg 테이블 생성을 지원합니다. #68945
Iceberg 테이블에서 파티션 컬럼이 반드시 컬럼 목록의 마지막에 위치해야 하는 제약을 제거하여 임의 위치에서 정의 가능하도록 변경되었습니다. #68340
Iceberg 테이블 싱크에 호스트 수준 정렬 기능이 도입되었습니다. 시스템 변수 connector_sink_sort_scope(기본값: FILE)를 통해 제어하며, 읽기 성능 향상을 위한 데이터 레이아웃 최적화를 지원합니다. #68121
인수 개수가 잘못된 경우 Iceberg 파티션 변환 함수(예: bucket, truncate)의 오류 메시지가 개선되었습니다. #68349
Iceberg 테이블에서 다양한 파일 형식(ORC/Parquet) 및 압축 코덱 지원을 개선하기 위해 테이블 속성 처리 로직이 리팩토링되었습니다. #68588
세분화된 제어를 위한 테이블 수준 쿼리 타임아웃 설정 table_query_timeout이 추가되었습니다 (우선순위: 세션 > 테이블 > 클러스터). #67547
자동화된 스냅샷 상태 및 스케줄을 확인하기 위한 ADMIN SHOW AUTOMATED CLUSTER SNAPSHOT 구문을 지원합니다. #68455
SHOW CREATE VIEW에서 주석을 포함한 사용자 정의 원본 SQL을 표시하도록 지원합니다. #68040
Merge Commit이 활성화된 Stream Load 작업이 information_schema.loads에 노출되어 가시성이 향상되었습니다. #67879
FE 메모리 추정을 위한 유틸리티 API /api/memory_usage가 도입되었습니다. #68287
파티션 재활용 중 CatalogRecycleBin의 불필요한 로깅이 줄어들었습니다. #68533
베이스 테이블에서 Swap/Drop/Replace Partition 작업이 발생하면 연관된 비동기 Materialized View가 갱신(refresh) 트리거됩니다. #68430
VARBINARY 타입에 대한 count distinct 유사 집계 함수를 지원합니다. #68442
의미론적으로 안전한 표현식(예: cast(k as bigint) + 10)에 대해 히스토그램 MCV를 전파하도록 표현식 통계가 강화되어 스큐 탐지 정확도가 향상되었습니다. #68292

버그 수정

다음 이슈들이 수정되었습니다:

Skew Join V2 런타임 필터에서 발생하는 잠재적 크래시. #67611
Low Cardinality 재작성으로 인한 조인 조건 타입 불일치(예: INT = VARCHAR). #68568
쿼리 큐 할당 시간 및 대기 타임아웃 로직 관련 이슈. #65802
스키마 변경 후 Flat JSON 확장 컬럼의 unique_id 충돌. #68279
OlapTableSink.complete()에서 파티션 동시 접근 이슈. #68853
수동으로 다운로드한 클러스터 스냅샷 복원 시 잘못된 메타데이터 추적. #68368
리포지토리 경로가 /로 끝날 때 백업 경로에 이중 슬래시가 포함되는 이슈. #68764
SHOW CREATE CATALOG 출력에서 OBS AK/SK 자격증명이 마스킹되지 않는 이슈. #65462

4.0.5

출시일: 2026년 2월 3일

개선 사항

Paimon 버전이 1.3.1로 업그레이드되었습니다. #67098
DP 통계 추정에서 누락된 최적화가 복원되어 불필요한 계산이 감소되었습니다. #67852
DP Join 재순서화의 프루닝이 개선되어 비용이 높은 후보 플랜을 더 일찍 건너뜁니다. #67828
JoinReorderDP의 파티션 열거 최적화로 객체 할당이 줄어들고 원자 수 상한(≤62)이 추가되었습니다. #67643
DP 조인 재순서화 프루닝 최적화 및 스트림 연산 오버헤드 감소를 위한 BitSet 검사가 추가되었습니다. #67644
DP 통계 추정 중 조건자 컬럼 통계 수집을 건너뛰어 CPU 오버헤드가 감소되었습니다. #67663
상관 Join 행 수 추정 최적화로 Statistics 객체 반복 생성이 방지됩니다. #67773
Statistics.getUsedColumns에서 메모리 할당이 감소되었습니다. #67786
행 수만 업데이트될 때 불필요한 Statistics 맵 복사가 방지됩니다. #67777
쿼리에 집계가 없는 경우 집계 푸시다운 로직을 건너뛰어 오버헤드가 감소되었습니다. #67603
윈도우에서의 COUNT DISTINCT 기능 개선, 퓨즈드 멀티 디스팅트 집계 지원 추가, CTE 생성 최적화가 이루어졌습니다. #67453
Trino 방언에서 map_agg 함수를 지원합니다. #66673
Shared-data 클러스터에서 물리적 계획 수립 시 LakeTablet 위치 정보를 일괄 조회하여 RPC 호출이 감소되었습니다. #67325
Shared-nothing 클러스터에서 Publish Version 트랜잭션에 스레드 풀이 추가되어 동시성이 향상되었습니다. #67797
LocalMetastore 잠금 세분화 최적화로 데이터베이스 수준 잠금이 테이블 수준 잠금으로 변경되었습니다. #67658
MergeCommitTask 생명주기 관리가 리팩토링되고 작업 취소 지원이 추가되었습니다. #67425
자동화된 클러스터 스냅샷에 인터벌 설정을 지원합니다. #67525
MemTrackerManager에서 미사용 mem_pool 항목이 자동으로 정리됩니다. #67347
Warehouse 유휴 상태 확인 시 information_schema 쿼리가 무시됩니다. #67958
Iceberg 테이블 싱크에서 데이터 분산에 따른 글로벌 셔플 동적 활성화를 지원합니다. #67442
커넥터 싱크 모듈에 대한 Profile 메트릭이 추가되었습니다. #67761
Profile에서 로드 스필 메트릭 수집 및 표시가 개선되어 로컬/원격 I/O가 구분됩니다. #67527
반복적인 경고 로그를 방지하기 위해 Async-Profiler 로그 레벨이 Error로 변경되었습니다. #67297
BE 종료 시 Starlet에 알림을 전송하여 StarMgr에 SHUTDOWN 상태를 보고합니다. #67461

버그 수정

다음 이슈들이 수정되었습니다:

하이픈(-)을 포함하는 합법적인 단순 경로를 지원하지 못하는 이슈. #67988
JSON 타입을 포함한 그루핑 키에서 집계 푸시다운 발생 시 런타임 오류. #68142
JSON 경로 재작성 규칙이 파티션 조건자에서 참조된 파티션 컬럼을 잘못 프루닝하는 이슈. #67986
통계를 이용한 단순 집계 재작성 시 타입 불일치 이슈. #67829
파티션 Join에서 발생하는 잠재적 힙 버퍼 오버플로우. #67435
무거운 표현식 푸시다운 시 중복 slot_ids 생성. #67477
사전 조건 검사 부재로 인한 ExecutionDAG 프래그먼트 연결에서 Division-by-zero 오류. #67918
단일 BE에 대한 프래그먼트 병렬 준비로 인한 잠재적 이슈. #67798
RawValuesSourceOperator에 set_finished 메서드 누락으로 연산자가 잘못 종료되는 이슈. #67609
컬럼 애그리게이터에서 지원되지 않는 DECIMAL256 타입(정밀도 > 38)으로 인한 BE 크래시. #68134
Shared-data 클러스터에서 DELETE 작업에 대한 Fast Schema Evolution v2가 schema_key를 요청에 포함하지 않는 이슈. #67456
Shared-data 클러스터에서 동기식 Materialized View 및 기존 스키마 변경에 대한 Fast Schema Evolution v2 미지원 이슈. #67443
FE 다운그레이드 중 파일 번들링이 비활성화된 경우 Vacuum이 파일을 잘못 삭제할 수 있는 이슈. #67849
MySQLReadListener에서의 잘못된 graceful exit 처리. #67917

4.0.4

출시일: 2026년 1월 16일

개선 사항

운영자 및 드라이버에 대한 병렬 준비(Parallel Prepare)와 단일 노드 배치 프래그먼트 배포가 지원되어 쿼리 스케줄링 성능이 향상되었습니다. #63956
대용량 파티션 테이블에 대해 지연 평가(lazy evaluation)를 사용하여 deltaRows 계산이 최적화되었습니다. #66381
순차 반복 및 경로 파생 개선으로 Flat JSON 처리가 최적화되었습니다. #66941 #66850
그룹 실행에서 메모리 사용량을 줄이기 위해 Spill 연산자 메모리를 더 일찍 해제하는 기능을 지원합니다. #66669
문자열 비교 오버헤드를 줄이기 위한 로직이 최적화되었습니다. #66570
GroupByCountDistinctDataSkewEliminateRule 및 SkewJoinOptimizeRule에서 히스토그램 및 NULL 기반 전략을 지원하여 스큐 탐지 기능이 강화되었습니다. #66640 #67100
Move 시맨틱스를 사용하여 Chunk에서의 컬럼 소유권 관리가 강화되어 Copy-On-Write 오버헤드가 감소되었습니다. #66805
Shared-data 클러스터에서 FE TableSchemaService 추가 및 MetaScanNode 업데이트로 Fast Schema Evolution v2 스키마 조회를 지원합니다. #66142 #66970
더 나은 리소스 격리를 위해 Multi-Warehouse Backend 리소스 통계 및 병렬성(DOP) 계산을 지원합니다. #66632
StarRocks 세션 변수 connector_huge_file_size를 통한 Iceberg 분할 크기 설정을 지원합니다. #67044
QueryDumpDeserializer에서 레이블 형식 통계를 지원합니다. #66656
Shared-data 클러스터에서 Full Vacuum 비활성화를 위한 FE 설정 lake_enable_fullvacuum(기본값: false)이 추가되었습니다. #63859
lz4 의존성이 v1.10.0으로 업그레이드되었습니다. #67045
행 수가 0일 때 샘플 타입 카디널리티 추정을 위한 폴백 로직이 추가되었습니다. #65599
array_sort에서 람다 비교자에 대한 Strict Weak Ordering 속성이 검증되었습니다. #66951
외부 테이블 메타데이터(Delta/Hive/Hudi/Iceberg) 가져오기 실패 시 근본 원인을 표시하는 오류 메시지가 개선되었습니다. #66916
쿼리 타임아웃 시 파이프라인 상태를 덤프하고 FE에서 TIMEOUT 상태로 취소하는 기능을 지원합니다. #66540
SQL 블랙리스트 오류 메시지에서 매칭된 규칙 인덱스가 표시됩니다. #66618
EXPLAIN 출력의 컬럼 통계에 레이블이 추가되었습니다. #65899
정상적인 쿼리 완료(예: LIMIT 도달)에서 "cancel fragment" 로그가 필터링됩니다. #66506
Warehouse 일시 중단 시 Backend 하트비트 실패 로그가 감소되었습니다. #66733
ALTER STORAGE VOLUME 구문에서 IF EXISTS를 지원합니다. #66691

버그 수정

다음 이슈들이 수정되었습니다:

Low Cardinality 최적화에서 withLocalShuffle 누락으로 인한 DISTINCT 및 GROUP BY 결과 오류. #66768
Lambda 표현식을 포함한 JSON v2 함수의 재작성 오류. #66550
상관 서브쿼리에서 Null-aware Left Anti Join에 Partition Join이 잘못 적용되는 이슈. #67038
Meta Scan 재작성 규칙에서의 잘못된 행 수 계산. #66852
통계로 Meta Scan 재작성 시 Union Node에서 Nullable 속성 불일치. #67051
PARTITION BY와 ORDER BY가 없을 때 Ranking 윈도우 함수 최적화 로직으로 인한 BE 크래시. #67094
윈도우 함수가 있는 Group Execution Join에서의 잘못된 결과. #66441
특정 필터 조건에서 PartitionColumnMinMaxRewriteRule의 잘못된 결과. #66356
집계 이후 Union 연산에서 잘못된 Nullable 속성 추론. #65429
percentile_approx_weighted에서 압축 파라미터 처리 시 크래시. #64838
대용량 문자열 인코딩 시 스필(spill) 중 크래시. #61495
로컬 TopN 푸시다운 시 set_collector가 여러 번 호출되어 발생하는 크래시. #66199
LowCardinality 재작성 로직에서의 의존성 추론 오류. #66795
로우셋 커밋 실패 시 Rowset ID 누수. #66301
Metacache 잠금 경합. #66637
컬럼 모드 부분 업데이트(Partial Update)와 조건부 업데이트 함께 사용 시 인제스션 실패. #66139
ALTER 작업 중 태블릿 삭제로 인한 동시 가져오기 실패. #65396
RocksDB 반복 타임아웃으로 인한 태블릿 메타데이터 로드 오류. #65146
Shared-data 클러스터에서 테이블 생성 및 Schema Change 시 압축 설정이 적용되지 않는 이슈. #65673
업그레이드 중 Delete Vector CRC32 호환성 이슈. #65442
클론 작업 실패 후 파일 정리에서의 상태 확인 로직 오류. #65709
INSERT OVERWRITE 이후 비정상적인 통계 수집 로직. #65327 #65298 #65225
FE 재시작 후 외래 키 제약 조건이 손실되는 이슈. #66474
Warehouse 삭제 후 메타데이터 조회 오류. #66436
높은 선택도 필터 조건에서 감사 로그 스캔 통계 부정확. #66280
쿼리 오류율 메트릭 계산 로직 오류. #65891
작업 종료 시 MySQL 연결 누수 가능성. #66829
SIGSEGV 크래시 시 BE 상태가 즉시 업데이트되지 않는 이슈. #66212
LDAP 사용자 로그인 중 NPE 발생. #65843
HTTP SQL 요청에서 사용자 전환 시 부정확한 오류 로그. #65371
TCP 연결 재사용 중 HTTP 컨텍스트 누수. #65203
Follower에서 전달된 쿼리에 대한 Profile 로그에서 QueryDetail 누락. #64395
감사 로그에서 Prepare/Execute 세부 정보 누락. #65448
HyperLogLog 메모리 할당 실패로 인한 크래시. #66747
trim 함수의 메모리 예약 이슈. #66477 #66428
CVE-2025-66566 및 CVE-2025-12183 보안 취약점. #66453 #66362 #67053
Exec Group 드라이버 제출에서의 레이스 컨디션. #66099
Pipeline 카운트다운에서의 use-after-free 위험. #65940
큐가 닫힐 때 MemoryScratchSinkOperator가 멈추는 이슈. #66041
파일시스템 캐시 키 충돌 이슈. #65823
SHOW PROC '/compactions'에서 잘못된 서브태스크 수. #67209
Query Profile API에서 통합된 JSON 형식이 반환되지 않는 이슈. #67077
Materialized View 검사에 영향을 미치는 getTable의 부적절한 예외 처리. #67224
네이티브 테이블과 클라우드 네이티브 테이블 간 DESC 구문의 Extra 컬럼 출력 불일치. #67238
단일 노드 배포에서의 레이스 컨디션. #67215
서드파티 라이브러리에서의 로그 누수. #67129
인증 실패를 유발하는 REST Catalog 인증 로직 오류. #66861

4.0.3

출시일: 2025년 12월 25일

개선 사항

STRUCT 데이터 타입에 대한 ORDER BY 절을 지원합니다. #66035
속성을 포함한 Iceberg 뷰 생성과 SHOW CREATE VIEW 출력에 속성 표시를 지원합니다. #65938
ALTER TABLE ADD/DROP PARTITION COLUMN을 사용하여 Iceberg 테이블 파티션 스펙 변경을 지원합니다. #65922
프레임 윈도우(예: ORDER BY/PARTITION BY)에서 COUNT/SUM/AVG(DISTINCT) 집계 최적화 옵션을 지원합니다. #65815
단일 문자 구분자에 대해 memchr를 사용하여 CSV 파싱 성능이 최적화되었습니다. #63715
네트워크 오버헤드를 줄이기 위해 Partial TopN을 Pre-Aggregation 단계로 푸시다운하는 옵티마이저 규칙이 추가되었습니다. #61497
Data Cache 모니터링이 강화되었습니다:

메모리/디스크 쿼터 및 사용량에 대한 새로운 메트릭이 추가되었습니다. #66168
api/datacache/stat HTTP 엔드포인트에 Page Cache 통계가 추가되었습니다. #66240
네이티브 테이블에 대한 히트율 통계가 추가되었습니다. #66198

OOM 시나리오에서 빠른 메모리 해제를 지원하도록 Sort 및 Aggregation 연산자가 최적화되었습니다. #66157
Shared-data 클러스터에서 CN이 필요에 따라 특정 스키마를 가져올 수 있도록 FE에 TableSchemaService가 추가되었습니다. #66142
모든 종속 인제스션 작업이 완료될 때까지 히스토리 스키마를 유지하도록 Fast Schema Evolution이 최적화되었습니다. #65799
모든 파티션이 필터링되는 것을 방지하기 위해 NULL 파티션 값을 적절히 처리하도록 filterPartitionsByTTL이 강화되었습니다. #65923
리셋 시 연관된 MemPool을 클리어하도록 FusedMultiDistinctState가 최적화되었습니다. #66073
Iceberg REST Catalog에서 ICEBERG_CATALOG_SECURITY 속성 검사가 대소문자를 구분하지 않도록 변경되었습니다. #66028
Shared-data 클러스터에서 StarOS Service ID를 조회하기 위한 HTTP 엔드포인트 GET /service_id가 추가되었습니다. #65816
Kafka 컨슈머 설정에서 deprecated된 metadata.broker.list가 bootstrap.servers로 교체되었습니다. #65437
Full Vacuum Daemon 비활성화를 위한 FE 설정 lake_enable_fullvacuum(기본값: false)이 추가되었습니다. #66685
lz4 라이브러리가 v1.10.0으로 업데이트되었습니다. #67080

버그 수정

다음 이슈들이 수정되었습니다:

배치 Publish 중 latest_cached_tablet_metadata로 인해 버전이 잘못 건너뛰어지는 이슈. #66558
Shared-nothing 클러스터에서 CatalogRecycleBin의 ClusterSnapshot 관련 검사로 인한 잠재적 이슈. #66501
Spill 작업 중 Iceberg 테이블에 복잡한 데이터 타입(ARRAY/MAP/STRUCT) 쓰기 시 BE 크래시. #66209
Writer 초기화 또는 초기 쓰기 실패 시 Connector Chunk Sink가 멈추는 이슈. #65951
PartitionChunkWriter 초기화 실패 시 close 중 null 포인터 역참조를 발생시키는 Connector Chunk Sink 버그. #66097
존재하지 않는 시스템 변수 설정이 오류 대신 조용히 성공하는 이슈. #66022
Data Cache 손상 시 Bundle 메타데이터 파싱 실패. #66021
결과가 비어있을 때 MetaScan이 count 컬럼에 0 대신 NULL을 반환하는 이슈. #66010
이전 버전에서 생성된 리소스 그룹에 대해 SHOW VERBOSE RESOURCE GROUP ALL이 default_mem_pool 대신 NULL을 표시하는 이슈. #65982
flat_json 테이블 설정 비활성화 후 쿼리 실행 시 RuntimeException 발생. #65921
Schema Change 후 min/max 통계를 MetaScan으로 재작성할 때 Shared-data 클러스터에서 발생하는 타입 불일치 이슈. #65911
PARTITION BY와 ORDER BY가 없을 때 ranking window 최적화로 인한 BE 크래시. #67093
런타임 필터 병합 시 잘못된 can_use_bf 검사로 인한 잘못된 결과 또는 크래시. #67062
중첩된 OR 조건자에 런타임 bitset 필터를 푸시다운할 때 잘못된 결과 발생. #67061
DeltaWriter 완료 후 write 또는 flush 작업으로 인한 잠재적 데이터 레이스 및 데이터 손실 이슈. #66966
단순 집계를 MetaScan으로 재작성할 때 nullable 속성 불일치로 인한 실행 오류. #67068
MetaScan 재작성 규칙의 잘못된 행 수 계산. #66967
일관되지 않은 캐시된 태블릿 메타데이터로 인해 배치 Publish 중 버전이 잘못 건너뛰어질 수 있는 이슈. #66575
HyperLogLog 작업에서 메모리 할당 실패에 대한 부적절한 오류 처리. #66827

4.0.2

출시일: 2025년 12월 4일

새로운 기능

새로운 리소스 그룹 속성 mem_pool이 도입되었습니다. 여러 리소스 그룹이 동일한 메모리 풀을 공유하고 해당 풀에 대한 통합 메모리 제한을 적용할 수 있습니다. 이 기능은 하위 호환성을 지원합니다. mem_pool을 지정하지 않으면 default_mem_pool이 사용됩니다. #64112

개선 사항

File Bundling 활성화 시 Vacuum 중 원격 스토리지 액세스가 감소되었습니다. #65793
File Bundling 기능이 최신 태블릿 메타데이터를 캐시합니다. #65640
long-string 시나리오에 대한 안전성과 안정성이 개선되었습니다. #65433 #65148
성능 저하를 방지하기 위해 SplitTopNAggregateRule 로직이 최적화되었습니다. #65478
Iceberg/DeltaLake 테이블 통계 수집 전략이 다른 외부 데이터 소스에 적용되어, 단일 테이블인 경우 통계 수집을 건너뜁니다. #65430
Data Cache HTTP API api/datacache/app_stat에 Page Cache 메트릭이 추가되었습니다. #65341
단일 대용량 ORC 파일의 병렬 스캔을 가능하게 하는 ORC 파일 분할을 지원합니다. #65188
옵티마이저에서 IF 조건자에 대한 선택도 추정이 추가되었습니다. #64962
FE에서 DATE 및 DATETIME 타입에 대한 hour, minute, second의 상수 평가를 지원합니다. #64953
단순 집계를 MetaScan으로 재작성하는 기능이 기본적으로 활성화되었습니다. #64698
shared-data 클러스터에서 다중 복제본 할당 처리가 개선되어 신뢰성이 향상되었습니다. #64245
감사 로그와 메트릭에 캐시 히트율이 노출됩니다. #63964
조건자와 조인에 대해 더 정확한 NDV를 제공하기 위해 HyperLogLog 또는 샘플링을 사용하여 히스토그램의 버킷별 고유 값 수를 추정합니다. #58516
SQL 표준 시맨틱스를 따르는 FULL OUTER JOIN USING을 지원합니다. #65122
진단을 위해 옵티마이저 타임아웃 시 메모리 정보를 출력합니다. #65206

버그 수정

다음 이슈들이 수정되었습니다:

DECIMAL56 mod 관련 이슈. #65795
Iceberg 스캔 범위 처리 관련 이슈. #65658
임시 파티션과 랜덤 버킷에 대한 MetaScan 재작성 이슈. #65617
투명 Materialized View 재작성 후 JsonPathRewriteRule이 잘못된 테이블을 사용하는 이슈. #65597
partition_retention_condition이 생성된 컬럼을 참조할 때 Materialized View 새로고침 실패. #65575
Iceberg min/max 값 타이핑 이슈. #65551
enable_evaluate_schema_scan_rule이 true로 설정된 경우 서로 다른 데이터베이스 간 information_schema.tables 및 views 쿼리 이슈. #65533
JSON 배열 비교 시 정수 오버플로우. #64981
MySQL Reader가 SSL을 지원하지 않는 이슈. #65291
SVE 빌드 비호환성으로 인한 ARM 빌드 이슈. #65268
버킷된 Iceberg 테이블에 대해 bucket-aware 실행 기반 쿼리가 멈추는 현상. #65261
OLAP 테이블 스캔에서 메모리 제한 검사 부재로 인한 강건한 오류 전파 및 메모리 안전성 이슈. #65131

동작 변경

Materialized View가 비활성화되면 시스템이 이에 종속된 Materialized View들을 재귀적으로 비활성화합니다. #65317
SHOW CREATE 출력 생성 시 원본 Materialized View 쿼리 SQL(주석/포맷팅 포함)을 사용합니다. #64318

4.0.1

출시일: 2024년 11월 17일

개선 사항

알려진 변수만 처리하도록 TaskRun 세션 변수 처리가 최적화되었습니다. #64150
기본적으로 메타데이터에서 Iceberg 및 Delta Lake 테이블의 통계 수집을 지원합니다. #64140
bucket 및 truncate 파티션 변환이 있는 Iceberg 테이블의 통계 수집을 지원합니다. #64122
디버깅을 위한 FE /proc 프로파일 검사를 지원합니다. #63954
Iceberg REST 카탈로그에 대한 OAuth2 및 JWT 인증 지원이 강화되었습니다. #63882
번들 태블릿 메타데이터 검증 및 복구 처리가 개선되었습니다. #63949
스캔 범위 메모리 추정 로직이 개선되었습니다. #64158

버그 수정

다음 이슈들이 수정되었습니다:

번들 태블릿 퍼블리싱 시 트랜잭션 로그가 삭제되는 이슈. #64030
조인 후 정렬 속성이 재설정되지 않아 조인 알고리즘이 정렬 속성을 보장하지 못하는 이슈. #64086
투명 Materialized View 재작성 관련 이슈. #63962

동작 변경

Iceberg 카탈로그에 enable_iceberg_table_cache 속성이 추가되어 선택적으로 Iceberg 테이블 캐시를 비활성화하고 항상 최신 데이터를 읽을 수 있습니다. #64082
INSERT ... SELECT가 계획 전 외부 테이블을 새로고침하여 최신 메타데이터를 읽도록 보장합니다. #64026
lock table 슬롯이 256으로 증가하고 slow-lock 로그에 rid가 추가되었습니다. #63945
이벤트 기반 스케줄링과의 비호환성으로 인해 shared_scan이 일시적으로 비활성화되었습니다. #63543
기본 Hive 카탈로그 캐시 TTL이 24시간으로 변경되고 사용되지 않는 파라미터가 제거되었습니다. #63459
세션 변수와 삽입되는 컬럼 수에 따라 Partial Update 모드가 자동으로 결정됩니다. #62091

4.0.0

출시일: 2025년 10월 17일

Data Lake Analytics

BE 메타데이터에 대한 통합 Page Cache 및 Data Cache를 구현하고 스케일링을 위한 적응형 전략 채택. #61640
Iceberg 통계에 대한 메타데이터 파일 파싱을 최적화하여 반복 파싱 방지. #59955
Iceberg 메타데이터에 대한 COUNT/MIN/MAX 쿼리를 최적화하여 데이터 파일 스캔을 효율적으로 건너뛰어 대규모 파티션 테이블의 집계 쿼리 성능을 크게 향상하고 리소스 소비 감소. #60385
rewrite_data_files 프로시저를 통한 Iceberg 테이블 compaction 지원.
Hidden partition이 있는 Iceberg 테이블 생성, 쓰기 및 읽기 지원. #58914
Iceberg 테이블 생성 시 sort key 설정 지원.
Iceberg 테이블의 sink 성능 최적화.
Iceberg Sink가 대용량 연산자 spilling, global shuffle, local sorting을 지원하여 메모리 사용을 최적화하고 작은 파일 문제 해결. #61963
Iceberg Sink가 Spill Partition Writer 기반 local sorting을 최적화하여 쓰기 효율성 향상. #62096
Iceberg Sink가 파티션에 대한 global shuffle을 지원하여 작은 파일 추가 감소. #62123
Iceberg 테이블에 대한 bucket-aware 실행을 강화하여 bucketed 테이블의 동시성 및 분산 기능 개선. #61756
Paimon 카탈로그에서 TIME 데이터 타입 지원. #58292
Iceberg 버전을 1.10.0으로 업그레이드. #63667

Security and Authentication

JWT 인증과 Iceberg REST Catalog가 사용되는 시나리오에서 StarRocks가 후속 데이터 액세스 인증을 위해 REST Session Catalog를 통해 사용자 로그인 정보를 Iceberg로 전달하는 것을 지원. #59611 #58850
Iceberg 카탈로그에 대한 vended credentials 지원.
Group Provider를 통해 얻은 외부 그룹에 StarRocks 내부 역할 부여 지원. #63385 #63258
외부 테이블 새로 고침 권한을 제어하기 위해 REFRESH 권한 추가. #63385

Storage Optimization and Cluster Management

Shared-data 클러스터의 cloud-native 테이블에 대한 File Bundling 최적화를 도입하여 로딩, Compaction 또는 Publish 작업으로 생성된 데이터 파일을 자동으로 묶어 외부 스토리지 시스템에 대한 고빈도 액세스로 인한 API 비용 감소. File Bundling은 v4.0 이상에서 생성된 테이블에 대해 기본적으로 활성화됨. #58316
사용자가 INSERT, UPDATE 및 DELETE 작업의 원자적 제출을 제어할 수 있도록 Multi-Table Write-Write Transaction 지원. 트랜잭션은 Stream Load 및 INSERT INTO 인터페이스를 지원하며 ETL 및 실시간 쓰기 시나리오에서 테이블 간 일관성을 효과적으로 보장. #61362
Routine Load에 대한 Kafka 4.0 지원.
Shared-nothing 클러스터의 Primary Key 테이블에 대한 전문 역색인 지원.
Aggregate 테이블의 aggregate key 수정 지원. #62253
카탈로그, 데이터베이스, 테이블, 뷰 및 Materialized view 이름에 대한 대소문자 구분 없는 처리 활성화 지원. #61136
Shared-data 클러스터에서 Compute Node 블랙리스트 지원. #60830
글로벌 연결 ID 지원. #57256
복구 가능한 삭제된 메타데이터를 표시하기 위해 Information Schema에 recyclebin_catalogs 메타데이터 뷰 추가. #51007

Query and Performance Improvement

DECIMAL256 데이터 타입을 지원하여 정밀도 상한을 38비트에서 76비트로 확장. 256비트 스토리지는 고정밀 금융 및 과학 컴퓨팅 시나리오에 더 나은 적응성을 제공하며 매우 큰 집계 및 고차 연산에서 DECIMAL128의 정밀도 오버플로 문제를 효과적으로 완화. #59645
기본 연산자의 성능 개선. #61691 #61632 #62585 #61405 #61429
JOIN 및 AGG 연산자의 성능 최적화. #61691
[Preview] 사용자가 쿼리 플랜을 쿼리에 바인딩할 수 있도록 SQL Plan Manager 도입으로 시스템 상태 변경(주로 데이터 업데이트 및 통계 업데이트)으로 인한 쿼리 플랜 변경을 방지하여 쿼리 성능 안정화. #56310
Partition-wise Spillable Aggregate/Distinct 연산자를 도입하여 정렬된 집계 기반의 원래 Spill 구현을 대체하여 복잡하고 높은 카디널리티의 GROUP BY 시나리오에서 집계 성능을 크게 향상하고 읽기/쓰기 오버헤드 감소. #60216
Flat JSON V2:

테이블 수준에서 Flat JSON 구성 지원. #57379
V1 메커니즘을 유지하면서 페이지 및 세그먼트 수준 인덱스(ZoneMaps, Bloom filters), late materialization을 사용한 조건자 pushdown, 딕셔너리 인코딩, low-cardinality 글로벌 딕셔너리 통합을 추가하여 JSON 컬럼 스토리지를 강화하여 실행 효율성을 크게 향상. #60953

STRING 데이터 타입에 대한 적응형 ZoneMap 인덱스 생성 전략 지원. #61960
쿼리 관찰성 강화:

EXPLAIN ANALYZE 출력을 최적화하여 가독성을 높이기 위해 그룹 및 연산자별로 실행 메트릭 표시. #63326
QueryDetailActionV2 및 QueryProfileActionV2가 JSON 형식을 지원하여 FE 간 쿼리 기능 향상. #63235
모든 FE에서 Query Profile 정보 검색 지원. #61345
SHOW PROCESSLIST 문이 Catalog, Query ID 및 기타 정보 표시. #62552
쿼리 큐 및 프로세스 모니터링 강화로 Running/Pending 상태 표시 지원. #62261

Materialized view 재작성이 원본 테이블의 분산 및 sort key를 고려하여 최적 Materialized view 선택 개선. #62830

Functions and SQL Syntax

다음 함수들이 추가되었습니다:

bitmap_hash64 #56913
bool_or #57414
strpos #57278
to_datetime 및 to_datetime_ntz #60637
regexp_count #57182
tokenize #58965
format_bytes #61535
encode_sort_key #61781
column_size 및 column_compressed_size #62481

다음 구문 확장을 제공합니다:

CREATE ANALYZE FULL TABLE에서 IF NOT EXISTS 키워드 지원. #59789
SELECT에서 EXCLUDE 절 지원. #57411
집계 함수에서 FILTER 절을 지원하여 조건부 집계의 가독성 및 실행 효율성 향상. #58937

Behavior Changes

Materialized view 매개변수 auto_partition_refresh_number의 로직을 조정하여 자동 갱신 또는 수동 갱신에 관계없이 갱신할 파티션 수를 제한. #62301
Flat JSON이 기본적으로 활성화됨. #62097
시스템 변수 enable_materialized_view_agg_pushdown_rewrite의 기본값이 true로 설정되어 Materialized view 쿼리 재작성에 대한 aggregation pushdown이 기본적으로 활성화됨. #60976
해당 데이터에 더 잘 맞도록 information_schema.materialized_views의 일부 컬럼 타입 변경. #60054
split_part 함수가 구분 기호가 일치하지 않을 때 NULL 반환. #56967
CTAS/CREATE MATERIALIZED VIEW에서 고정 길이 CHAR를 STRING으로 대체하여 잘못된 컬럼 길이 추론을 방지하여 Materialized view 갱신 실패를 방지. #63114 #62476
Data Cache 관련 설정이 단순화됨. #61640

datacache_mem_size 및 datacache_disk_size가 이제 유효함.
storage_page_cache_limit, block_cache_mem_size, block_cache_disk_size는 더 이상 사용되지 않음.

Hive 및 Iceberg 메타데이터 캐시에 사용되는 메모리 리소스를 제한하기 위해 새로운 카탈로그 속성(Hive용 remote_file_cache_memory_ratio, Iceberg용 iceberg_data_file_cache_memory_usage_ratio 및 iceberg_delete_file_cache_memory_usage_ratio) 추가하고 기본값을 0.1(10%)로 설정. 메타데이터 캐시 TTL을 24시간으로 조정. #63459 #63373 #61966 #62288
SHOW DATA DISTRIBUTION이 이제 동일한 bucket 순서 번호를 가진 모든 Materialized index의 통계를 병합하지 않음. Materialized index 수준의 데이터 분산만 표시. #59656
자동 bucket 테이블의 기본 bucket 크기가 4GB에서 1GB로 변경되어 성능 및 리소스 활용도 향상. #63168
시스템이 해당 세션 변수와 INSERT 문의 컬럼 수를 기반으로 Partial Update 모드를 결정. #62091
Information Schema의 fe_tablet_schedules 뷰 최적화. #62073 #59813

TABLET_STATUS 컬럼을 SCHEDULE_REASON으로, CLONE_SRC 컬럼을 SRC_BE_ID로, CLONE_DEST 컬럼을 DEST_BE_ID로 이름 변경.
CREATE_TIME, SCHEDULE_TIME 및 FINISH_TIME 컬럼의 데이터 타입이 DOUBLE에서 DATETIME으로 변경됨.

일부 FE 메트릭에 is_leader 레이블이 추가됨. #63004
Microsoft Azure Blob Storage 및 Data Lake Storage Gen 2를 객체 스토리지로 사용하는 Shared-data 클러스터는 v4.0으로 업그레이드한 후 Data Cache 실패가 발생함. 시스템이 캐시를 자동으로 다시 로드함.

4.0.0-RC

출시일: 2025년 9월 9일

데이터 레이크 분석

BE 메타데이터용 통합 페이지 캐시와 데이터 캐시를 도입하고, 적응형 스케일링 전략을 채택했습니다. #61640
반복적인 구문 분석을 방지하기 위해 Iceberg 통계에 대한 메타데이터 파일 구문 분석을 최적화했습니다. #59955
데이터 파일 스캔을 효율적으로 건너뛰어 Iceberg 메타데이터에 대한 COUNT/MIN/MAX 쿼리를 최적화하여 대규모 분할 테이블에서 집계 쿼리 성능을 크게 향상시키고 리소스 소비를 줄였습니다. #60385
rewrite_data_files 프로시저를 통해 Iceberg 테이블의 압축을 지원합니다.
숨겨진 파티션이 있는 Iceberg 테이블의 생성, 쓰기 및 읽기를 지원합니다. #58914
Paimon 카탈로그에서 TIME 데이터 타입을 지원합니다. #58292

보안 및 인증

JWT 인증 및 Iceberg REST 카탈로그를 사용하는 시나리오에서 StarRocks는 REST 세션 카탈로그를 통해 Iceberg에 사용자 로그인 정보를 전달하여 후속 데이터 액세스 인증을 지원합니다. #59611 #58850
Iceberg 카탈로그의 벤디드 자격 증명을 지원합니다.

스토리지 최적화 및 클러스터 관리

공유 데이터 클러스터의 클라우드 네이티브 테이블에 대한 파일 번들링 최적화를 도입하여 로드, 압축 또는 게시 작업으로 생성된 데이터 파일을 자동으로 번들링함으로써 외부 저장 시스템에 대한 고빈도 액세스로 인한 API 비용을 줄입니다. #58316
Routine Load를 위한 Kafka 4.0을 지원합니다.
공유 없는 클러스터의 프라이머리 키 테이블에서 전체 텍스트 역색인을 지원합니다.
카탈로그, 데이터베이스, 테이블, 뷰 및 구체화된 뷰의 이름에 대한 대소문자 구분 없는 처리를 활성화하는 것을 지원합니다. #61136
공유 데이터 클러스터에서 컴퓨트 노드의 블랙리스트 설정을 지원합니다. #60830
글로벌 연결 ID를 지원합니다. #57276

쿼리 및 성능 개선

DECIMAL256 데이터 타입을 지원하여 정밀도의 상한을 38비트에서 76비트로 확장합니다. 256비트 스토리지는 고정밀 금융 및 과학 컴퓨팅 시나리오에 대한 적응성을 향상시키며, 매우 큰 집계와 고차 연산에서 DECIMAL128의 정밀도 오버플로우 문제를 효과적으로 완화합니다. #59645
JOIN 및 AGG 연산자의 성능을 최적화했습니다. #61691
[미리보기] SQL 계획 관리자를 도입하여 사용자가 쿼리에 쿼리 계획을 바인딩할 수 있게 함으로써 시스템 상태 변경(주로 데이터 업데이트 및 통계 업데이트)으로 인한 쿼리 계획 변경을 방지하여 쿼리 성능을 안정화합니다. #56310
파티션별 스필러블 집계/고유 연산자를 도입하여 정렬된 집계를 기반으로 한 기존의 스필 구현을 대체함으로써 복잡하고 높은 카디널리티 GROUP BY 시나리오에서 집계 성능을 크게 향상시키고 읽기/쓰기 오버헤드를 줄입니다. #60216
Flat JSON V2:

테이블 레벨에서 Flat JSON 구성을 지원합니다. #57379
V1 메커니즘을 유지하면서 페이지 및 세그먼트 수준 인덱스(ZoneMaps, Bloom 필터), 지연 구체화가 있는 조건자 푸시다운, 사전 인코딩 및 낮은 카디널리티 글로벌 사전 통합을 추가하여 JSON 컬럼형 스토리지를 향상시켜 실행 효율성을 크게 높입니다. #60953

STRING 데이터 타입에 대한 적응형 ZoneMap 인덱스 생성 전략을 지원합니다. #61960

함수 및 SQL 구문

다음 함수가 추가되었습니다:

bitmap_hash64 #56913
bool_or #57414
strpos #57287
to_datetime 및 to_datetime_ntz #60637
regexp_count #57182
tokenize #58965
format_bytes #61535

다음과 같은 구문 확장을 제공합니다:

CREATE ANALYZE FULL TABLE에서 IF NOT EXISTS 키워드를 지원합니다. #59789
SELECT에서 EXCLUDE 절을 지원합니다. #57411
집계 함수에서 FILTER 절을 지원하여 조건부 집계의 가독성과 실행 효율성을 향상시킵니다. #58937