공개 CFD 데이터셋이 AI 공력 해석을 바꾸고 있다

AI 공력 해석에서 가장 큰 병목은 모델 구조만이 아니었습니다. 고품질 CFD 데이터도 부족했습니다. 실제 industrial CFD는 geometry, mesh, turbulence model, boundary condition, solver setup, post-processing이 복잡하고 비용이 높습니다. 공개 데이터가 부족하면 모델은 작은 toy problem에서만 평가되고, 제품 설계로 넘어가기 어렵습니다.

최근 몇 년 사이 automotive aerodynamics 영역에서 변화가 생겼습니다. DrivAerNet, DrivAerNet++, AhmedML, WindsorML, DrivAerML 같은 공개 데이터셋이 나오면서 AI surrogate, drag prediction, field prediction, benchmark 연구가 더 구체적으로 가능해졌습니다.

DrivAerNet과 DrivAerNet++

DrivAerNet은 industry-standard car shape를 기반으로 한 large-scale CFD dataset으로, 4,000개의 3D car mesh와 aerodynamic performance data를 제공합니다. 이후 DrivAerNet++는 8,000개의 diverse car design, fastback/notchback/estateback, wheel/underbody variation, parametric model, aerodynamic coefficient, flow/surface field data를 포함하는 더 큰 multimodal dataset으로 확장되었습니다. 논문은 39TB 이상의 공개 engineering data를 언급합니다.

이런 데이터셋은 단순 drag coefficient 예측을 넘어 geometry classification, generative design, surrogate field prediction, optimization benchmark로 확장될 수 있습니다. 자동차 공력은 geometry variation이 제품 성능과 바로 연결되기 때문에 AI CAE의 실용성을 평가하기 적합한 영역입니다.

AhmedML과 WindsorML

AhmedML은 Ahmed car body의 500개 geometry variation을 high-fidelity CFD로 계산한 open-source dataset입니다. 단순화된 bluff body지만, pressure-induced separation과 3D vortical structure 등 road vehicle에서 중요한 flow topology를 포함합니다. WindsorML은 Windsor body 355개 geometry variant를 대상으로 GPU-native high-fidelity WMLES와 280M cells 수준의 계산을 사용한 데이터셋입니다.

이 데이터셋들이 중요한 이유는 “AI가 drag를 맞췄다”를 넘어서, 어떤 turbulence model, 어떤 mesh resolution, 어떤 geometry variation에서 결과가 나왔는지 검토할 수 있기 때문입니다. AI 공력 모델의 신뢰는 model architecture보다 데이터 생성 과정의 투명성에 크게 의존합니다.

DrivAerML과 DoMINO benchmark 흐름

NVIDIA PhysicsNeMo의 DoMINO 예제 문서는 DrivAerML dataset을 사용합니다. 문서에 따르면 이 데이터셋은 500개의 parametrically morphed DrivAer notchback variant를 포함하고, consistent and validated automatic workflow로 mesh generation과 scale-resolving CFD simulation이 수행되었습니다.

2025년 PhysicsNeMo-CFD benchmarking framework 논문은 DoMINO, X-MeshGraphNet, FIGConvNet 같은 AI 모델을 automotive aerodynamics prediction에서 accuracy, performance, scalability, generalization 기준으로 비교하는 framework를 제안합니다. 이것은 AI CAE가 “모델 발표”에서 “비교 가능한 benchmark”로 넘어가는 중요한 신호입니다.

데이터셋을 실제로 비교하면 무엇이 보이나

데이터셋	규모/형태	주요 출력	주요 사용처	주의점
DrivAerNet	약 4,000 car mesh	aerodynamic coefficient 중심	geometry-to-drag baseline, generative design ranking	field-level 학습에는 출력 범위를 확인해야 함.
DrivAerNet++	8,000 design, fastback/notchback/estateback, 39TB+ engineering data	coefficient, surface/flow field, multimodal data	foundation-model style pretraining, field prediction, OOD split 연구	데이터 규모가 커서 storage, sampling, split design이 중요.
AhmedML	500 Ahmed body variants	high-fidelity CFD field, wake topology	bluff-body flow surrogate, separation/wake 학습	단순화 형상이라 실제 차량 세부 feature 일반화는 제한.
WindsorML	355 Windsor body variants, WMLES, 대규모 cell count	high-fidelity transient/flow statistics	고충실도 benchmark, turbulence-aware model 평가	계산 충실도는 높지만 shape diversity는 별도 확인 필요.
DrivAerML	500 morphed DrivAer notchback variants	DoMINO benchmark용 surface/volume field	AI model 비교, PhysicsNeMo pipeline 재현	notchback 중심이므로 body family OOD 평가가 필요.

CFD 데이터셋을 볼 때 확인할 것

Geometry diversity: 단순 parameter sweep인지, 실제 설계 다양성을 포함하는지 봅니다.
Solver fidelity: RANS, LES, WMLES, hybrid RANS-LES 등 어떤 수준의 CFD인지 확인합니다.
Mesh and domain: mesh resolution, far-field domain, boundary condition이 일관적인지 봅니다.
Outputs: drag coefficient만 있는지, surface pressure, wall shear, volume field, force/moment가 있는지 봅니다.
Validation: reference experiment나 validated workflow가 있는지 확인합니다.
License and reproducibility: 공개 형식, 재현 가능한 case setup, permissive license가 중요합니다.

제품 개발에 왜 중요한가

공개 CFD 데이터셋은 AI CAE 모델을 실제 제품 설계로 가져가기 위한 공통 언어를 만듭니다. 모델이 빠르다고 말하는 것보다, 어떤 dataset에서 어떤 metric으로 어떤 baseline을 이겼는지가 중요합니다. 설계팀은 이 근거를 보고 “초기 screening에 쓸 수 있는가”, “field preview에 쓸 수 있는가”, “full CFD를 대체하지 않고 후보를 줄이는 데 쓸 수 있는가”를 판단할 수 있습니다.

Benchmark를 설계한다면 이렇게 나눕니다

예를 들어 DrivAerNet++ 기반으로 외부 공력 surrogate를 평가한다면 random split 하나로는 부족합니다. 실제 제품 팀이 궁금한 것은 같은 차종에서 작은 파라미터를 바꾼 성능이 아니라, 새로운 형상 family나 operating condition에서 모델이 어디까지 버티는가입니다.

Split	구성	평가 질문
Interpolation	같은 body type 안에서 wheel/underbody parameter variation	설계 후보 ranking과 coefficient 예측이 안정적인가.
Geometry OOD	estateback을 학습에서 제외하고 test에만 배치	새로운 body family에 일반화되는가.
Operating OOD	특정 yaw angle 또는 ride height 범위를 test로 분리	조건 외삽에서 confidence가 낮아지는가.
Mesh policy shift	다른 mesh density 또는 surface sampling 방식	모델이 mesh artifact에 과적합하지 않았는가.
Engineering QoI	drag/lift error, pressure hot spot, wake region field error	field 평균이 아니라 설계 결정 지표가 맞는가.

이렇게 나눠야 “모델이 평균적으로 잘 맞았다”가 아니라 “이 모델은 같은 body family의 screening에는 쓸 수 있지만 새로운 rear-end topology에는 full CFD fallback이 필요하다”처럼 제품 판단이 가능합니다.

RHXY Sim 같은 제품에서도 이런 흐름은 중요합니다. AI 공력/열/구조 모델은 내부 데이터만으로 닫힌 black box가 아니라, 공개 benchmark와 validation report를 통해 신뢰를 설명해야 합니다. 그래야 사용자가 빠른 결과를 단순한 이미지가 아니라 설계 판단의 근거로 받아들일 수 있습니다.

공개 CFD 데이터셋이 AI 공력 해석을 바꾸고 있다

읽기 전에 보는 검토 지도

Episode

Schema

Validation

Learning