X

데이터센터 액체 냉각 (Datacenter Liquid Cooling)

1. 데이터센터 운영 환경 변화와 Rack 고집적화 영향

(1) 데이터센터 운영 환경 변화

비교 항목 기존 컴퓨팅 환경 고집적화 컴퓨팅 환경
사용 환경 표준 처리 성능과 밀도를 갖춘 기존 중앙 처리 서버와 적당한 처리 요구에 따른 범용 워크로드 GPUGen. AI 지원 서버를 활용한 계산 용량 가속화로 리소스 집약적 병렬 워크로드
워크로드
사례
데이터 스토리지/통신, 트랜잭션 처리, 웹 호스팅 등 LLM, 빅데이터 분석, 인공지능, Genomic Sequencing 등
인프라
영향
MW(메가와트) 당 2.5 ~ 3M USD
(랙당 10kW 소요, 100% 공랭식)
MW(메가와트) 당 3 ~ 3.5M USD
(랙당 70kW 소요, 80% 수랭, 20% 공랭)

(2) 데이터센터 Rack 고집적화에 따른 영향

  • 데이터센터 환경은 AI 서비스 등 고집적화, 병렬처리 컴퓨팅 환경으로 변화하여 1 MW 규모의 데이터센터 구축 및 운영 과정에서 발생하는 사회경제적 비용이 3.5M USD 수준으로 증가

 

2. 데이터센터액체냉각(Datacenter Liquid Cooling)개요

(1) Rack 밀도 및 전력량에 따른 데이터센터 냉각 기술

  • 현재 대부분의 Rack은 최대 20kW 전력을 사용하고 있으며, 데이터센터 운영 환경 변화에 따라 운영되는 Rack 당 60kW 이상 필요할 것으로 전망

(2) 데이터센터 액체 냉각의 개념

개념도 개념
고밀도 Rack의 하드웨어 온도 제어를 위해 CPU 등 열 발생 부품 또는 장비에 냉각된 액체를 순환시키는 데이터센터 냉각 방식
  • 기존 공기 냉각 방식은 AI 서비스 등 Rack 고밀도화/고전력화로 인한 20kW 이상 전력 사용 Rack을 냉각시키기 어려우므로 데이터센터에 액체 냉각 방식 적용이 필수

 

3. 데이터센터 냉각 방식 유형 및 액체 냉각 메커니즘

(1) 데이터센터 냉각 방식 유형

구분 유형 세부 냉각 방식 / 특징
공기
냉각
방식
CRAC (Computer
Room Air Conditioning)
– 격벽에 냉각기를 배치하여 냉기 배포, 열기 흡입
– 유지관리가 쉽지만 냉각 효율성 저하
이중바닥 차폐 CRAC – Access Floor에 차폐 장치 추가, 냉기/열기를 분리
– 핫스팟 위험이 감소되나 결로 위험 증가
랙 기반 냉각
(Containment)
– 전용 차폐 장치를 사용해 서버 랙의 개별 행을 냉각
– 냉각 효율 향상되나 초기 비용 발생, 공간 활용도 감소
액체
냉각
방식
칩 직접 냉각 (D2C,
(Direct-to-Chip Cooling)

– 열 발생 부품에 냉각 플레이트 설치, 튜브로 액체 순환
– 열 방출, 에너지 효율 및 공간 절약, 서버 개조 필요
액침 냉각
(Immersion Cooling)

– 서버와 기타 IT 장비를 비전도성 액체에 담그는 방식
– 높은 전력 밀도 구현, 데이터센터 아키텍처 변경 필요
공기 보조 수랭 (AALC,
Air-Assisted Liquid Cooling)

– 랙 후면에 액체 라디에이터를 부착하여 공기 냉각 강화
– 장비 개조 불필요, 공랭식과 수랭식의 중간 과정

(2) 데이터센터 액체 냉각 메커니즘

구분 메커니즘 세부 동작 방식
냉각
구간
랙/하드웨어 냉각 – 데이터센터 전산실 내 CDU에서 액체(냉각수)를 순환시켜 Rack 내 서버 CPU/하드웨어의 열 흡수
액체(냉각수) 냉각 – 데이터센터 빌딩 내 열 교환기와 전산실 내 CDU(Coolant Distribution Unit) 간 액체를 순환시켜 액체(냉각수)를 냉각
응축, 열 배출 – 외부 냉각 타워와 데이터센터 빌딩 내 열 교환기 간 액체를 순환시켜 냉각 타워에서 열기를 배출
냉매
상태
단상 방식 – 냉각수가 전체 공정에서 액체 상태로 유지
2상 방식 – 냉각 시 기체로 변환되었다가 다시 액체로 변환
  • 현재 운영중인 데이터센터는 대부분 공랭식 냉각을 전제로 설계 되었으므로 기존 시설을 개조해 AALC 또는 D2C 방식을 사용해야 하며, 새로 구축하는 데이터센터는 액체 냉각 시스템을 구현할 수 있도록 설계 필요

 

4. 데이터센터 액체 냉각의 한계점 및 개선 방안

데이터 센터 액체 냉각의 한계점 개선 방안
– 물 등 냉매 유출 시 장비에 치명적
– 탄소 절대 배출량은 감소하지 않음
– 잦은 랙/장비 구성 변경으로 비효율화
– 비전도성 액체를 사용하여 냉매 유출에 대비
– 폐열 재활용, 친환경 냉매 등 지속 가능 기술 적용
– 유체 역학 관점 AI 기반 수시 열기 순환 모델링
  • 기존 데이터센터 전력 효율성 기준인 PUE(Power Usage Effectiveness)의 경우, 액체 냉각 방식 적용 시 분자와 분모가 모두 감소하기 때문에 TUE(Total-power Usage Effectiveness) 지표를 에너지 효율성 기준으로 사용 필요

 
[참고]

  • VERTIV, Vertiv Master Class Korea 2024
  • IT World, “지속 가능성과 AI 지원 모두 잡는다” 데이터센터 냉각 시스템의 현재와 미래
  • sysgen, Liquid Cooling Solutions
Categories: CA/운영체제
도리: