“AI 서버, 물로 식힌다”…KT클라우드 ‘가산 AI 데이터센터’ 가보니 [현장+]

“AI 서버, 물로 식힌다”…KT클라우드 ‘가산 AI 데이터센터’ 가보니 [현장+]

국내 첫 ‘액체 냉각’ 데이터센터 개소…“AI 인프라 경쟁 주도”
가산에 26MW급 AI 허브 구축… 500MW까지 확대

기사승인 2025-11-06 09:00:04 업데이트 2025-11-06 14:55:17
KT클라우드의 가산 AI 데이터센터 외관. KT클라우드 제공

수도권 도심 한복판에 ‘AI 전용 냉각수’가 흐르기 시작했다.

KT클라우드가 국내 상업용 데이터센터 가운데 처음으로 액체 냉각(리퀴드 쿨링) 기술을 적용한 인공지능(AI) 데이터센터를 열었다. 고성능 AI 반도체의 발열 문제를 해결하는 차세대 냉각 방식을 도입하며, 국내 AI 인프라 경쟁의 선두로 나선 것이다. 

6일 서울 금천구 가산디지털단지에서 열린 ‘가산 AI 데이터센터(AI DC)’ 개소식에서 최지웅 대표가 환영사를 하고 있다. KT클라우드


최지웅 KT클라우드 대표는 6일 서울 금천구 가산디지털단지에서 열린 ‘가산 AI 데이터센터(AI DC)’ 개소식에서 "중장기적으로 500MW 이상 규모의 인프라를 확보해 AI 전환(AX) 시대를 선도하겠다"고 밝혔다.

가산 AI DC는 연면적 1만1046평, 지하 5층·지상 10층 규모의 초대형 시설로, 총 수전 용량은 40메가와트(MW), 정보기술(IT) 용량은 26MW를 갖췄다. 수도권 8개 데이터센터와 100기가비트(Gbps)급 전용망으로 연결돼 초고속 연동이 가능하다.

칩에 냉각수 직접 순환…“발열 3배 효율적으로 잡는다”

 
가산 AI DC의 핵심은 액체 냉각(리퀴드 쿨링) 기술로, 그래픽처리장치(GPU) 서버에 냉각판을 부착하고 찬물을 직접 흘려보내 열을 식히는 직접 칩 냉각(D2C) 방식을 기반으로 한다. 기존 공랭식보다 냉각 효율은 3배 높고, 전력 사용량은 20% 이상 줄어든다.

KT클라우드 관계자는 “AI 서버 한 대의 전력 소모가 일반 서버보다 3~4배 많다”며 “리퀴드 쿨링은 고성능 연산 환경을 안정적으로 유지하기 위한 필수 기술”이라고 설명했다.

무정전·무중단 설계…“전력 두 줄 끊겨도 서버는 멈추지 않는다”

센터 내부는 전력과 냉각, 소화설비를 모두 이중화했다.

가산변전소와 광명변전소에서 이원화된 전력을 공급받고, 두 회선이 모두 끊길 경우 30킬로볼트암페어(kVA)급 디젤 발전기 16대가 즉시 가동돼 전체 부하를 감당한다. 연료탱크는 27만리터 규모로, 주유가 지속되면 24시간 이상 무정전 운전이 가능하다.

지하에는 600kVA급 무정전전원공급장치(UPS)가 4대 1조로 구성돼 있으며, 화재 안정성이 높은 리튬인산철(LFP) 배터리를 적용했다. 정전 시 10~15분간 전력 공급을 유지하며, 배터리실과 UPS실은 격벽으로 분리돼 있고 IG-100 가스계 소화 시스템이 적용됐다.
 
‘콜로AI’로 맞춤형 AI 인프라 제공…운영까지 AI가 관리
 
가산 AI 데이터센터는 단순한 서버 보관소가 아니다. KT클라우드는 이번 센터를 거점으로 통합형 AI 인프라 서비스 ‘콜로AI(Colo.AI)’를 본격 제공한다.

GPU 서버, 전용 네트워크, 운영 플랫폼, 유지보수를 통합 제공하는 일괄형 서비스로, 기업은 복잡한 인프라 구축 없이 바로 AI 학습 환경을 이용할 수 있다.

운영 체계에도 AI로 투입됐다. KT클라우드가 개발한 ‘패스파인더’ 솔루션은 전력 계통을 실시간 감시해 문제가 발생하면 자동으로 차단하고 복구한다. AI 분석 기반 ‘자동화 운영 플랫폼’(DIMS)은 장애를 사전에 예측해 즉각 대응한다. 

KT클라우드 관계자는 “AI 연산은 초 단위로 손실이 발생하기 때문에 전원 안정성과 운영 효율이 핵심”이라며 “AI 기반 자동화로 장애를 최소화하는 체계를 구축했다”고 말했다.

“기술로 앞서는 데이터센터”…500MW 확장 로드맵

KT클라우드는 올해 경북 김천의 ‘클라우바 데이터센터’에 이어 두 번째 대규모 AI 인프라 거점을 개소했다. 당초 2030년까지 320MW 규모 확보를 목표로 했으나, 계획을 500MW로 상향하며 인프라 확충에 속도를 내고 있다.

최지웅 대표는 “AI 서버의 발열과 전력 문제는 기술로 해결해야 한다”며 “리퀴드 쿨링과 전력 제어 기술을 고도화해 안정적이고 효율적인 AI 인프라 환경을 구축하겠다”고 말했다.

이어 그는 “앞으로는 누가 먼저 실증하고, 누가 효율적으로 운영하느냐가 경쟁력”이라며 “KT클라우드는 대규모 투자보다 기술 중심의 실증 전략으로 시장을 선도하겠다”고 강조했다.

이혜민 기자
hyem@kukinews.com
이혜민 기자