보안 프로그램 업데이트에서 빚어진 ‘IT 대란’ 여파가 계속되고 있다. 국내 게임사사 서비스하는 일부 게임에서도 접속 오류가 발생했다. 클라우드와 뗄 수 없는 관계인 게임업계에서 안정성 확보가 주요 문제로 떠오르고 있다.
최근 마이크로소프트(MS) 클라우드 서비스 오류로 펄어비스 ‘검은사막’과 그라비티 ‘라그나로크 온라인’, ‘라그나로크 비긴즈’ 등에서 게임 접속 오류가 생겼다. 그라비티는 전 서버 접속 불가능 현상 안내 후 긴급 점검에 돌입했고, 펄어비스 역시 원인 파악 후 서버 긴급 점검을 완료했다고 알렸다. 두 곳 모두 오류와 관련해 이용자 보상안을 마련했다. 국내 게임사들은 관련 피해를 집계 중이라고 알렸다.
‘IT 대란’은 보안업체인 크라우드스트라이크가 소프트웨어 ‘팰컨(Falcon)’을 업데이트하며 생겨났다. 이 과정에서 보안 업데이트 패치가 MS윈도 10과 충돌하며 팰컨을 이용하는 전 세계 850만대 윈도 기기가 영향을 받았다.
물론 이번 사태가 온전히 클라우드 때문에 빚어진 것은 아니지만, 비슷한 문제가 반복될 수 있기에 안정성 확보가 필요하다는 목소리가 나오고 있다. 클라우드는 게임 산업에서 빼놓을 수 없는 요소이기 때문이다. 개발 단계부터 퍼블리싱 이후 서비스하는 전 과정에서 방대한 데이터를 저장‧관리하는 데 필수적인 요소가 바로 클라우드다.
게임업계는 서버 오류 등에 대비하기 위해 아마존웹서비스(AWS)나 구글 클라우드, MS 등에서 제공하는 클라우드 외에도 자체적인 클라우드를 사용하기도 한다. 혹은 게임마다 다른 클라우드 업체를 이용하는 멀티 클라우드 방식을 택하기도 한다.
그렇지만 AWS, 구글, MS, 이른바 ‘빅3’ 의존도가 지나치게 높은 상황이다. 자체 클라우드를 이용하기에는 시설 마련이나 장소 임대 등 추가적인 비용 부담이 생겨나고, 호환성 등 부가적인 문제도 있어서다.
이 때문에 추후 비슷한 문제가 반복될 가능성이 있다. 이미 넥슨과 데브시스터즈, 라이엇게임즈 등도 클라우드 오류로 접속 장애가 발생한 적 있다. 지난 2021년 AWS 클라우드 도쿄 데이터센터 허브(리전)에서 서버 냉각 시스템 문제 때문이다. 이때 데브시스터즈 ‘쿠키런: 킹덤’과 라이엇게임즈 ‘리그오브레전드(LOL)’ 등 게임에 접속이 안됐다. 넥슨 역시 2018년 AWS 한국 리전 오류로 일부 게임 장애가 발생했다. ‘열혈강호M’, ‘카이저’ 등에서 로그인을 시도하면 서버 오류 메시지가 뜨는 식이다.
오류 이후 복구가 신속하게 이뤄지지 않는다면 치명적인 손실로 이어질 수 있다. 이번 접속 장애에서는 검은사막과 라그나로크 온라인 등 주요 게임들이 서비스 점검 완료까지 3~6시간 정도 소요됐다. 신속한 원인 파악 후, 크라우드스트라이크에서 대응 방안을 공지한 덕분이다. 다르게 보면 원인 진단과 대응이 신속하게 이뤄지지 않을 경우에는 장기 점검으로 이어질 수도 있다는 얘기다. 쿠키런 킹덤은 AWS 도쿄 리전 오류 당시 약 20시간 긴급 점검을 진행했다.
업계 관계자는 “오류가 발생되는 기간에 기본적으로 매출 창출이 중단된다. 더 나아가 고객 서비스 만족도 하락으로 영구 이탈로 이어질 가능성도 있다”고 설명했다. 이어 그는 “장기적으로 손실이 계속될 수 있어, 고객사가 클라우드를 비롯한 인프라 제공 업체에 손해배상을 청구하는 등 갈등이 확대될 수도 있다”고 지적했다.
임종인 고려대 정보보호대학원 석좌교수는 “보통 단계적으로 사전테스트를 한 후에 업데이트를 진행한다. 이번에 크라우드스트라이크는 이런 단계를 거치지 않고 진행해 오류가 발생했다”고 설명했다. 이어 그는 “오류로 인한 피해를 줄이기 위해 다양한 보완책을 마련하고 있지만, 오류가 안 생길 수는 없다”며 “오류가 생겨났을 때. 어떻게 빠르게 회복하느냐(사이버 레질리언스)가 관건이라, 이 부분에 대한 고민이 필요한 시점”이라고 조언했다.