국가정보자원관리원(국정자원) 화재 사태는 한국 정부 시스템의 재해복구(DR) 및 백업 체계가 얼마나 취약했는지 극명하게 드러냈다. 핵심은 '월간 백업' 규정과 액티브-액티브 구성의 미흡이었다.

통상적인 데이터센터의 버스웨이


핵심 시스템 96%는 '구식 백업' 위험 노출

이번 화재로 중단된 국정자원 시스템 647개 중 96.2%에 달하는 622개 시스템의 일부는 일반적인 방식의 백업 방식을 사용하고 있었다. 문제는 이들의 백업 주기가 현행 관리규정인 1개월에 맞춰져 있다는 점이다.

공무원들이 규정대로 한 달에 한 번만 백업을 수행할 경우, 재해 발생 시 최대 한 달 치 데이터 손실이 불가피하다. 데이터의 중요도와 갱신 주기에 따라 매일(일일 백업) 또는 실시간 백업이 권고되는 현실을 감안할 때, 국민 생활과 직결되는 행정 시스템에 '월간 백업' 규정을 적용하는 것은 매우 위험한 수준이라는 지적이다.

'실시간 복구'는커녕 '2일 복구'도 미흡

최고 수준의 재해 대응 체계인 액티브-액티브(Active-Active) 구성은 거의 전무했다. 중단 없는 서비스가 가능한 액티브-액티브 방식은 재해 시 실시간으로 서비스를 전환하여 서비스 중단을 최소화한다.

하지만 국정자원 시스템 중 재해복구 시스템이 가동된 것은 고작 3.8%인 25개에 불과했다. 더욱 심각한 것은 이들 시스템조차 서버나 스토리지가 백업되었음에도 복구에 무려 2일이나 소요됐다는 점이다. 우체국금융 등 중요 서비스의 복구 지연은 이들 시스템의 재해복구 시스템이 RTO(복구 목표 시간) 기준을 충족하지 못했음을 보여준다.

클라우드 전환 지연도 취약점 키워

정부가 야심 차게 추진해 온 한국형 클라우드 전환 정책이 정부 당국 시스템에는 느리게 적용됐다는 사실도 드러났다. 클라우드 환경은 데이터의 다중 복제와 신속한 인프라 복구에 유리하여 재해 대응 능력을 높여주지만, 이번 사태는 공공 부문의 클라우드 전환 속도가 매우 더뎠음을 시사한다.

이번 사태를 계기로, 정부는 중요한 국가 정보 시스템에 대해 데이터 손실을 최소화하는 RPO(복구 목표 시점)와 서비스 중단 시간을 최소화하는 RTO를 훨씬 엄격하게 설정하고, 실시간 백업 체계(액티브-액티브 또는 액티브-스탠바이 등)를 의무화하는 방향으로 백업 정책 및 규정을 전면 재검토해야 할 것이다.

오래된 HDD, 자기테이프, CD 등에 대하여 데이터손실이 없는 무결성 백업은 1577-1377로 전화주시거나 명정보기술 홈페이지(www.myung.co.kr)를 방문하여 청주본점이나 전국 각지점을 방문하여 주시기 바랍니다.

(주)명정보기술 여정현 부장