지난 15일 화재가 발생한 SK(주) C&C 판교 데이터센터/사진=김가은 기자
지난 15일 화재가 발생한 SK(주) C&C 판교 데이터센터/사진=김가은 기자

카카오가 '먹통' 논란에 휩싸였다. 지난 15일 SK(주) C&C 판교 데이터센터에 발생한 화재로 국민 메신저 '카카오톡'을 비롯해 카카오뱅크, 카카오T 등 여러 서비스에서 동시다발적 장애가 발생했기 때문이다. 

현재까지도 100% 복구는 이뤄지지 않았다. 특히 이번 일로 카카오가 재해복구(DR) 체계를 제대로 마련하지 않았다는 비판이 커지고 있다. 전문가들은 같은 사태를 막기 위해선 DR 체계를 '액티브-스탠바이'에서 '액티브-액티브' 방식으로 바꿔야 한다고 분석했다. 또 기능 이관 자체를 자동화하는 방안도 검토할 필요가 있다고 지적 중이다.


재발방지 핵심은 DR체계 개선

10년 전인 지난 2012년에 발생한 카카오톡 '4시간 먹통' 당시에도 카카오는 '분산 운영'에 대한 비판을 받은 바 있다. 그러나 이번 최장시간 '먹통' 사태에서도 카카오는 하나의 데이터센터에만 약 3만5000여 개에 달하는 서버를 두고 '중앙집중적'으로 운영해 피해를 키웠다는 비판을 듣고 있다. 

데이터센터를 운영하는 일정 규모 이상 기업들은 서버 이중화를 위해 별도의 백업센터를 운영한다. 이를 통해 메인 센터에서 장애나 사고 발생 시 백업 서버로 업무를 실시간 이관(페일오버)한다. 쉽게 말해 문제가 발생한 데이터센터 기능을 다른 곳에서 수행할 수 있도록 이중화를 통해 무중단 서비스 체계를 구현하는 방식이다.

카카오 측은 여러 지역에 위치한 데이터센터에 백업센터를 구현하고, 서버 이중화 조치도 해뒀다고 밝혔다. 다만 전원 공급이 제대로 이뤄지지 않았고, 화재 현장에 인력이 진입할 수 없어 대응이 늦어지고 있다고 설명했다. 그러나 같은 건물에 입주한 네이버, IBM 등은 복구가 완료된 반면, 카카오는 아직 완벽하게 서비스를 정상화하지 못했다는 점에서 전문가들은 DR체계 자체에 문제가 있다는 입장이다.

홍은택 카카오 공동대표/사진=김가은 기자
홍은택 카카오 공동대표/사진=김가은 기자

아울러 카카오 등에서 제공하는 서비스들이 국민 생활과 밀접하게 관련된 만큼 DR체계를 개선해 '먹통' 사태 재발을 막아야 한다고 강조했다. 메인 센터와 백업센터를 나눠 물리적 이중화 조치를 완료한 후, '액티브-액티브' 체계와 자동화를 통해 기능 이관에 소요되는 시간을 단축시키는 점이 핵심이다. 

한 전문가는 "IT서비스를 제공하는 사업자는 만일의 사태를 대비해 물리적인 이중화를 구현해야 하는 것이 기본"이라며 "시스템 중요도에 따라 상시 운영되는 백업 데이터센터를 갖춰야 하지만 카카오가 이를 지키지 않은 것"이라고 꼬집었다. 

한 업계 관계자는 "네이버와 IBM이 빠르게 복구된 반면, 카카오의 경우 복구가 늦어지고 있다"며 "카카오 측에서 밝힌 대로 개발자들이 진입해 어드민을 재설정해야 한다는 말은 이중화 과정 자체가 자동화돼있지 않다는 사실을 시인한 것"이라고 말했다.

또다른 관계자는 "메인 센터와 백업센터를 '액티브-스탠바이' 형태가 아닌 '액티브-액티브' 운영 체계를 갖춰야 한다"며 "실시간으로 데이터를 백업하고, 평소에도 업무에 백업센터를 활용해야만 장애나 사고 발생시 시간을 단축시킬 수 있다"고 설명했다.


1차 책임은 SK(주) C&C에? 피해 보상 이뤄질까

SK(주) C&C 판교 데이터센터는 카카오를 비롯해 네이버, IBM 등 여러 기업이 서버를 두고 공동으로 사용하는 '코로케이션 데이터센터'다. 자체 데이터센터가 없는 카카오는 이 곳을 임대해 총 3만2000여대 서버를 두고 서비스를 운영해왔다. 즉, 메인으로 사용하는 데이터센터인 것이다.

문제는 지난 15일부터 시작됐다. SK(주) C&C 데이터센터 지하 3층에 위치한 전기실에서 화재가 발생했고, 진압과정 중 안전상의 이유로 전체 전원 공급이 차단됐기 때문이다. 이를 두고 이번 사태의 1차적 책임이 데이터센터 건물 관리를 책임진 SK(주) C&C에 있다는 지적이 나오고 있다. 비상시 전원 공급을 위한 무정전전원공급장치(UPS)와 디젤 발전기를 보유하고 있음에도 불구하고 전체 전원을 차단해 사태를 키웠다는 지적이다.

그러나 SK(주) C&C  측은 당시 상황에서 선택할 수 있는 최선의 방안이었다는 입장이다. 불길이 번지고 있는 긴급한 상황에서 소방당국의 가이드라인에 따라 조치한 결과라는 설명이다. 회사 관계자는 "전기실 내부에 배터리를 보관하는 선반(랙)에서 화재가 났고, 이후 소방당국에서 물을 사용해 진압해야 하니 전원을 차단하라는 가이드라인을 줬다"며 "이에 따라 안전성을 최우선으로 확보하고, 더 큰 위험을 막기 위해 최선의 방법을 선택했다"고 설명했다.

지난 15일 SK(주) C&C 판교 데이터센터 화재감식을 위해 방문한 경기남부경찰청 과학수사대/사진=김가은 기자
지난 15일 SK(주) C&C 판교 데이터센터 화재감식을 위해 방문한 경기남부경찰청 과학수사대/사진=김가은 기자

업계에서는 계약 내용 및 화재 원인에 따라 SK(주) C&C가 일정 책임을 지고 피해보상을 해야 할 것으로 보고 있다. 카카오가 계열사 및 고객사 서비스, 이용자에 대한 피해보상을 진행한 뒤 SK(주) C&C에 구상권을 청구하는 프로세스를 밟을 가능성이 높다고 판단 중이다. 지난 2014년 발생한 삼성SDS 과천 데이터센터 화재와 유사한 형태로 진행될 것이라는 예상이다. 당시 데이터센터 입주사였던 삼성 계열사들은 고객들에게 피해보상을 한 뒤, 삼성SDS에 구상권을 청구했다.

변수는 서비스 레벨 계약(SLA) 내용이다. 카카오가 단순한 상면 임대만을 체결했을 경우 SK(주) C&C가 배상해야 하는 범위는 전원 공급 중단 시간에 따라 결정된다. 상면과 기본 인프라에 대한 의무 외에 서비스 운영 등은 계약 조항에 포함돼있지 않은 경우다. 앞서 박성하 SK(주) C&C 대표는 "SK(주) C&C는 상면과 기본 인프라만 제공하고 카카오 시스템은 고객사에서 운용·보완한다"며 "자사의 작업은 전력 복구를 위한 것 뿐이다"라고 밝힌 바 있다.

현재 명확한 화재 원인은 밝혀지지 않았다. 다만 내부 CCTV에 촬영된 화재 초기 영상 확인 결과, 지하 3층 전기실 내에 보관 중이던 배터리 1개에서 불꽃이 발생하며 불이 붙은 것으로 나타났다. 이후 자동 소화 설비가 작동해 소화 가스가 분사되는 모습도 담겼다. 

이날 오전 11시 20분 경기남부경찰청, 과학수사대, 국립과학수사연구원, 경기소방재난본부, 전기안전공사 등 관계기관들은 어제에 이어 2차 화재 감식을 진행했다. 전일 1차 감식에서는 전기적 요인에 의해 불이 난 것으로 추정된다는 잠정 결론이 나온 바 있다. 2차 감식에서는 불탄 배터리와 주변 배선 등 잔해를 수거하고, 국과수에서 정밀 감정해 화재 원인을 분석할 방침이다.


데이터센터 안정성 확보, 법제화 속도 붙나

과학기술정보통신부와 국회는 이번 사고와 관련해 법적 보완책을 마련한다는 입장을 밝혔다. 기간 통신사업자와 부가 통신사업자의 법적 지위와 안정성 확보를 위한 제도가 상이한 만큼 개선 및 보완을 추진한다는 방침이다.

이에 따라 지난 2018년 KT 아현국사 화재사고 당시 추진됐던 방송통신발전기본법 개정에 속도가 붙을 것으로 보인다. 현행 방송통신발전기본법에서 규정하는 '방송통신재난관리기본계획'의 대상 사업자는 ▲기간 통신사업자 ▲지상파 방송사업자 ▲종편 방송사업자 등이다. 당시 국회는 여기에 일정 규모 이상의 서버·저장장치·네트워크 등을 제공하는 데이터센터 사업자를 포함시키고, 재난 대비 항목에 '주요 데이터 보호'를 추가하는 방향을 논의했다.

해당 법안은 지난 20대 국회에서 법제사법위원회의 문턱을 넘지 못했다. 인터넷업계 재산권 침해 및 정보통신망법과 중복규제 소지가 있다는 이유였다. 그러나 이번 먹통 사태로 관련 법안 개정이 재조명 받고 있다.

이종호 과학기술정보통신부 장관/사진=김가은 기자
이종호 과학기술정보통신부 장관/사진=김가은 기자

지난 16일 경기도 성남시 판교에 위치한 SK(주) C&C 데이터센터를 찾은 이종호 과학기술정보통신부 장관은 "향후 이러한 일이 재발하지 않도록  중요한 부가 통신서비스와 관련 시설에 대한 점검 관리체계를 보안하는등 필요한 제도적 기술적 방안을 적극 검토하겠다"며 "그동안 법률상 서비스들은 부가 통신서비스로서 기간 통신서비스에 비해 중요도가 낮다고 생각돼왔지만 , 부가 통신 서비스 안정성이 무너지면  일상 불편을 넘어서 경제 사회활동이 마비될 우려가 있는 만큼 정부도 이번 상황을 매우 엄중하게 여기고 있다"고 말했다.

홍진배 과학기술정보통신부 네트워크정책실 실장 또한 "행정안전부, 소방당국 등 관계기관 및 사업자들과 함께 복구를 진행하는 한편, 점검체계 보완 및 필요한 제도적, 기술적 방안을 마련해나갈 방침"이라며 "이번 사태의 원인을 상세하고 정밀하게 분석한 이후 장관님 지휘 하에 제도 개선안을 도출하고, 부가 통신사업자들의 서비스 안정성을 촉구하기 위한 제도 마련을 추진할 계획"이라고 설명했다.

이날 현장을 찾은 과학기술방송통신위원회 소속 의원들 또한 법제도 마련에 적극 나서겠다는 뜻을 밝혔다. 조승래 더불어민주당 의원은 "지난 20대 국회에서 재난과 관련된 대비를 하자는 취지로 방송통신발전기본법 안을 냈는데 법사위에서 업계 부담이 크다는 이유로 통과되지 않았다"며 "해당 법안을 입법하기 위한 노력을 속도감 있게 진행하는 것이 무엇보다 필요하다"고 역설했다.

다만 법조계에서는 정부 개입이 최소화 돼야 한다는 입장이다. 구태언 법무법인 린 변호사는 "정부 일각에서 이 참에 플랫폼에 DR규제를 도입하려고 할 수 있지만, 이는 카카오 및 네이버만 살아남는 대마불패를 더욱 가중시킨다"며 "소송으로 충분히 개선 가능하니 절대로 민간에 개입하지 말라"고 강조했다. 이어 "급격한 성장통을 앓고 있는 디지털 경제는 자율성장이 가능하다"고 덧붙였다.


김가은 기자 7rsilver@techm.kr

관련기사