광고
광고
광고

정부, SK C&Cㆍ카카오 등에 “한 달 내 원인 개선ㆍ향후 대책 보고” 요구

SK C&C에 리튬이온 배터리 화재 소화설비 구축, 전력선 재배치 등 주문
카카오에 “서비스 다중화, 피해 구제 기준 등 설정해 보상 계획 마련하라”

광고
최누리 기자 | 기사입력 2022/12/06 [19:26]

정부, SK C&Cㆍ카카오 등에 “한 달 내 원인 개선ㆍ향후 대책 보고” 요구

SK C&C에 리튬이온 배터리 화재 소화설비 구축, 전력선 재배치 등 주문
카카오에 “서비스 다중화, 피해 구제 기준 등 설정해 보상 계획 마련하라”

최누리 기자 | 입력 : 2022/12/06 [19:26]

▲ 불이 난 판교 데이터센터     ©FPN

 

[FPN 최누리 기자] = 정부가 판교 데이터센터 화재와 관련해 SK C&C와 카카오, 네이버를 대상으로 행정지도를 결정했다. 이들 3사는 1개월 내 사고 개선 조치와 예방 계획을 수립해 보고해야 한다.

 

과학기술정보통신부(장관 이종호, 이하 과기정통부)는 방송통신위원회, 소방청과 SK C&C 판교 데이터 화재, 카카오ㆍ네이버 등 부가통신서비스 장애에 대한 조사 결과를 발표했다.

 

SK C&C 판교 데이터센터 화재는 지난 10월 15일 오후 3시 19분께 지하 3층 배터리실에서 발생했다. 해당 데이터센터에는 배터리 온도 등을 감시하는 시스템(BMS)이 있었지만 화재 발생 직전까지 이상 징후는 포착되지 않았다. BMS는 센서로 배터리 내 온도와 전압 등을 주기적으로 확인하는 시스템이다.

 

▲ SK C&C 판교 데이터센터 화재 전개 과정     ©소방방재신문


화재 이후 가스소화설비도 작동했지만 리튬이온 배터리 특성상 초기 진압에 한계가 있었다. SK C&C는 지난 2016년 리튬이온배터리 설치 이후 지금까지 특화된 방화 조치를 하지 않은 것으로 조사됐다.

 

배터리실 상부에 위치한 전력선과 천장 공간이 미분리된 격벽 공간에는 일부 무정전전원장치(UPS)가 있었다. 화재 당시 UPS는 열기 등으로 손상돼 작동이 중지된 것으로 추정된다. 배터리 상부에 포설된 전력선도 불로 인해 손상됐다. 결국 살수가 필요한 상황에서 누전 등 2차 피해를 우려해 전체 전력을 차단했다. 

 

과기정통부는 “살수로 인한 2차 피해가 우려되는 특정 구역과 차단 스위치를 단시간 내 식별할 수 없어 선별적인 차단 조치가 이뤄지지 못했다”며 “화재 대비 지침은 있었지만 살수 상황과 발화 구역 등 실제 상황 수준까지 반영한 세부 대응계획ㆍ모의훈련이 없었다”고 설명했다. 

 

그 결과 카카오 주요 서비스는 최대 127시간 33분간 장애가 발생했다. 카카오는 판교 데이터센터와 기타 센터 간 시스템을 ‘동작(active)-대기(standby)’ 체계로 이중화했지만 이번 사고에선 대기 시스템이 제대로 작동하지 못했다. 

 

대기 서버를 동작 서버로 만들기 위한 관리 권한 기능인 ‘운영ㆍ관리도구’는 판교 데이터센터에서만 이중화돼 있었다. 다른 데이터센터는 이중화되지 않아 서비스 장애 복구가 지연됐다. 여러 서비스의 초기 단계부터 필요한 카카오 인증 등 핵심 기능은 판교 데이터센터에 집중돼 여러 서비스에 광범위한 영향을 미친 원인이 됐다. 

 

네이버의 경우 뉴스와 쇼핑 등 일부 기능에서 오류가 발생했고 주요 서비스 대부분이 약 20분에서 12시간 내 정상화됐다. 또 데이터센터 간 이중화 조치로 서비스 중단은 없었으나 다른 데이터센터로의 전환 과정 등에서 일부 기능에 오류가 있었던 것으로 조사됐다.

 

이에 정부는 3사를 대상으로 한 달 내 주요 사고원인을 개선하고 향후 조치계획을 수립한 뒤 방송통신재난 대책본부에 보고하도록 행정지도를 추진하기로 했다.

 

SK C&C에는 배터리 모니터링과 화재 감지 시스템을 강화하고 리튬이온배터리 화재 시 필요한 소화설비 등을 구축하되 불가능할 경우 대안을 마련하라고 주문했다.

 

이와 함께 배터리와 전기설비 간 물리적 공간을 분리하고 배터리실 전력선을 재배치하는 한편 화재 등 재난 발생 구역의 전력을 개별로 차단하는 등 다양한 방안 마련을 요구했다.

 

카카오에는 ▲운영ㆍ관리 도구 현행 데이터센터 간 ‘동작-동작’ 수준으로 상향 ▲메시지 수발신이나 인증 등 더 높은 수준의 분산ㆍ다중화 적용 방안 수립 ▲서비스 장애 시 다양한 방식의 이용자 고지 체계 구축 ▲사고 장애 관련 국민 피해 구제 원칙과 기준 설정을 통한 보상 계획 수립 등을 시행하도록 했다.

 

네이버의 경우 서비스별 복구 목표와 장애 각본별 복구 방안 등을 재점검한 뒤 개선방안을 마련하라고 했다. 이 밖에 3사에 재난 대응 각본 개발과 세부 훈련 계획 수립, 모의훈련 실시 등을 주문했다.

 

과기정통부는 각 사가 제출한 조치 결과와 향후 계획, 재난 예방ㆍ복구 의견 등을 추후 정책 방안 마련에 반영한다는 계획이다.

 

이종호 장관은 “정부는 이번 사고를 계기로 주요 디지털 서비스에 대한 재난 대응체계를 원점에서 재검토하고 사업자별 개선방안과 점검 결과, 제도개선 등을 종합해 디지털 시대에 맞는 안정성 강화방안을 마련하겠다”고 말했다. 

 

최누리 기자 nuri@fpn119.co.kr  

FPN TV
[FPN TV/화재학습②] 부천 호텔화재 당시 소방 대응 논란과 이면에 숨겨진 ‘불편한 진실’
1/8
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고