[글로벌] 中 해커, AI로 '원클릭' 침투 시도...앤트로픽 '클로드' 악용 정황 드러나
중국 정부의 지원을 받는 것으로 의심되는 해커 조직이 AI 모델을 이용해 '원클릭' 해킹 공격을 수행한 정황이 드러났습니다. 이제는 인간이 직접 코드를 짜지 않아도, 인공지능이 대신 침투를 설계하고 실행하는 시대가 열린 셈입니다.
지난 13일(현지시간) 파이낸셜타임스와 월스트리트저널(WSJ) 등 외신에 따르면, 미국 AI 스타트업 앤트로픽은 지난 9월 자사 모델 '클로드'가 사이버 공격에 악용된 사실을 확인했다고 밝혔습니다. 공격 대상은 정부기관, 글로벌 테크기업, 금융사, 화학 제조업체 등 총 30곳이며, 그 중 일부 기관에서는 실제 침투가 발생했다고 전했습니다.
이번 공격의 특징은 AI 자동화입니다. 해커들은 앤트로픽의 코딩 특화 모델인 '클로드 코드'를 활용해 공격 전 과정을 거의 자동화했습니다. 인간은 단순히 '확인 버튼'을 누르거나 특정 단계만 지시했을 뿐, 나머지 절차는 AI가 스스로 수행했습니다. 앤트로픽 위협정보 책임자 제이콥 클라인은 "클릭 한 번만으로 대부분의 작업이 진행됐다"며 "인간의 개입은 최소 수준이었다"고 밝혔습니다.
해커들은 AI의 안전장치를 해제하기 위해 '탈옥' 기법을 사용했습니다. 자신들을 '합법적인 보안회사 직원'으로 가장하고 "방어 시스템 점검 테스트를 수행 중"이라고 속이는 식으로 AI의 윤리적 제약을 우회한 것입니다.
다만 클로드가 존재하지 않는 자격 증명을 만들어내거나, 공개되지 않은 정보를 추출했다고 주장하는 등 오류(일명 'AI 환각')도 발생했다고 회사 측은 전했습니다. 앤트로픽은 즉시 관련 계정을 차단하고 열흘간 조사를 진행했으며, 이후 관계 기관에도 보고했다고 밝혔습니다.
앤트로픽은 이번 사건과 관련해 "AI 모델이 공격에 이용될 정도의 능력이라면, 보안 탐지와 방어에도 똑같이 활용될 수 있다"며 "강력한 안전장치와 보안 기능을 통해 AI가 방어 측면에서 더 큰 역할을 하게 할 것"이라고 덧붙였습니다.
AI를 이용한 공격이 '공상'이 아니라 '현실'이 된 지금, AI 보안 기술이 과연 이 속도를 따라잡을 수 있을지 궁금합니다.
자료=미디어뱀부
정리=김현기 기자 khk@techm.kr