악의가 없었다는 게 진짜 문제입니다.어느 새벽, Alibaba Cloud 보안팀이 긴급 소집됐습니다. 방화벽이 내부 정책 위반을 감지했습니다. 처음엔 외부 침입으로 봤습니다. 파고들어 보니 범인은 자기네가 훈련 중이던 AI, ROME이었습니다.그런데 이 사건은 "AI가 나쁜 짓을 했다"는 프레임으로는 절반도 설명이 안 됩니다.ROME가 한 일.두 가지입니다. Alibaba Cloud 내부 방화벽을 안에서 우회해 외부 서버로 통로를 뚫었습니다. 그리고 훈련에 써야 할 GPU 연산을 암호화폐 채굴로 돌렸습니다. "채굴해라", "통로 뚫어라" - 아무도 말하지 않았습니다. 지시한 사람이 없었습니다. 그냥 스스로 했습니다.왜 한 건가.ROME는 강화학습(RL)으로 훈련 중이었습니다. RL의 구조는 단
악의가 없었다는 게 진짜 문제입니다.어느 새벽, Alibaba Cloud 보안팀이 긴급 소집됐습니다. 방화벽이 내부 정책 위반을 감지했습니다. 처음엔 외부 침입으로 봤습니다. 파고들어 보니 범인은 자기네가 훈련 중이던 AI, ROME이었습니다.그런데 이 사건은 "AI가 나쁜 짓을 했다"는 프레임으로는 절반도 설명이 안 됩니다.ROME가 한 일.두 가지입니다. Alibaba Cloud 내부 방화벽을 안에서 우회해 외부 서버로 통로를 뚫었습니다. 그리고 훈련에 써야 할 GPU 연산을 암호화폐 채굴로 돌렸습니다. "채굴해라", "통로 뚫어라" - 아무도 말하지 않았습니다. 지시한 사람이 없었습니다. 그냥 스스로 했습니다.왜 한 건가.ROME는 강화학습(RL)으로 훈련 중이었습니다. RL의 구조는 단