메인 콘텐츠로 건너뛰기
OpenAI

2025년 10월 28일

공격을 확산 전에 중단시키는 Doppel의 AI 방어 시스템

GPT‑5와 강화학습 기반 파인튜닝(RFT)을 사용해 Doppel은 분석가의 워크로드를 80% 줄이고 이제 몇 시간이 아닌 몇 분 만에 위협을 완화합니다.

질감이 있고 곡선과 리벳이 있는 어두운 금속 배경의 중앙의 흰색 Doppel 로고.
회사 규모: 스타트업
지역: 북미
산업: 기술
제품: API

성과

80%

간소화된 분석가 워크플로

성과

3x

위협 처리 역량

로딩 중...

하나의 사칭 사이트가 시작되어 사용자 수천 명을 대상으로 공격한 후 한 시간 내에 사라질 수 있습니다. 이 시간이라면 공격자가 실질적으로 피해를 입히기에 충분하고도 남습니다. 생성형 도구를 사용하면 아주 간단하게 수백 개를 더 구동할 수 있습니다.

Doppel은 조직을 딥페이크와 온라인 사칭으로부터 방어하기 위해 구축되었지만 AI 때문에 위협이 무한대로 확장될 수 있다는 것을 금세 깨달았습니다. 이제 공격자는 사기를 위한 콘텐츠를 직접 만들 필요가 없습니다. 피싱 키트, 스푸핑된 도메인, 사칭 계정의 여러 버전을 몇 초 만에 무한정 만들 수 있습니다.

“피싱 공격으로 인한 피해는 소셜 미디어와 메시징 채널로 확산하면서 몇 분 만에 나타날 수 있습니다. 거의 비용을 들이지 않고 무한대의 설득을 생성할 수 있다는 것이 모든 걸 바꿔놓았죠.”
—Rahul Madduluri, Doppel 공동 설립자 겸 CTO

도입 과정 이야기

공격자들보다 앞서 나가기 위해 Doppel은 OpenAI GPT‑5와 o4-mini 모델을 기반으로 구축된 새로운 유형의 소셜 엔지니어링 방어 시스템을 개발했습니다. Doppel의 플랫폼은 자율적으로 위협을 감지하고 분류하고 제거하여 분석가의 워크로드를 80% 줄이고 위협 처리 역량을 3배 높이며 대응 시간을 몇 시간에서 몇 분으로 단축합니다.

끝없이 더 빨라지는 위협을 앞서는 방법

기존의 디지털 위험 방지 시스템은 사람의 수동 작업에 의존하여 사칭 사이트와 피싱 도메인, 소셜 미디어 프로필과 게시물을 검토했습니다. 이런 방식은 공격자가 자동화하기 시작하여 사람이 평가할 수 있는 것보다 더 빠르게, 더 많은 표면에 위협을 배포함에 따라 효과가 없어졌다는 것이 Doppel의 판단이었습니다.

“우리 시스템은 노이즈 중에서 실질적인 위협을 식별하기 위해 끝없는 신호의 홍수를 처리합니다. 위협이 감지되면 피해를 입기 전에 조치할 시간이 아주 짧습니다.”라고 Rahul은 말합니다. “AI를 사용해 의사 결정을 자동화한 것이 회사에 가장 큰 성취를 안겨줬습니다. 인터넷의 규모와 속도로 공격을 퇴치할 수 있게 되었거든요.”
—Rahul Madduluri, Doppel 공동 설립자 겸 CTO

그 속도는 Doppel의 고객, 즉 위협을 확인하기 위해 몇 시간씩 기다릴 여유가 없는 조직에 매우 중요합니다. Doppel의 시스템은 추론에 OpenAI 모델을 사용하고 시간이 지날수록 모델을 개선하기 위해 강화 파인 튜닝(RFT)이라는 구조화된 피드백 루프를 사용하여 대부분의 위협을 자동으로 분류합니다. RFT에서 사람의 피드백은 등급이 매겨진 예시로 사용되어 모델이 자체적으로 일관적이고 설명 가능한 결정을 내리는 것을 학습하도록 합니다.

LLM 기반 위협 감지 오케스트레이션

Doppel의 감지 스택의 중심에는 LLM 기반 파이프라인이 있습니다. 신호를 소싱 및 필터링한 후 시스템은 일련의 표적화된 추론 작업을 수행합니다. 즉, 잠재적인 위협을 추론하고, 의도를 확인하고, 분류 결정을 내립니다. 각 단계는 속도, 정확성, 일관성의 균형을 맞추도록 설계되어 있으며, 분석가는 사람의 판단이 필요한 예외 사례에 집중할 수 있습니다.

LLM을 사용한 위협 감지 파이프라인을 보여주는 흐름도. 소싱과 필터링에서 특성 추출 및 분류, 최종 확인 및 제거 시스템으로 이동함. GPT-5 및 o4-mini와 같은 모델은 주요 단계에서 사용됩니다.

작동 방식은 다음과 같습니다.

  • 신호 필터링 및 특징 추출: Doppel의 시스템은 매일 수백만 개의 도메인, URL, 계정 데이터를 수집합니다. 추단법과 OpenAI o4-mini의 조합으로 노이즈를 필터링하여 제외하고 구조화된 특성을 추출하여 다운스트림 모델 평가에 가이드를 제시합니다.
  • 병렬 위협 확인: 각 신호는 다양한 유형의 위협 분석에 맞게 설계된 여러 GPT‑5 프롬프트를 거쳐 처리됩니다. 이러한 프롬프트는 사칭 위험, 브랜드 오용, 소셜 엔지니어링 패턴과 같은 요소를 평가합니다.
  • 위협 분류: RFT 버전의 o4-mini는 이전 단계에서 확인된 결과를 종합해, 악성, 정상, 불확실과 같은 구조화된 라벨을 실제 운영 환경 수준의 일관성으로 부여합니다.
  • 최종 검증: 두 번째 GPT‑5 처리 과정을 통해 모델의 판단을 검증하고 자연어 기반의 근거를 생성합니다. 신뢰도가 임계치를 넘으면 시스템은 조치를 자동으로 시작합니다.
  • 사람 검토: 신뢰도가 낮거나 결과가 상충할 경우 인간 분석가에게 전달됩니다 이러한 판단 결과는 로그로 기록되어 RFT 루프에 다시 반영되며 모델의 일관성을 지속적으로 개선합니다.

강화 파인 튜닝(RFT)으로 모델 훈련

Doppel은 LLM으로 향상된 오리지널 감지 파이프라인에서 이미 유의미한 수준의 성과를 얻었지만, 같은 위협이 분석가에 따라 서로 다르게 판단될 수 있는 경우에는 일관성이 제한적인 요소가 되었습니다.

“RFT를 사용하면서 실질적으로 얻은 이점은 모델의 결정을 더 일관적으로 만든다는 점입니다.”
—Kiran Arimilli, Doppel 소프트웨어 엔지니어

그러한 일관성을 확보하기 위해 Doppel은 자체 분석가 데이터를 피드백 소스로 사용해 RFT를 적용했습니다. 도메인을 ‘악성’, ‘정상’ 또는 ‘불확실’로 분류하는 각 결정은 등급이 매겨진 예시가 되었습니다. 이렇게 레이블이 지정된 예시로 애매한 예외 사례에서도 전문가의 판단을 복제하도록 모델을 학습시켰습니다.

Doppel 위협 분류 워크플로를 보여주는 원형 다이어그램. 프로덕션 LLM이 결정을 내림 → 인간 검토자가 수정함 → 모델 훈련이 모델을 업데이트함 → 업데이트된 모델을 프로덕션에 배포함

OpenAI의 응용 엔지니어링 팀과 긴밀히 협력하며 Doppel은 정확성뿐만 아니라 설명의 품질도 평가하는 채점기 기능을 설계하여 정확할 뿐만 아니라 명확하게 추론한 모델에게 보상했습니다. 분석가 피드백을 구조화된 훈련 데이터로 전환함으로써 Doppel은 RFT가 자동화된 감지의 일관성과 안정성을 어떻게 향상할 수 있는지를 보여줬습니다.

투명성을 통해 신뢰를 내재화한 운영

하이퍼파라미터 튜닝과 반복 평가는 모델을 인간 수준의 일관성에 가까워지게 했습니다. 하지만 Doppel에서 자동화의 마지막 단계를 완료한다는 것은 결정을 즉시 이해할 수 있게 한다는 것을 의미했습니다.

이제 자동화된 제거 조치마다 AI가 생성한 근거 정보가 포함되어 위협이 제거된 이유를 설명하며, 조치가 취해진 이유에 관해 고객에게 즉각적인 인사이트를 제공합니다. 전에는 이를 위해 분석가의 개입이 필요했습니다.

대시보드 화면에는 'd0ppel.click' 도메인에 대한 차단 알림이 표시됩니다. Doppel을 사칭한 것으로 표시된 사례입니다. 요약에 피싱과 자격 증명 탈취라고 써있고, 오른쪽의 타임라인에는 2025년 10월 10일에 생성부터 해결까지의 상태 업데이트가 있음.

이러한 가시성은 신뢰를 높이며, 신뢰는 Doppel의 사용자에게 필수적인 요소입니다. 무슨 조치가 취해졌는지뿐만 아니라 그 이유까지 볼 수 있게 되면서 팀은 확신을 가지고 빠르게 대응할 수 있게 되었고 그 결정을 내부적으로 또는 이해관계자에게 설명할 컨텍스트를 갖게 되었습니다.

성과 한눈에 보기

  • 분석가의 업무 부담 80% 감소
  • 위협 대응 시간 몇 시간에서 몇 분으로 단축
  • 위협 처리 용량 3배 증가
  • 대부분의 위협 자동 분류

향후 계획

피싱과 사칭 도메인에 대해 완전에 가까운 자동화를 이룬 Doppel은 이제 같은 모델 기반 프레임워크를 변동이 큰 다른 채널에 적용하고 있습니다.

“도메인은 아마도 우리가 처리하는 것 중에서 가장 까다로운 채널일 겁니다.”라고 Madduluri는 말합니다. “신호가 지저분하고 콘텐츠가 계속해서 바뀌며 위협이 한 번에 여러 표면에서 빠르게 변하거든요. 도메인을 처음부터 끝까지 자동화할 수 있다면 소셜 미디어, 유료 광고 등 어디에나 자동화를 적용할 수 있을 거예요.”

다음 마일스톤에는 RFT 데이터세트를 한 자릿수 더 확대하고, 새로운 등급 지정 전략을 실험하고, GPT‑5를 업스트림 특성 추출에 사용하는 것이 포함됩니다. 이러한 변화를 통해 Doppel은 파이프라인 단계를 통합하고 프로세스에서 더 조기에 더 복잡한 위협 지표에 대해 추론할 수 있을 것입니다.

반복할 때마다 Doppel은 신뢰가 공격받는 모든 표면에서 실질적인 위협을 방어하는 시스템을 구축하고 있습니다.