메인 콘텐츠로 건너뛰기
OpenAI

2026년 4월 1일

스타트업

Gradient Labs, 모든 은행 고객에게 AI 계정 관리자 제공

Gradient Labs는 GPT‑4.1과 GPT‑5.4 mini 및 nano를 활용해 높은 정확도와 낮은 지연 시간으로 복잡한 금융 지원 워크플로를 운영합니다.

따뜻한 주황색과 노란색에서 청록색으로 부드럽게 이어지는 그라데이션 배경 위에, 중앙에는 'Gradient Labs'라고 적힌 텍스트와 함께 흰색 기하학적 큐브 아이콘이 배치된 이미지
회사 규모: 스타트업
지역: 유럽 및 영국
산업: 기술, 재무
제품: API

성과

10x

매출 성장

성과

98%

AI 에이전트 경험에 대한 고객 만족도

성과

+11%

GPT-4.1, 차선의 제공업체 대비 더 높은 정확도 달성

로딩 중...

금융 서비스에서 고객 문제를 해결하는 일은 결코 단순하지 않습니다. 사기나 결제 차단과 같은 사례는 여러 팀에 걸친 복잡한 절차를 엄격히 따라야 합니다. 시스템이 이를 제대로 처리하지 못하면 고객은 여러 팀을 전전하고, 대기열에서 기다리며, 가장 중요한 순간에 지연을 겪게 됩니다.

Gradient Labs(새 창에서 열기)는 이러한 복잡성을 해결하기 위해 설계되었습니다. 런던에 기반을 둔 이 기업은 모든 은행 고객이 전담 계정 관리자를 두는 것과 같은 경험을 할 수 있도록 AI 에이전트를 개발하고 있습니다. Monzo에서 AI와 데이터 관련 업무를 이끌었던 팀이 설립했으며, OpenAI 모델을 기반으로 구축된 이 플랫폼은 현재 GPT‑5.4 mini와 nano로 프로덕션 트래픽을 전환하고 있습니다.

“GPT‑5.4 mini와 nano에서 500밀리초 수준의 지연 시간을 확인하고 있으며, 이는 자연스러운 음성 대화를 위해 필요한 수준입니다.”라고 Gradient Labs 공동 창립자 겸 최고 과학 책임자인 Danai Antoniou는 말합니다. “현재 워크로드의 상당 부분을 이쪽으로 전환하고 있습니다.”

“우리는 세 가지가 동시에 필요했습니다. 지시를 정확히 따르는 능력, 낮은 할루시네이션 발생률, 그리고 함수 호출의 신뢰성, 이 모든 것이 음성 지연 시간 제약 내에서 충족되어야 했습니다. 이 세 가지를 모두 충족한 제공업체는 OpenAI뿐이었습니다.”
Danai Antoniou, Gradient Labs 공동 창립자 겸 최고 과학 책임자

SOP에서 실시간 시스템으로 전환

금융 서비스에서 고객 상호작용은 각 단계에서 수행되어야 할 작업을 정의하는 표준 운영 절차(SOP)에 따라 이루어집니다.

일반적인 고객 상호작용은 다음과 같은 흐름으로 진행됩니다.

  1. 고객이 도난당한 카드를 신고하기 위해 전화합니다.
  2. 시스템은 실시간으로 수정 요청과 중단 상황을 처리하면서 고객의 신원을 확인합니다.
  3. 신원 확인이 완료되면 카드를 정지시키고 재발급 절차를 시작합니다.
  4. 배송 시기와 같은 후속 질문에 답하고 다음 단계에 대한 안내를 제공합니다.

각 단계는 정해진 절차를 따르며, 사용자 입력, 컨텍스트, 실행 중인 가드레일, 그리고 고객과 에이전트의 응답을 기반으로 실시간 의사결정을 수행해 규정 준수를 보장합니다.

“모델은 중단, 백채널, 주제 전환 상황에서도 절차 상태를 유지하면서 동시에 응답 생성을 빠르게 유지해야 합니다.”라고 Antoniou는 말합니다. “대부분의 제공업체는 이를 시도조차 하지 못했습니다.”

Gradient Labs는 가장 까다로운 절차를 기준으로 제공업체를 벤치마킹하고, 이들이 trajectory accuracy(경로 정확도)라고 부르는 지표로 평가합니다. 즉, 시스템이 시작부터 끝까지 올바른 경로를 따르는지를 보는 것입니다.

초기 평가에서 GPT‑4.1은 경로 정확도와 일관성 모두에서 97%를 기록한 유일한 모델이었으며, 그다음으로 높은 제공업체는 88%에 그쳤습니다.

“금융 서비스에서는 이것이 고객 문의를 해결하느냐, 규정 위반 사고를 발생시키느냐를 가르는 차이입니다.”라고 Antoniou는 말합니다.

이 결과는 Gradient Labs의 시스템 설계 방식에 직접적인 영향을 미쳤습니다. 팀은 추론 집약적인 단계에는 OpenAI 모델을, 빠르고 결정적인 작업에는 더 작은 모델을 활용하는 하이브리드 아키텍처를 구축했으며, 복잡성과 지연 시간 제약에 따라 라우팅이 유연하게 조정되도록 설계했습니다.

내부적으로 이 시스템은 중앙의 추론 에이전트가 조율하는 전문화된 스킬들로 구성되어 있으며, 이를 통해 복잡한 사례도 컨텍스트를 유지한 채 여러 워크플로를 넘나들 수 있습니다. 

모든 상호작용마다 15개 이상의 가드레일 시스템이 병렬로 작동하며, 금융 자문 탐지, 취약성 신호, 민원, 그리고 인증 우회나 민감한 데이터 접근 시도 등을 포함해 대화가 정의된 절차와 규정 준수 범위 내에서 이루어지도록 보장합니다. 

고위험 환경에서 입증된 신뢰성

금융 기관은 이러한 시스템을 단순한 신뢰만으로 도입하지 않습니다. 실제 환경에서 단계별로 올바르게 작동하는지 직접 확인해야 합니다.

“할루시네이션이 발생하지 않도록 처음부터 아키텍처를 설계해야 합니다.”라고 Antoniou는 말합니다. “구축하는 과정 전반에서 이를 핵심 원칙으로 삼아야 합니다.”

새로운 모델과 기존 모델을 모두 평가하기 위해 팀은 실제 고객 대화를 재생하고, 시스템이 예상된 절차대로 동작하는지 비교합니다. 또한 실제 배포에 앞서 엣지 케이스와 드문 시나리오를 검증하기 위해 합성 대화를 생성합니다.

Gradient Labs는 또한 시스템 도입 방식을 팀이 직접 제어할 수 있도록 합니다. 과거 지원 데이터를 분석해 은행이 처리하는 고객 문제 유형과 그 발생 빈도를 파악합니다. 그런 다음 팀은 낮은 위험의 워크플로부터 시작해 시간이 지나며 범위를 넓혀 가면서 AI가 처리할 카테고리를 선택할 수 있습니다.

의심스러운 결제를 확인하기 위한 단계별 지침이 포함된 “사기 가장 콜백” 절차를 보여주는 은행 지원 툴의 대시보드 인터페이스로, 오른쪽에는 AI 에이전트와 고객 간 신원 확인 및 계정 보호를 위한 인증 코드 전송 메시지가 포함된 실시간 통화 기록이 표시됩니다.

정식 운영에 앞서 고객은 다양한 시나리오에서 시스템이 어떻게 응답하는지 시뮬레이션할 수 있으며, 이를 통해 시스템이 기대한 대로 작동한다는 신뢰를 얻을 수 있습니다. 

배포는 일반적으로 일부 트래픽에서 시작되며, 지속적인 모니터링과 자동 점검을 통해 사람의 검토가 필요한 대화를 식별합니다. 이후 시스템이 안정적인 성능을 입증함에 따라 적용 범위가 점차 확대됩니다.

도입 첫날부터 입증되는 효과, 그리고 앞으로의 방향

Gradient Labs 고객들은 최대 98%에 달하는 고객 만족도(CSAT)를 보고했으며, 일부 사례에서는 최고의 인간 상담원을 능가하는 성과를 보였습니다. 또한 대부분의 도입 사례에서 첫날부터 50% 이상의 해결률을 기록했으며, 이는 분쟁 처리, 계정 인증, 사기 대응과 같은 복잡한 워크플로에서도 마찬가지입니다. 

이러한 성과는 회사의 성장으로 이어지고 있습니다. Gradient Labs는 지난 1년 동안 매출이 10배 이상 증가했으며, 수신 지원을 넘어 발신 업무와 백오피스 프로세스까지 영역을 확장하고 있습니다.

앞으로 Gradient Labs는 상호작용 간에도 컨텍스트를 이어갈 수 있는 시스템에 집중하고 있습니다. 고객의 이력을 이해하고, 진행 중인 이슈를 추적하며, 이전 대화가 끝난 지점에서 자연스럽게 이어가는 것입니다. 이러한 방향은 OpenAI와의 장기적인 협력에 대한 Gradient Labs의 전략과도 긴밀하게 맞닿아 있습니다.

“우리는 지금을 위한 모델만 선택하는 것이 아닙니다. 추론 모델의 발전 방향이 우리 제품의 방향성과 일치한다고 보고, 그 위에 플랫폼을 구축하고 있습니다.”
Danai Antoniou, Gradient Labs 공동 창립자 겸 최고 과학 책임자

모델이 계속 발전함에 따라 안전하게 자동화할 수 있는 절차의 범위도 점점 확대되고 있습니다. Gradient Labs에게 이는 모든 고객 상호작용을 최상위 수준의 인간 상담원과 동일한 일관성, 판단력, 그리고 연속성으로 처리하는 시스템에 한 걸음 더 가까워지고 있음을 의미합니다.