S

Research Trends

Summary Report

한국어 보이스피싱(VP) 탐지를 위한
멀티뷰 그래프 대조 학습의 진화

한국어 보이스피싱(Voice Phishing) 사기가 급증하는 가운데, 기존 단일 모달리티의 한계를 극복하기 위한 Contrastive Multi-view Graph Representation Learning 기법이 핵심적인 해결책으로 부상하고 있습니다. 이 방식은 통화 네트워크와 사용자 상호작용을 텍스트, 오디오, 행동 패턴 등 다양한 뷰로 구조화하여 자기 지도 학습을 수행합니다.

특히 KoBERT와 MFCC 특징을 융합한 Multimodal Graph Construction은 실시간 통화 환경에서 95%의 F1-score를 기록했으며, Llama3-Korean 및 GPT-4o와 같은 최신 LLM을 결합한 연구는 사기 탐지 정확도를 최대 98%까지 끌어올렸습니다. 이러한 기술은 피해 규모를 20% 이상 감축할 잠재력을 지니며, 실시간 모니터링 플랫폼 ASAP과 같은 시스템을 통해 실무에 적용되고 있습니다.

Key Metrics

  • Detection Accuracy 98%
  • False Positive Reduction -13%
  • Expected Impact (Damage Reduction) 20%+

ScriptMind: A Crime Script Graph Neural Network for Next Utterance Prediction in Voice Phishing

범죄 스크립트 그래프를 사용하여 다음 발화를 예측함으로써 한국어 보이스피싱 탐지에서 98%의 정확도를 입증한 혁신적인 연구입니다.

원문 보기

Enhanced Voice Phishing Detection Using an LLM-Based Framework

Llama3와 GPT-4o를 활용한 데이터 증강 및 분류 프레임워크를 제안하여, 불균형 데이터셋에서도 오탐률을 13% 감소시키는 뛰어난 성과를 보여줍니다.

원문 보기

A Multimodal Voice Phishing Detection System Integrating Text and Audio Analysis

텍스트와 오디오 데이터를 결합하여 CNN-BiLSTM 모델을 통해 특징을 추출하는 멀티모달 시스템으로, 한국어 데이터셋에서 F1 95%의 높은 신뢰도를 달성했습니다.

원문 보기

Multi-view learning with graph convolution networks

다양한 그래프 구조와 심층 특징 융합을 채택한 GCN 기반 멀티뷰 학습 기법으로, 복잡한 사용자 관계망 내의 이상 징후를 효과적으로 식별합니다.

원문 보기

향후 전망 및 기술 확장성

연구는 향후 딥페이크 보이스 탐지와 대규모 한국어 데이터셋 기반의 LLM(GPT-4o) 결합을 통해 실시간 탐지 효율성을 극대화하는 방향으로 나아가고 있습니다.

정부 및 금융 기관과의 협력을 통해 ASAP과 같은 플랫폼을 전국적으로 확대 적용함으로써, 보이스피싱 피해를 획기적으로 줄이는 사회적 안전망 구축이 기대됩니다.