kor-smishing-xlmroberta
π Model Overview
kor-smishing-xlmrobertaλ
XLM-RoBERTa κΈ°λ°μ νκ΅μ΄ μ€λ―Έμ±(Smishing) νμ§ λͺ¨λΈμ
λλ€.
νκ΅μ΄ SMS λ° λ©μ μ ν
μ€νΈλ₯Ό μ
λ ₯μΌλ‘ λ°μ
ν΄λΉ λ©μμ§κ° μ€λ―Έμ±(μ¬κΈ°)μΈμ§ μ¬λΆλ₯Ό μ΄μ§ λΆλ₯νλλ‘ νμΈνλλμμ΅λλ€.
λ³Έ λͺ¨λΈμ κ³Όλν κ·μΉ(rule) κΈ°λ° ν΄λ¦¬μ€ν±μ μμ‘΄νμ§ μκ³ ,
λ₯λ¬λ λͺ¨λΈ λ¨λ
μΌλ‘λ **λμ μ λ°λ(Precision)**λ₯Ό λ¬μ±νλ κ²μ λͺ©νλ‘ μ€κ³λμμ΅λλ€.
π§ Model Architecture
- Base Model:
xlm-roberta-base - Model Type:
XLMRobertaForSequenceClassification - Task: Binary Text Classification
- Output Labels
LABEL_0: μ μ (HAM)LABEL_1: μ€λ―Έμ± (PHISH)
π Training Data Sources
λ³Έ λͺ¨λΈμ μλμ κ³΅κ° λ°μ΄ν°μ μ νμ©νμ¬ νμ΅ λ° νμΈνλλμμ΅λλ€.
1. Korean Message Dataset
- Source:
meal-bbang/Korean_message - Link: https://huggingface.co/datasets/meal-bbang/Korean_message
- Description:
νκ΅μ΄ λ¬Έμ λ©μμ§(SMS)λ₯Ό μ€μ¬μΌλ‘ ꡬμ±λ λ°μ΄ν°μ μΌλ‘,
μ μ λ©μμ§μ μ€νΈ/μ¬κΈ°μ± λ©μμ§λ₯Ό ν¬ν¨νκ³ μμ΅λλ€.
λ³Έ λͺ¨λΈμμλ μ΄κΈ° λ¨κ³μ μΈμ΄ μ μ λ° μ€λ―Έμ± νν νμ΅μ νμ©λμμ΅λλ€.
2. KOR Phishing Detect Dataset
- Source:
Ez-Sy01/KOR_phishing_Detect-Dataset - Link: https://github.com/Ez-Sy01/KOR_phishing_Detect-Dataset
- Description:
μ€μ νκ΅μ΄ μ€λ―Έμ± λ° νΌμ± μ¬λ‘λ₯Ό κΈ°λ°μΌλ‘ ꡬμΆλ λ°μ΄ν°μ μΌλ‘,
μ€λ―Έμ± νμ§ μ±λ₯ ν₯μμ μν ν΅μ¬ νμΈνλ λ°μ΄ν°λ‘ νμ©λμμ΅λλ€.
β οΈ Data Usage Note
- λ³Έ λͺ¨λΈμ 곡κ°μ μΌλ‘ μ 곡λ λ°μ΄ν°μ λ§μ μ¬μ©νμ¬ νμ΅λμμ΅λλ€.
- λ°μ΄ν°μ
μ ν¬ν¨λ κ°μΈ μλ³ μ 보(PII)λ λͺ¨λΈ νμ΅ κ³Όμ μμ μ§μ μ μΌλ‘ μ¬μ©λμ§ μμΌλ©°,
μ μ²λ¦¬ λ° μΌλ°ν κ³Όμ μ ν΅ν΄ νΉμ κ°μΈμ΄λ μ¬λ‘λ₯Ό μ¬μλ³ν μ μλλ‘ μ€κ³λμμ΅λλ€.
π Evaluation Results
λμΌν ν μ€νΈ μ κΈ°μ€μμ μλ μ±λ₯μ νμΈνμ΅λλ€.
Model-only Evaluation (threshold = 0.5)
| Metric | Score |
|---|---|
| Accuracy | 0.999 |
| Precision (PHISH) | 1.00 |
| Recall (PHISH) | 0.95 |
| F1-score (PHISH) | 0.97 |
- **False Positive(μ€ν)**λ₯Ό μ΅μννλ λ° μ€μ μ λ μ€κ³
- μ€μ μ΄μ νκ²½μμ λΆνμν μ°¨λ¨μ μ€μ΄λ κ²μ λͺ©νλ‘ ν¨
π Recommended Usage
κΈ°λ³Έ μ¬μ© μμ
from transformers import pipeline
classifier = pipeline(
"text-classification",
model="donghyun95/kor-smishing-xlmroberta",
truncation=True
)
classifier("보μ κ°νλ₯Ό μν΄ μλ λ§ν¬μ μ μν΄ μΈμ¦λ²νΈλ₯Ό μ
λ ₯νμΈμ.")
π οΈ μ΄μ νκ²½ κΆμ₯ μ λ΅
Model-only score threshold:
70
(pipeline μΆλ ₯ score Γ 100 κΈ°μ€)λͺ¨λΈ μ μκ° μ λ§€ν κ²½μ° (μ: 40 ~ 70 ꡬκ°)μλ§
μλμ κ°μ μ΅μνμ λ£°μ 보쑰μ μΌλ‘ μ μ©νλ ꡬ쑰λ₯Ό κΆμ₯ν©λλ€.- λ¨μΆ URL ν¬ν¨ μ¬λΆ
- OTP μ λ ₯ + μ€μΉ/κΆν μμ²
- μ격μ μ΄ μ± μ€μΉ μ λ
μ΄ λ°©μμ λ€μκ³Ό κ°μ μ₯μ μ κ°μ§λλ€.
- μ λ°λ(Precision)λ₯Ό μ μ§νλ©΄μ
- μ΄μ μ€ False Negativeλ₯Ό μ μ§μ μΌλ‘ 보μ κ°λ₯
β οΈ Limitations
μ κ· μ€λ―Έμ± 문ꡬ λλ μλ‘μ΄ μ¬ν곡ν ν¨ν΄μ λν΄μλ
μ±λ₯ μ νκ° λ°μν μ μμ΅λλ€.λ³Έ λͺ¨λΈμ 보μ νλ¨ λ³΄μ‘° λꡬμ΄λ©°,
μλ μ°¨λ¨λ³΄λ€λ κ²½κ³ Β·μ£Όμ μλ΄ μ©λλ‘μ μ¬μ©μ κΆμ₯ν©λλ€.
π‘οΈ Ethical Considerations
- λ³Έ λͺ¨λΈμ μ¬κΈ° νμ§ λ° μ¬μ©μ 보νΈλ₯Ό λͺ©μ μΌλ‘ μ€κ³λμμ΅λλ€.
- κ°μ, κ²μ΄, λΆλΉν μλ μ°¨λ¨μ μν μ¬μ©μ μλνμ§ μμ΅λλ€.
- μ€ν(False Positive) κ°λ₯μ±μ κ³ λ €νμ¬
μ¬μ©μ νμΈ μ μ°¨μ ν¨κ» μ¬μ©νλ κ²μ΄ λ°λμ§ν©λλ€.
π Citation
μ°κ΅¬ λλ νλ‘μ νΈμμ λ³Έ λͺ¨λΈμ νμ©νμ€ κ²½μ°,
μλμ κ°μ΄ μΈμ©ν΄ μ£ΌμΈμ.
@misc{donghyun95_kor_smishing_xlmroberta,
author = {Donghyun},
title = {Korean Smishing Detection Model based on XLM-RoBERTa},
year = {2026},
url = {https://huggingface.co/donghyun95/kor-smishing-xlmroberta}
}
π€ Author Donghyun
Hugging Face: https://huggingface.co/donghyun95
- Downloads last month
- 10