[쿠키과학] '안전성 내재화한 시각언어모델'… ETRI, AI 위험 자동판별 'Safe LLaVA' 공개
한국전자통신연구원(ETRI)이 생성형 인공지능 모델 안에 안전성 기능을 구조적으로 내장한 새로운 시각언어모델 ‘세이프 라바(Safe LLaVA)’를 26일 공개했다. 이번 기술은 기존처럼 데이터를 부풀려 모델을 고치는 방식이 아닌, 20여 종의 안전성 기준을 모델 내부에 직접 심는 구조로 개발된 것이 특징이다. 이를 통해 모델이 문제 있는 입력을 받으면 위험 여부를 스스로 판단하고, 안전한 답변과 그 이유를 함께 제시할 수 있게 했다. 이는 기존 ‘데이터 중심 파인튜닝’보다 한 단계 진화한 안전 설계 방식이다. E... [이재형]


![[쿠키과학] '초소형 홀추력기 검증 임무'… KAIST ‘K-HERO’ 누리호에 실린다](https://kuk.kod.es/data/kuk/image/2025/11/26/kuk20251126000179.300x169.0.jpg)
![[쿠키과학] '질량·구조·광학 정보를 동시에'… KBSI, '표면 이성질체 분석장비' 최초 개발](https://kuk.kod.es/data/kuk/image/2025/11/25/kuk20251125000192.300x169.0.jpg)
