
음성을 분석해 스트레스를 측정하는 기술이 개발됐다. 스마트폰 등 개인 디지털 기기를 통해 실시간으로 스트레스를 측정하고 관리할 수 있는 길이 열렸다.
분당서울대병원은 김정현 정신건강의학과 교수 연구팀(분당서울대병원·서울대학교 뉴미디어통신공동연구소 공동연구)이 음성 기반 스트레스 측정 모델을 개발했다고 6일 밝혔다.
적절한 스트레스는 에너지와 집중력을 높이는 긍정적 효과를 주지만, 만성 스트레스는 정신질환, 심혈관질환, 암 등 건강문제를 일으킬 수 있다. 기존의 스트레스 측정은 주관적인 설문조사나 호르몬 검사에 의존해왔다. 연구팀은 근육 긴장과 호흡 변화가 목소리 톤에 미치는 영향을 살펴 스트레스를 감지할 수 있다는 점에 주목했다. 이어 비언어적 음성 바이오마커를 활용해 스트레스 상태를 탐지하는 딥러닝 기반 모델을 개발하고, 한국인의 데이터를 이용해 그 유효성을 검증했다.
연구팀은 국내 다기관 임상 연구를 진행했다. 115명의 건강한 직장인을 대상으로 차가운 물에 손을 담근 상태에서 사회적 평가를 받게 하는 SECPT 기법으로 스트레스 상태를 유도했다. 이 과정에서 스트레스 전후의 음성 데이터를 수집해 주파수, 발화 속도, 패턴 등을 세밀히 비교 분석해 스트레스 수준을 예측할 수 있는 인공지능 모델을 개발했다.
이번 연구에서는 사람마다 다른 목소리의 특징을 정확히 분석할 수 있는 고성능 딥러닝 모델인 ECAPA-TDNN을 써서 정확도를 높였다. 또 신뢰성을 다지기 위해 코르티솔 검사를 병행한 교차 검증도 병행했다. 결과적으로 연구팀이 개발한 모델은 스트레스 상태를 70%의 높은 정확도로 구별할 수 있는 것으로 나타났다. 향후 대규모 데이터셋을 통해 성능을 개선할 계획이다.
연구팀이 개발한 스트레스 탐지 모델은 음성 중 대화 내용 등 언어적 정보는 배제하고, 음성 톤과 같은 비언어적 요소만 분석했다. 이로써 교육 수준, 문화적 배경, 성장 환경 등의 영향을 받지 않는 보편적 모델을 구축할 수 있었다. 모든 데이터는 로컬에서 처리되고 외부 서버로 전송되지 않기 때문에 개인정보 유출 위험을 최소화할 수 있다.
김 교수는 “개인 모바일 기기에서 주기적으로 스트레스 수준을 확인할 수 있다면 높은 스트레스가 감지될 경우 심호흡, 명상, 운동 등 완화기법을 사용하거나 필요 시 병원을 찾는 등 적절하게 대처해 정신건강 관리에 도움을 받을 수 있을 것”이라며 “스트레스 탐지 모델의 정확도를 높이기 위해 다양한 음성 데이터와 심박 변이도, 피부 전기활동 같은 생체신호와 결합하는 연구도 진행할 것”이라고 전했다.
이번 연구 결과는 대한신경정신의학회 학술지인 ‘Psychiatry Investigation’ 최신 호에 게재됐다.