Audio & Speech Processing
오디오 음성 처리

Audio & Speech Processing
오디오 음성 처리
오디오 및 음성 처리는 음성 인식, 음성 합성, 화자 인식, 음향 이벤트 감지 등 소리 신호를 분석하고 생성하는 인공지능 분야입니다. 본 연구실에서는 딥러닝 기반의 음성 처리 기술과 멀티모달 생체신호 분석 연구를 수행합니다.
특히 멀티모달 생체신호로부터 음성을 합성하는 기술, 수면 사운드 분석, 음향 이벤트 감지 등의 연구를 진행하고 있으며, 과학기술정보통신부의 사람중심인공지능핵심원천기술개발 사업(XVoice)에 참여하고 있습니다.
Key Technologies
본 연구 분야에서 활용하는 핵심 기술 스택
Research Topics
주요 연구 주제 및 세부 연구 분야
멀티모달 음성 합성
EEG, EMG 등 생체신호로부터 자연스러운 음성을 합성하는 기술 연구
수면 사운드 분석
코골이, 수면무호흡 등 수면 중 소리 분석을 통한 수면 상태 분류
음향 이벤트 감지
환경음 분류, 비명/위험 소리 탐지, 실내 환경 모니터링
화자 인식
음성을 통한 화자 식별 및 검증 기술 연구
음성 품질 향상
잡음 제거, 음성 향상, 대역폭 확장 등 음질 개선 연구
주요 성과
- XVoice: 멀티모달 음성 메타학습 (과기정통부, 47.5억원)
- 수면 사운드 분석 AI 모델 구축 (베러마인드)
- VOICE AI Workshop 2021, 2022 Chair
- 멀티모달 생체신호 기반 음성 합성 기술 연구
- 다차원 텐서 기반 특징 선택 기법 개발
대표 연구과제
- XVoice: 멀티모달 음성 메타학습
- 수면사운드 분석을 위한 인공지능 모델 구축
Related Publications
오디오 음성 처리 분야와 관련된 논문 총 8편
International Journals3
Melanoma classification using generative adversarial network and proximal policy optimization
Xiangui Ju, Chi-Ho Lin, Suan Lee, and Sizheng Wei
Photochemistry and Photobiology, 2024 (IF: 2.6)
Talking human face generation: A survey.
Mukhiddin Toshpulatov, Wookey Lee, and Suan Lee
Expert Systems with Applications, June 2023 (IF: 8.665, JCR: Q1)
Biosignal Sensors and Deep Learning-Based Speech Recognition: A Review
Wookey Lee, Jessica J. Seong, Busra Ozlu, Bong S. Shim, Azizbek Marakhimov, and Suan Lee.
Sensors, February 2021 (IF: 3.275, JCR: Q1)
International Conferences3
Noise-Robust Sleep States Classification Model Using Sound Feature Extraction and Conversion
Sangkeun Ko, Seongho Min, Ye Shin Choi, Woo-Je Kim, and Suan Lee
2024 IEEE International Conference on Big Data and Smart Computing (BigComp), February 2024
Multilingual Speech Synthesis for Voice Cloning
Jiwon Seong, WooKey Lee, and Suan Lee
2021 IEEE International Conference on Big Data and Smart Computing (BigComp), January 17-20, 2021
A Study on the Voice Security System Using Sensor Technology
Jessica Jiwon Seong, Steve Siheon Cho, Allen Hyojun Lee, Suan Lee, Wookey Lee
Industrial Security - eGovernance Vision and Strategy (ISComp2020), February 19, 2020
국내 학술대회1
수면 소리 특징과 컨볼루션 신경망을 이용한 상태 분류 모델
민성호, 최예신, 김우제, 이수안
한국소프트웨어종합학술대회, 한국정보과학회, 2023년 12월
