Natural Language Processing
자연어처리

Natural Language Processing
자연어처리
자연어처리(NLP)는 인간의 언어를 컴퓨터가 이해하고 생성할 수 있게 하는 인공지능의 핵심 분야입니다. 본 연구실에서는 대규모 언어 모델(LLM), Text-to-SQL, 질의응답 시스템, 문서 요약, 감성 분석 등 다양한 NLP 태스크를 연구합니다.
특히 GPT, BERT, LLaMA 등 최신 언어 모델을 활용한 실용적인 응용 시스템 개발에 주력하고 있으며, 한국어 자연어처리에 특화된 연구도 진행하고 있습니다.
Key Technologies
본 연구 분야에서 활용하는 핵심 기술 스택
Research Topics
주요 연구 주제 및 세부 연구 분야
Text-to-SQL
자연어 질의를 SQL 쿼리로 자동 변환하는 시맨틱 파싱 연구
RAG 시스템
검색 증강 생성(RAG) 기반 지식 기반 질의응답 시스템 개발
LLM 파인튜닝 & 프롬프트 엔지니어링
도메인 특화 언어 모델 학습 및 효과적인 프롬프트 설계 연구
문서 이해 & 정보 추출
NER, 관계 추출, 이벤트 추출 등 문서 분석 기술 연구
한국어 자연어처리
한국어 특성을 고려한 형태소 분석, 개체명 인식, 감성 분석 연구
주요 성과
- 금융 특화 Text-to-SQL 솔루션 개발
- AI 기반 공무원 학습지원 플랫폼 개발
- 언어모델 기반 SQL 생성 기술 자문
- AI 기반 추천 시스템 자문 다수
대표 연구과제
- 금융분야 환경에 대응 가능한 생성형 언어모델 기반 Text-to-SQL 솔루션 서비스
- 대규모 언어 모델 기반 공무원 수험생의 AI 학습지원 플랫폼
- 언어모델 기반 SQL 생성 기술 자문
Related Publications
자연어처리 분야와 관련된 논문 총 35편
International Journals2
Analyzing social media reactions to the FTX crisis: Unraveling the spillover effect on crypto markets
Chunsik Lee, Suan Lee, et al.
Journal of Contingencies and Crisis Management, June 2024 (IF: 3.42)
Haghighian Roudsari, Arousha, Jafar Afshar, Wookey Lee, and Suan Lee
Scientometrics, January 2022 (IF: 3.238, JCR: Q1)
International Conferences6
Comparison and Analysis of Embedding Methods for Patent Documents
Arousha Haghighian Roudsari, Jafar Afshar, Suan Lee, and Wookey Lee
Big Data and Smart Computing (BigComp), 2021 IEEE International Conference on. IEEE, 2021., January 17-20, 2021
Patent Prior Art Search using Deep Learning Language Model
Dylan Myungchul Kang, Charles Cheolgi Lee, Suan Lee, and Wookey Lee
24th International Database Engineering & Applications Symposium (IDEAS 2020), August 2020
Prior Art Search Using Multi-Modal Embedding of Patent Documents
Myungchul Kang, Suan Lee, and Wookey Lee
The 3rd International Workshop on Dialog Systems (IWDS2020) 2020., February 19, 2020
Design and Development of Visualization Tool for Movie Review and Sentiment Analysis
Young Seok You, Suan Lee, and Jinho Kim
Proceedings of the Sixth International Conference on Emerging Databases: Technologies, Applications, and Theory. ACM, 17-19 Oct. 2016
A Multi-Dimensional Analysis and Data Cube for Unstructured Text and Social Media.
Suan Lee, Namsoo Kim, and Jinho Kim.
Big Data and Cloud Computing (BdCloud), 2014 IEEE Fourth International Conference on. IEEE, 3-5 Dec. 2014
SAMSTAR: An Automatic Tool for Generating Star Schema from Entity-Relationship Diagram
Il-Yeol Song, Ritu Khare, Yuan An, Suan Lee, Sang-Pil Kim, Jinho Kim, and Yang-Sae Moon
International Conference on Conceptual Modeling. Springer Berlin Heidelberg, 2008
국내 학술지6
LLM as a Search: 사용자 의도 분석을 통한 지능형 법률 문서 검색
김재성, 고수윤, 정진근, 이수안
정보과학회 컴퓨팅의 실제 논문지, 한국정보과학회, 2025
강화학습을 활용한 소규모 언어 모델 기반 Text-to-SQL 성능 향상
김동후, 이수안
데이터베이스연구, 한국정보과학회, 2025
후반 레이어 Pruning과 다단계 Fine-tuning을 통한 한국어 언어 모델의 효율적 경량화
김재성, 이수안
정보과학회논문지, 한국정보과학회, 2025
Step-by-Step과 Self-Debug 방식을 통한 Text-to-SQL 모델의 성능 향상
김재성, 이수안
데이터베이스연구, 한국정보과학회, 2024
Word2Vec으로 생성한 유의어 사전을 이용한 그래프 기반 문서 요약
박찬민, 이수안, 김진호
정보통신논문지, 2017년
클라우드 환경에서 전자문서 관리 및 가상 스토리지 시스템 기술
이수안, 최재용, 강상원, 이기준, 한명훈, 김진호
정보화연구, 한국엔터프라이즈아키텍처학회, 2016년 03월 30일
국내 학술대회20
멀티뷰 Video-LLM 기반 기업 IR 발표 영상 자동 분석 및 평가 시스템
김혜진, 임채환, 이수안
한국소프트웨어종합학술대회, 한국정보과학회, 2025년 12월
한국어 완곡 코팅을 통한 LLM 안전성 우회 분석
길상현, 김재성, 이수안
한국소프트웨어종합학술대회, 한국정보과학회, 2025년 12월
생성형 대규모 언어 모델을 활용한 계약서 요약 및 독소 조항 탐지
서명관, 이수안
추계학술대회논문집, 대한전자공학회, 2025년 11월
한국 세법 질의응답을 위한 VectorDB-GraphDB 하이브리드 검색 기반 RAG 시스템
최윤성, 이수안
추계학술대회논문집, 대한전자공학회, 2025년 11월
강화학습을 통한 소규모 언어 모델 기반의 효율적인 Text-to-SQL 모델
김동후, 이수안
한국컴퓨터종합학술대회, 한국정보과학회, 2025년 07월
대규모 언어 모델을 이용한 진로 성숙도 검사 서술형 응답 자동 분석 및 피드백 생성
김병학, 이수안
한국컴퓨터종합학술대회, 한국정보과학회, 2025년 07월
MCP를 이용한 LLM 기반 적응형 크롤링과 문서 분석을 위한 자동화 워크플로우 아키텍처 설계
길상현, 이동혁, 유재익, 이수안
한국컴퓨터종합학술대회, 한국정보과학회, 2025년 07월
K-GovExam: 한국 공무원 시험 기반 LLM 평가용 데이터셋 구축 및 추론 언어 모델 분석
김재성, 이수안
한국컴퓨터종합학술대회, 한국정보과학회, 2025년 07월
KO-SmallThinker: Reasoning 기반 소형 언어 모델을 활용한 초거대 언어 모델의 성능 한계 극복
김재성, 이수안
한국컴퓨터종합학술대회, 한국정보과학회, 2025년 07월
Depth-Up Scaling을 활용한 언어 모델 증강과 소규모 데이터 학습 성능 비교
김재성, 이수안
한국소프트웨어종합학술대회, 한국정보과학회, 2024년 12월
Image Captioning과 Visual Question Answering를 이용한 위성 이미지 기반 도시 변화 탐지 모델
임채환, 이수안
한국컴퓨터종합학술대회, 한국정보과학회, 2024년 06월
사전 학습된 대규모 언어 모델을 이용한 주식 예측
서세일, 이수안
한국컴퓨터종합학술대회, 한국정보과학회, 2024년 06월
법률 QA데이터셋을 이용한 거대 언어 모델 학습
김재성, 김강준, 이수안
한국컴퓨터종합학술대회, 한국정보과학회, 2024년 06월
ChatGPT와 DALL-E 3 기반의 AI 생성 모델을 활용한 AR 공간 내의 NPC 생성 및 활용
임채환, 이수형, 이동근, 이수안
한국소프트웨어종합학술대회, 한국정보과학회, 2023년 12월
재난 분류를 위한 트윗 데이터 분석 및 언어 모델
황민정, 이수안
한국소프트웨어종합학술대회, 한국정보과학회, 2023년 12월
서로 다른 언어 모델의 상징적 지식 증류를 이용한 경량화된 감정 분석 모델
김재성, 이수안
한국소프트웨어종합학술대회, 한국정보과학회, 2023년 12월
한국어 혐오 발언 댓글 분류를 위한 언어 모델별 비교
어식, 배인수, 이수안
한국소프트웨어종합학술대회, 한국정보과학회, 2023년 12월
한국어 논문 요약을 위한 KoBART와 KoBERT 모델 비교
전제성, 이수안
제34회 한글 및 한국어 정보처리 학술대회, 한국정보과학회, 2022년 10월
선행기술조사를 위한 딥러닝 언어 모델 기반 특허 문서 분류
강명철, 이철기, 이수안, 이우기
2020 춘계학술대회, 한국지식재산교육연구학회, 2020년 06월
빅데이터 기술을 이용한 자유학기제 운영 실태 보고서 문서 분석
김민규, 이수안, 김진호, 신혜숙
한국컴퓨터종합학술대회, 한국정보과학회, 2018년 12월
