Natural Language Processing

자연어처리

Natural Language Processing

Natural Language Processing

자연어처리

자연어처리(NLP)는 인간의 언어를 컴퓨터가 이해하고 생성할 수 있게 하는 인공지능의 핵심 분야입니다. 본 연구실에서는 대규모 언어 모델(LLM), Text-to-SQL, 질의응답 시스템, 문서 요약, 감성 분석 등 다양한 NLP 태스크를 연구합니다.

특히 GPT, BERT, LLaMA 등 최신 언어 모델을 활용한 실용적인 응용 시스템 개발에 주력하고 있으며, 한국어 자연어처리에 특화된 연구도 진행하고 있습니다.

NLP
LLM
GPT
BERT
Text-to-SQL
RAG
Sentiment Analysis
NER
Question Answering
Korean NLP

Key Technologies

본 연구 분야에서 활용하는 핵심 기술 스택

Large Language Models (GPT-4, Claude, LLaMA)
BERT, RoBERTa, ELECTRA
Hugging Face Transformers
LangChain & LlamaIndex
RAG (Retrieval-Augmented Generation)
Text-to-SQL & Semantic Parsing
Named Entity Recognition (NER)
Sentiment Analysis
Text Summarization
Korean NLP (KoBERT, KoGPT)

Research Topics

주요 연구 주제 및 세부 연구 분야

01

Text-to-SQL

자연어 질의를 SQL 쿼리로 자동 변환하는 시맨틱 파싱 연구

02

RAG 시스템

검색 증강 생성(RAG) 기반 지식 기반 질의응답 시스템 개발

03

LLM 파인튜닝 & 프롬프트 엔지니어링

도메인 특화 언어 모델 학습 및 효과적인 프롬프트 설계 연구

04

문서 이해 & 정보 추출

NER, 관계 추출, 이벤트 추출 등 문서 분석 기술 연구

05

한국어 자연어처리

한국어 특성을 고려한 형태소 분석, 개체명 인식, 감성 분석 연구

주요 성과

  • 금융 특화 Text-to-SQL 솔루션 개발
  • AI 기반 공무원 학습지원 플랫폼 개발
  • 언어모델 기반 SQL 생성 기술 자문
  • AI 기반 추천 시스템 자문 다수

대표 연구과제

  • 금융분야 환경에 대응 가능한 생성형 언어모델 기반 Text-to-SQL 솔루션 서비스
  • 대규모 언어 모델 기반 공무원 수험생의 AI 학습지원 플랫폼
  • 언어모델 기반 SQL 생성 기술 자문

Related Publications

자연어처리 분야와 관련된 논문 총 35

International Journals
2

[SSCI]

Analyzing social media reactions to the FTX crisis: Unraveling the spillover effect on crypto markets

Chunsik Lee, Suan Lee, et al.

Journal of Contingencies and Crisis Management, June 2024 (IF: 3.42)

[SSCI]

PatentNet: multi-label classification of patent documents using deep learning based language understanding.

Haghighian Roudsari, Arousha, Jafar Afshar, Wookey Lee, and Suan Lee

Scientometrics, January 2022 (IF: 3.238, JCR: Q1)

International Conferences
6

Comparison and Analysis of Embedding Methods for Patent Documents

Arousha Haghighian Roudsari, Jafar Afshar, Suan Lee, and Wookey Lee

Big Data and Smart Computing (BigComp), 2021 IEEE International Conference on. IEEE, 2021., January 17-20, 2021

Patent Prior Art Search using Deep Learning Language Model

Dylan Myungchul Kang, Charles Cheolgi Lee, Suan Lee, and Wookey Lee

24th International Database Engineering & Applications Symposium (IDEAS 2020), August 2020

Prior Art Search Using Multi-Modal Embedding of Patent Documents

Myungchul Kang, Suan Lee, and Wookey Lee

The 3rd International Workshop on Dialog Systems (IWDS2020) 2020., February 19, 2020

Design and Development of Visualization Tool for Movie Review and Sentiment Analysis

Young Seok You, Suan Lee, and Jinho Kim

Proceedings of the Sixth International Conference on Emerging Databases: Technologies, Applications, and Theory. ACM, 17-19 Oct. 2016

A Multi-Dimensional Analysis and Data Cube for Unstructured Text and Social Media.

Suan Lee, Namsoo Kim, and Jinho Kim.

Big Data and Cloud Computing (BdCloud), 2014 IEEE Fourth International Conference on. IEEE, 3-5 Dec. 2014

SAMSTAR: An Automatic Tool for Generating Star Schema from Entity-Relationship Diagram

Il-Yeol Song, Ritu Khare, Yuan An, Suan Lee, Sang-Pil Kim, Jinho Kim, and Yang-Sae Moon

International Conference on Conceptual Modeling. Springer Berlin Heidelberg, 2008

국내 학술지
6

LLM as a Search: 사용자 의도 분석을 통한 지능형 법률 문서 검색

김재성, 고수윤, 정진근, 이수안

정보과학회 컴퓨팅의 실제 논문지, 한국정보과학회, 2025

강화학습을 활용한 소규모 언어 모델 기반 Text-to-SQL 성능 향상

김동후, 이수안

데이터베이스연구, 한국정보과학회, 2025

후반 레이어 Pruning과 다단계 Fine-tuning을 통한 한국어 언어 모델의 효율적 경량화

김재성, 이수안

정보과학회논문지, 한국정보과학회, 2025

Step-by-Step과 Self-Debug 방식을 통한 Text-to-SQL 모델의 성능 향상

김재성, 이수안

데이터베이스연구, 한국정보과학회, 2024

Word2Vec으로 생성한 유의어 사전을 이용한 그래프 기반 문서 요약

박찬민, 이수안, 김진호

정보통신논문지, 2017년

클라우드 환경에서 전자문서 관리 및 가상 스토리지 시스템 기술

이수안, 최재용, 강상원, 이기준, 한명훈, 김진호

정보화연구, 한국엔터프라이즈아키텍처학회, 2016년 03월 30일

국내 학술대회
20

멀티뷰 Video-LLM 기반 기업 IR 발표 영상 자동 분석 및 평가 시스템

김혜진, 임채환, 이수안

한국소프트웨어종합학술대회, 한국정보과학회, 2025년 12월

한국어 완곡 코팅을 통한 LLM 안전성 우회 분석

길상현, 김재성, 이수안

한국소프트웨어종합학술대회, 한국정보과학회, 2025년 12월

생성형 대규모 언어 모델을 활용한 계약서 요약 및 독소 조항 탐지

서명관, 이수안

추계학술대회논문집, 대한전자공학회, 2025년 11월

한국 세법 질의응답을 위한 VectorDB-GraphDB 하이브리드 검색 기반 RAG 시스템

최윤성, 이수안

추계학술대회논문집, 대한전자공학회, 2025년 11월

강화학습을 통한 소규모 언어 모델 기반의 효율적인 Text-to-SQL 모델

김동후, 이수안

한국컴퓨터종합학술대회, 한국정보과학회, 2025년 07월

대규모 언어 모델을 이용한 진로 성숙도 검사 서술형 응답 자동 분석 및 피드백 생성

김병학, 이수안

한국컴퓨터종합학술대회, 한국정보과학회, 2025년 07월

MCP를 이용한 LLM 기반 적응형 크롤링과 문서 분석을 위한 자동화 워크플로우 아키텍처 설계

길상현, 이동혁, 유재익, 이수안

한국컴퓨터종합학술대회, 한국정보과학회, 2025년 07월

K-GovExam: 한국 공무원 시험 기반 LLM 평가용 데이터셋 구축 및 추론 언어 모델 분석

김재성, 이수안

한국컴퓨터종합학술대회, 한국정보과학회, 2025년 07월

KO-SmallThinker: Reasoning 기반 소형 언어 모델을 활용한 초거대 언어 모델의 성능 한계 극복

김재성, 이수안

한국컴퓨터종합학술대회, 한국정보과학회, 2025년 07월

Depth-Up Scaling을 활용한 언어 모델 증강과 소규모 데이터 학습 성능 비교

김재성, 이수안

한국소프트웨어종합학술대회, 한국정보과학회, 2024년 12월

Image Captioning과 Visual Question Answering를 이용한 위성 이미지 기반 도시 변화 탐지 모델

임채환, 이수안

한국컴퓨터종합학술대회, 한국정보과학회, 2024년 06월

사전 학습된 대규모 언어 모델을 이용한 주식 예측

서세일, 이수안

한국컴퓨터종합학술대회, 한국정보과학회, 2024년 06월

법률 QA데이터셋을 이용한 거대 언어 모델 학습

김재성, 김강준, 이수안

한국컴퓨터종합학술대회, 한국정보과학회, 2024년 06월

ChatGPT와 DALL-E 3 기반의 AI 생성 모델을 활용한 AR 공간 내의 NPC 생성 및 활용

임채환, 이수형, 이동근, 이수안

한국소프트웨어종합학술대회, 한국정보과학회, 2023년 12월

재난 분류를 위한 트윗 데이터 분석 및 언어 모델

황민정, 이수안

한국소프트웨어종합학술대회, 한국정보과학회, 2023년 12월

서로 다른 언어 모델의 상징적 지식 증류를 이용한 경량화된 감정 분석 모델

김재성, 이수안

한국소프트웨어종합학술대회, 한국정보과학회, 2023년 12월

한국어 혐오 발언 댓글 분류를 위한 언어 모델별 비교

어식, 배인수, 이수안

한국소프트웨어종합학술대회, 한국정보과학회, 2023년 12월

한국어 논문 요약을 위한 KoBART와 KoBERT 모델 비교

전제성, 이수안

제34회 한글 및 한국어 정보처리 학술대회, 한국정보과학회, 2022년 10월

선행기술조사를 위한 딥러닝 언어 모델 기반 특허 문서 분류

강명철, 이철기, 이수안, 이우기

2020 춘계학술대회, 한국지식재산교육연구학회, 2020년 06월

빅데이터 기술을 이용한 자유학기제 운영 실태 보고서 문서 분석

김민규, 이수안, 김진호, 신혜숙

한국컴퓨터종합학술대회, 한국정보과학회, 2018년 12월

Related Courses

이 연구 분야와 관련된 강의