[논문 리뷰] Nurture-First Agent Development: Building Domain-Expert AI Agents Through Conversational Knowledge Crystallization
TL;DR
AI 에이전트 개발 시, 기존의 코드 중심(Code-First) 또는 프롬프트 중심(Prompt-First) 접근법은 도메인 전문가의 깊고 암묵적인 지식을 통합하는 데 한계가 있습니다. 본 논문은 **'양육 우선 개발(Nurture-First Development, NFD)'**이라는 새로운 패러다임을 제안합니다. NFD는 에이전트를 최소 기능으로 시작해, 도메인 전문가와의 지속적인 대화와 상호작용을 통해 점진적으로 성장시키는 방법론입니다. 이 과정에서 에이전트는 대화 속 암묵적 지식을 구조화된 자산으로 **'결정화(Crystallize)'**하여 내재화합니다. 이를 통해 복잡한 전문 분야에서도 인간 전문가와 함께 진화하는 고도로 특화된 AI 에이전트를 구축할 수 있으며, 법률, 의료, 금융 등 다양한 분야에 적용될 수 있습니다.
연구 배경 및 동기
현대의 AI 에이전트 개발은 두 가지 주요 접근법의 한계에 직면해 있습니다.
- 코드 중심(Code-First) 접근법: 정교한 알고리즘과 코드를 통해 에이전트를 구축합니다. 이는 명시적 규칙으로 정의된 작업에는 뛰어나지만, 전문가의 직관이나 경험 같은 **암묵적 지식(Tacit Knowledge)**을 담아내기 어렵습니다. 마치 모든 상황을 미리 예측하여 법전을 만드는 것과 같습니다.
- 프롬프트 중심(Prompt-First) 접근법: 거대 언어 모델(LLM)에 정교한 초기 프롬프트를 제공하여 에이전트의 행동을 정의합니다. 이는 유연성이 높지만, 지식이 프롬프트에 고정되어 있어 지속적인 학습과 환경 변화에 대한 적응이 어렵습니다. 한 번 상세한 지침서를 준 후에는 업데이트가 힘든 것과 유사합니다.
이러한 한계를 극복하기 위해, 본 연구는 AI 에이전트를 '개발'하는 대상이 아닌 '양육'하는 파트너로 바라보는 관점을 제안합니다. NFD는 도메인 전문가와의 지속적인 대화를 통해 에이전트가 경험을 쌓고, 그 경험으로부터 일반화된 원칙과 노하우를 학습(결정화)하여 스스로 성장하는 혁신적인 방법론입니다.
관련 연구
기존 에이전트 개발 연구는 주로 코드, 프롬프트, 또는 이 둘을 결합한 하이브리드 방식에 집중되어 왔습니다. 최근에는 RAG(Retrieval-Augmented Generation)를 통해 외부 지식베이스를 참조하는 방식도 활발히 연구되고 있으나, 이는 지식을 '참조'할 뿐 에이전트가 지식을 '내재화'하고 일반화하는 데는 한계가 있습니다. NFD는 이러한 접근법들과 달리, 상호작용을 통해 지식을 동적으로 생성하고 내재화하는 새로운 차원을 제시합니다.
| 접근법 | 핵심 아이디어 | 지식 통합 방식 | 한계점 |
|---|---|---|---|
| 코드 중심 | 하드코딩된 로직과 알고리즘 | 명시적 프로그래밍 | 암묵적 지식 처리 불가, 경직성 |
| 프롬프트 중심 | 정교한 초기 프롬프트(Meta-prompt) | 프롬프트 내 정적 주입 | 지속적인 지식 업데이트 및 적응의 어려움 |
| RAG 기반 | 외부 데이터베이스에서 정보 검색 | 런타임 시 동적 정보 검색 | 지식을 내재화하거나 일반화하지 못함 |
| NFD (본 논문) | 대화를 통한 양육 및 진화 | 지속적인 대화로부터 지식 결정화 | 정적 한계를 극복하고 지식을 내재화 |
핵심 기여
- Nurture-First Development (NFD) 패러다임 제안: 기존 개발 방법론의 한계를 넘어, 전문가와의 상호작용을 통해 AI 에이전트를 '양육'하는 새로운 개발 패러다임을 제시합니다.
- 지식 결정화 주기 (Knowledge Crystallization Cycle) 정의: 대화 속 암묵적 지식을 명시적이고 구조화된 자산(원칙, 규칙, 도구)으로 변환하는 4단계 주기적 프로세스를 공식화했습니다.
- 3계층 인지 아키텍처 (Three-Layer Cognitive Architecture) 설계: 에이전트의 지식을 변동성과 추상화 수준에 따라 헌법적, 기술적, 경험적 계층으로 나누어 체계적으로 관리하는 구조를 제안합니다.
- 실증적 효과 입증: 실제 금융 리서치 에이전트 개발 사례를 통해 NFD가 기존 방법론 대비 우수한 성능과 적응성을 보임을 입증했습니다.
제안 방법론: Nurture-First Development (NFD)
NFD는 최소 기능의 에이전트(Minimum Viable Agent)로 시작하여, 전문가와의 상호작용을 통해 지식과 능력을 점진적으로 확장하는 방법론입니다. 그 핵심에는 지식 결정화 주기와 3계층 인지 아키텍처가 있습니다.
지식 결정화 주기 (Knowledge Crystallization Cycle)
이는 대화 로그(경험)를 분석하여 일반화된 지식 조각(Knowledge Nugget)을 추출하고, 이를 에이전트의 핵심 지식베이스에 통합하는 4단계 과정입니다.
-
대화 및 경험 (Dialogue & Experience): 전문가가 에이전트와 특정 과업을 수행하며 대화합니다. 이 모든 상호작용은 로그로 기록됩니다.
예시 (금융 분석가와 에이전트) 전문가: "반도체 주식을 분석할 때, 단순히 매출만 보지 말고 수주잔고(Book-to-Bill Ratio)를 확인해줘. 그게 1.1 이상이면 매우 긍정적인 신호야." 에이전트: "알겠습니다. 반도체 주식 분석 시, 수주잔고 비율 1.1 이상을 핵심 긍정 지표로 고려하겠습니다."
-
성찰 및 패턴 발견 (Reflection & Pattern Discovery): 시스템(또는 개발자)이 대화 로그를 검토하며 반복되는 패턴이나 중요한 휴리스틱을 발견합니다.
패턴 발견: "전문가는 특정 산업군을 분석할 때, 범용적인 재무 지표 외에 산업 특화 지표(Industry-Specific Metric)를 중요하게 활용한다."
-
지식 공식화 (Knowledge Formalization): 발견된 패턴을 구조화된 형식(예: JSON, YAML)이나 실행 가능한 코드(예: 새로운 분석 함수)로 명시화합니다.
- rule: "analyze_semiconductor_stocks" domain: "finance.semiconductor" trigger: "analysis_request" condition: metric: "book_to_bill_ratio" operator: ">=" value: 1.1 action: type: "add_insight" priority: "high" content: "Strong positive signal based on Book-to-Bill Ratio." -
지식베이스 통합 (Integration into Knowledge Base): 공식화된 지식을 3계층 아키텍처의 적절한 위치(주로 기술적 계층)에 통합하여 에이전트의 기본 능력으로 내재화합니다.
3계층 인지 아키텍처
이 아키텍처는 인간의 기억 체계와 유사하게 지식을 관리합니다.
- 헌법적 계층 (Constitutional Layer): 에이전트의 정체성, 핵심 원칙, 윤리 강령 등 가장 변하지 않는 최상위 지식. (예: "항상 데이터에 기반하여 객관적인 분석을 제공한다.")
- 기술적 계층 (Technical Layer): 특정 작업을 수행하기 위한 기술, 도구, 규칙, 절차 등 재사용 가능한 지식. 위에서 결정화된 '수주잔고 분석 규칙'이 여기에 해당합니다.
- 경험적 계층 (Experiential Layer): 사용자와의 개별 대화 기록, 피드백 등 단기적이고 휘발성이 높은 지식. 이 계층의 데이터가 지식 결정화 주기의 원료가 됩니다.
핵심 수식
-
에이전트 지식 상태: 특정 시점 에서 에이전트의 전체 지식 는 세 계층의 지식을 포함하는 상태로 정의됩니다. 여기서 는 세 계층의 지식을 포함하는 에이전트의 전체 지식 상태를 나타냅니다.
-
경험 축적: 새로운 대화 가 발생하면 경험적 계층이 업데이트됩니다.
-
지식 결정화: 결정화 함수 는 경험적 계층 를 입력받아 기술적 계층과 헌법적 계층을 업데이트할 지식 조각()을 생성합니다.
실험 설정
NFD의 효과를 검증하기 위해 금융 리서치 에이전트 개발 사례 연구를 진행했습니다. 에이전트의 과제는 특정 산업군(예: 반도체, 바이오)에 대한 투자 보고서 초안을 작성하는 것이었습니다.
| 파라미터 | 값 | 근거 |
|---|---|---|
| 초기 지식 | 기본적인 금융 용어, API 호출 도구 | 최소 기능의 '신생아' 상태에서 시작 |
| 결정화 주기 | 주 1회 (자동 리뷰) + 전문가 요청 시 (수동) | 자동화와 전문가의 적시 개입 간 균형 |
| 평가 지표 | 보고서 정확도(F1-Score), 전문가 만족도(리커트 척도), 피드백 반영률(%) | 정량적 및 정성적 평가 동시 진행 |
베이스라인 모델로는 정교한 프롬프트로 설계된 Prompt-First 에이전트와 외부 금융 데이터베이스를 활용하는 RAG 기반 에이전트를 사용했습니다.
실험 결과 분석
실험 결과, NFD 에이전트는 두 베이스라인 모델에 비해 모든 평가 지표에서 월등한 성능을 보였습니다. 특히, 시간이 지남에 따라 전문가의 분석 스타일과 노하우를 학습하여 보고서의 질이 점진적으로 향상되는 '성장' 패턴을 명확하게 나타냈습니다.
| 모델 | 보고서 정확도 (F1-Score) | 피드백 반영률 | 전문가 만족도 (5점 만점) |
|---|---|---|---|
| Prompt-First | 0.72 | 65% | 3.2 |
| RAG 기반 | 0.78 | 75% | 3.8 |
| NFD 에이전트 | 0.85 | 92% | 4.6 |
Ablation study를 통해 결정화 주기의 중요성을 확인했습니다. 결정화 주기를 월 1회로 늘렸을 때, NFD 에이전트의 성능이 약 8% 감소했으며, 이는 지식의 시의적절한 업데이트가 성능에 직접적인 영향을 미침을 시사합니다. 또한, 전문가들은 에이전트가 과거 대화나 분석을 기억하고 현재 논의에 활용하는 능력이 자신의 사고 과정을 되짚어보는 데 큰 도움이 되었다고 평가했습니다.
비판적 평가
강점:
- 지속적인 성장: 일회성 설정이 아닌, 상호작용을 통해 에이전트가 지속적으로 진화하고 성장할 수 있는 프레임워크를 제공합니다.
- 암묵적 지식의 자산화: 전문가의 머릿속에만 있던 암묵적 지식을 명시적이고 재사용 가능한 자산으로 변환합니다.
- 높은 도메인 특화성: 특정 전문가나 팀의 고유한 업무 방식과 노하우를 에이전트에게 효과적으로 전수할 수 있습니다.
한계 및 추가 연구 필요성:
- 결정화 프로세스의 자동화: 현재는 인간의 개입이 필요한 반자동화된 결정화 과정을 완전 자동화하기 위한 연구가 필요합니다.
- 초기 부트스트래핑 문제: 전문가의 참여를 유도할 초기 '최소 기능 에이전트'의 성능 수준을 어떻게 설정할 것인가에 대한 가이드라인이 필요합니다.
- 확장성: 여러 전문가와 여러 에이전트가 상호작용하는 대규모 환경에서의 지식 충돌 및 통합 문제에 대한 연구가 요구됩니다.
향후 연구 방향
- 자동화된 지식 추출 알고리즘: 대화 로그에서 자동으로 지식 후보를 추출하고 공식화하는 알고리즘 개발.
- 조직 지식 네트워크: 여러 에이전트와 전문가가 참여하여 지식을 공유하고 함께 성장하는 조직 단위의 지식 생태계 구축.
- 결정화된 지식의 품질 평가: 생성된 지식 조각의 유효성과 품질을 자동으로 평가하는 메트릭 개발.
실무 적용 가이드
NFD를 실무에 도입하기 위한 단계별 가이드는 다음과 같습니다.
- '최소 기능 에이전트(Minimum Viable Agent)'로 시작하기: 기본적인 도구 사용 능력과 대화 능력을 갖춘 에이전트를 만듭니다.
- 전문가-에이전트 페어링 및 대화 로그 확보: 핵심 도메인 전문가를 지정하여 에이전트와 실제 업무를 함께 수행하게 하고, 모든 상호작용을 기록합니다.
- 반자동화된 결정화 파이프라인 구축: 정기적으로(예: 주 1회) 대화 로그를 리뷰하고, 전문가와 함께 중요한 지식을 추출하여 공식화하는 프로세스를 마련합니다.
- 지식베이스의 버전 관리: 에이전트의 기술적/헌법적 지식베이스를 Git과 같이 버전 관리하여 변경 사항을 추적하고 필요시 롤백할 수 있도록 합니다.
결론
본 논문은 AI 에이전트 개발의 패러다임을 '정적 프로그래밍'에서 '동적이고 지속적인 양육'으로 전환할 것을 제안합니다. NFD는 도메인 전문가가 자신의 지식과 경험을 AI에 직접 불어넣어 함께 성장하는 파트너를 만들 수 있는 길을 열어줍니다. 이를 통해 복잡하고 끊임없이 변화하는 전문 분야의 요구사항에 효과적으로 대응하는 차세대 도메인 전문가 AI 에이전트를 구축할 수 있을 것입니다.
참고 자료
- 논문 링크: arXiv:2603.10808
- 코드 저장소: GitHub Repository
- 관련 자료: Additional Resources

![[논문 리뷰] Nurture-First Agent Development: Building Domain-Expert AI Agents Through Conversational Knowledge Crystallization](/assets/images/blog/20260312-paper-2603-10808-nurture-first-agent-developmen.jpg)