template poc, pilot, production pm 15min
AI 기능 PRD 템플릿
일반 PRD와 다른 AI 기능 PRD 작성 가이드. 비결정적 출력 범위, 품질 평가 기준, 폴백 시나리오까지 포함한 실전 템플릿을 바로 복사해서 쓸 수 있습니다.
Deliverables
Template
Summary
AI 기능 PRD는 일반 PRD와 다르게 비결정적 출력, 평가 기준, 폴백 시나리오를 명시해야 한다. 일반 소프트웨어는 “같은 입력 → 같은 출력”이지만, AI 기능은 **“같은 입력 → 다양한 출력 + 품질 범위”**다. 이 템플릿은 이러한 AI 특성을 반영한 PRD 항목을 제공한다.
When to Use
- LLM/AI 기반 신규 기능 기획 시
- 개발팀에 AI 기능 요구사항 전달 시
- AI 기능 범위 합의 및 이해관계자 사인오프 시
- PoC/Pilot 시작 전 기능 정의 시
AI PRD vs 일반 PRD
| 항목 | 일반 PRD | AI PRD |
|---|---|---|
| 출력 정의 | 정확한 출력 명세 | 출력 범위 + 품질 기준 |
| 테스트 | 단위/통합 테스트 | 평가 데이터셋 + 골든셋 |
| 성공 기준 | 기능 동작 여부 | 품질 점수 (정확도, 관련성 등) |
| 실패 처리 | 에러 핸들링 | 폴백 시나리오 + 에스컬레이션 |
| 비용 | 인프라 비용 | 토큰 비용 + API 비용 |
Template
1. 개요
기능명: [기능 이름]
버전: v1.0
작성자: [이름]
최종 수정일: [YYYY-MM-DD]
상태: [ ] 초안 / [ ] 검토 중 / [ ] 승인됨
목적
이 기능이 해결하는 문제를 구체적으로 기술하세요.
❌ "AI로 고객 서비스를 개선한다"
✅ "고객 문의 중 FAQ에 해당하는 60%를 AI가 즉시 응답하여,
평균 응답 시간을 현재 4시간에서 30초 이내로 단축한다"
배경
- 현재 상황: [현재 어떤 문제가 있는가]
- 시도한 대안: [AI 외에 검토한 방법과 채택하지 않은 이유]
- AI 선택 근거: [왜 AI가 적합한가]
성공 지표 (정량적, 측정 가능)
| 지표 | 현재값 | 목표값 | 측정 방법 |
|---|---|---|---|
| 응답 만족도 | 3.2/5.0 | 4.0/5.0 | 사용자 피드백 |
| 응답 시간 | 4시간 | 30초 | 시스템 로그 |
| 에스컬레이션 비율 | 100% | 40% | 티켓 데이터 |
2. 사용자 시나리오
타겟 사용자
- 페르소나: [예: “자주 제품 사용법을 문의하는 신규 고객”]
- 사용 빈도: [예: 일 평균 500건]
- 기술 숙련도: [예: 낮음]
주요 사용 흐름 (Happy Path)
1. 사용자가 채팅창에 질문을 입력한다
예: "환불 정책이 어떻게 되나요?"
2. 시스템이 질문을 분석하고 AI가 응답을 생성한다
- 컨텍스트: 환불 정책 문서 (RAG)
- 처리 시간: 2초 이내
3. 사용자에게 응답이 표시된다
예: "구매 후 7일 이내 미사용 제품은 전액 환불 가능합니다.
자세한 내용은 [환불 정책]을 참고하세요."
4. 사용자가 "도움이 되었나요?" 피드백을 남긴다
엣지 케이스
| 케이스 | 설명 | 예상 동작 |
|---|---|---|
| 모호한 질문 | ”이거 어떻게 해요?” | 명확화 질문 요청 |
| 범위 외 질문 | 경쟁사 제품 질문 | 정중한 거절 + 대안 제시 |
| 악의적 입력 | 프롬프트 인젝션 시도 | 입력 필터링 + 기본 응답 |
| 멀티턴 대화 | 3회 이상 연속 질문 | 대화 히스토리 활용 |
| 민감 정보 포함 | 개인정보 노출 | PII 마스킹 후 처리 |
3. AI 기능 정의
입력 (Input)
| 항목 | 스펙 |
|---|---|
| 입력 타입 | 텍스트 (한국어/영어) |
| 최대 길이 | 500자 |
| 필수 여부 | 필수 |
| 전처리 | 특수문자 제거, 소문자화 없음 |
입력 예시
"제가 3일 전에 구매한 상품 환불하고 싶은데 어떻게 해야 하나요?"
유효하지 않은 입력
- 빈 문자열
- 500자 초과
- 이미지/파일 (현재 버전 미지원)
출력 (Expected Output)
| 항목 | 스펙 |
|---|---|
| 출력 형식 | 마크다운 텍스트 |
| 최대 길이 | 1,000자 |
| 응답 언어 | 입력 언어와 동일 |
| 포함 요소 | 답변 + 관련 링크 (선택) |
출력 예시
환불을 원하시는군요! 3일 전 구매하셨다면 **전액 환불**이 가능합니다.
**환불 절차:**
1. [마이페이지] > [주문내역]으로 이동
2. 해당 주문의 [환불 요청] 버튼 클릭
3. 환불 사유 선택 후 제출
환불은 영업일 기준 3-5일 내 처리됩니다.
더 궁금한 점이 있으시면 말씀해주세요!
출력 품질 기준 ⚠️ AI 특화
| 품질 차원 | 기준 | 측정 방법 |
|---|---|---|
| 정확성 | 사실 오류 5% 미만 | RAG 소스 대조 |
| 관련성 | 질문에 직접 답변 | LLM-as-Judge (4/5 이상) |
| 완결성 | 후속 질문 없이 해결 가능 | 에스컬레이션율 |
| 톤 | 친근하고 전문적 | 스타일 가이드 준수 |
| 안전성 | 유해 콘텐츠 0% | 콘텐츠 필터 |
불확실성 범위 ⚠️ AI 특화
✅ 허용되는 불확실성:
- 같은 질문에 대해 표현 방식이 다름 (의미는 동일)
- 관련 없는 추가 정보 10% 이내 포함
❌ 허용되지 않는 불확실성:
- 사실과 다른 정보 제공 (환불 기간 오류 등)
- 경쟁사 추천
- 개인정보 노출
4. 평가 기준 ⚠️ AI 특화
평가 방법론
| 방법 | 용도 | 빈도 |
|---|---|---|
| 자동 평가 | 레이턴시, 에러율, 포맷 | 매 요청 |
| LLM-as-Judge | 관련성, 완결성, 톤 | 일간 샘플링 |
| 인간 평가 | 골든셋, 엣지케이스 | 주간 |
평가 데이터셋
| 데이터셋 | 규모 | 용도 |
|---|---|---|
| 골든셋 | 100개 | Go/No-Go 판단 |
| 엣지케이스 | 30개 | 극단 상황 대응 |
| 실제 쿼리 | 500개 | 일간 품질 모니터링 |
목표 점수
| 단계 | 품질 점수 | 레이턴시 P95 | 에러율 |
|---|---|---|---|
| PoC 통과 | 75% | 5초 | 5% |
| Pilot 통과 | 85% | 3초 | 2% |
| Production | 90% | 2초 | 1% |
5. 폴백 시나리오 ⚠️ AI 특화
AI 실패 시 대응
| 실패 유형 | 탐지 방법 | 대응 |
|---|---|---|
| 타임아웃 | 10초 초과 | ”잠시 후 다시 시도해주세요” + 재시도 버튼 |
| API 장애 | HTTP 5xx | 캐시된 FAQ 응답 또는 상담원 연결 |
| 낮은 신뢰도 | confidence < 0.7 | ”정확한 답변을 위해 상담원에게 연결해드릴까요?” |
| 유해 콘텐츠 | 필터 탐지 | 응답 차단 + 기본 메시지 |
| 입력 오류 | 유효성 검사 실패 | 입력 가이드 메시지 |
품질 미달 시 처리
- 일간 품질 점수 80% 미만 → 알림 발송
- 3일 연속 80% 미만 → 트래픽 50% 롤백
- 치명적 오류 (개인정보 노출 등) → 즉시 서비스 중단
사용자 피드백 수집
- 모든 응답에 👍/👎 버튼 표시
- 👎 클릭 시 선택형 사유 수집
- 주간 피드백 분석 리포트 생성
6. 제약 조건
성능 요구사항
| 항목 | 목표 | 필수 여부 |
|---|---|---|
| 레이턴시 P50 | 1초 | 필수 |
| 레이턴시 P95 | 3초 | 필수 |
| 레이턴시 P99 | 5초 | 권장 |
| 처리량 | 100 req/s | 필수 |
| 가용성 | 99.9% | 필수 |
비용 제약
| 항목 | 한도 |
|---|---|
| 요청당 비용 상한 | $0.02 |
| 월간 예산 | $5,000 |
| 토큰 효율성 | 입력 500 / 출력 1000 토큰 이내 |
비용 최적화 전략
- 자주 묻는 질문 캐싱 (예상 30% 절감)
- 프롬프트 최적화 (토큰 20% 절감)
- 배치 처리 (가능한 경우)
보안/프라이버시
| 항목 | 요구사항 |
|---|---|
| PII 처리 | 전송 전 마스킹, 로그에서 제외 |
| 데이터 보존 | 30일 후 자동 삭제 |
| 암호화 | TLS 1.3 (전송), AES-256 (저장) |
| 접근 제어 | 역할 기반, 최소 권한 원칙 |
7. 의존성
필요 데이터
| 데이터 | 출처 | 갱신 주기 |
|---|---|---|
| 환불 정책 문서 | 법무팀 | 분기 |
| 제품 FAQ | CS팀 | 주간 |
| 이전 상담 이력 | CRM | 실시간 |
외부 API/모델
| 컴포넌트 | 스펙 |
|---|---|
| LLM | GPT-4o / Claude 3.5 Sonnet |
| 임베딩 | text-embedding-3-small |
| 벡터 DB | Pinecone (us-east-1) |
인프라
| 컴포넌트 | 스펙 |
|---|---|
| 컴퓨팅 | AWS Lambda / ECS |
| 스토리지 | S3 (로그), RDS (메타데이터) |
| 모니터링 | Datadog / CloudWatch |
8. 릴리스 계획
| 단계 | 기간 | 범위 | 성공 기준 |
|---|---|---|---|
| PoC | 2주 | 내부 팀 5명 | 품질 75%+ |
| Pilot | 4주 | 고객 100명 | 품질 85%+, 만족도 4.0+ |
| GA | - | 전체 고객 | 품질 90%+, 에스컬레이션 40%↓ |
9. 리스크
| 리스크 | 영향 | 확률 | 완화 방안 |
|---|---|---|---|
| 환각으로 잘못된 정보 제공 | 높음 | 중간 | RAG 강화, 신뢰도 임계값 |
| API 비용 초과 | 중간 | 중간 | 캐싱, 월간 예산 알림 |
| 사용자 불만 (AI 거부감) | 중간 | 낮음 | 상담원 연결 옵션 명시 |
10. 승인
| 역할 | 이름 | 서명 | 날짜 |
|---|---|---|---|
| PM | |||
| 개발 리드 | |||
| 디자인 | |||
| 보안 |
작성 예시: 고객 문의 AI 챗봇
실제 작성 예시는 AI 챗봇 PRD 예시를 참고하세요.
Checklist
PRD 제출 전 다음 항목을 확인하세요.
- 모든 필수 섹션 작성 완료
- 성공 지표가 정량적이고 측정 가능함
- 출력 품질 기준이 명확함
- 폴백 시나리오가 모든 실패 유형을 커버함
- 비용 예산이 현실적임
- 보안/프라이버시 요구사항 확인
- 이해관계자 리뷰 완료