template poc, pilot, production pm 15min

AI 기능 PRD 템플릿

일반 PRD와 다른 AI 기능 PRD 작성 가이드. 비결정적 출력 범위, 품질 평가 기준, 폴백 시나리오까지 포함한 실전 템플릿을 바로 복사해서 쓸 수 있습니다.

Deliverables

Template

Summary

AI 기능 PRD는 일반 PRD와 다르게 비결정적 출력, 평가 기준, 폴백 시나리오를 명시해야 한다. 일반 소프트웨어는 “같은 입력 → 같은 출력”이지만, AI 기능은 **“같은 입력 → 다양한 출력 + 품질 범위”**다. 이 템플릿은 이러한 AI 특성을 반영한 PRD 항목을 제공한다.

When to Use

LLM/AI 기반 신규 기능 기획 시
개발팀에 AI 기능 요구사항 전달 시
AI 기능 범위 합의 및 이해관계자 사인오프 시
PoC/Pilot 시작 전 기능 정의 시

AI PRD vs 일반 PRD

항목	일반 PRD	AI PRD
출력 정의	정확한 출력 명세	출력 범위 + 품질 기준
테스트	단위/통합 테스트	평가 데이터셋 + 골든셋
성공 기준	기능 동작 여부	품질 점수 (정확도, 관련성 등)
실패 처리	에러 핸들링	폴백 시나리오 + 에스컬레이션
비용	인프라 비용	토큰 비용 + API 비용

Template

1. 개요

기능명: [기능 이름]

버전: v1.0

작성자: [이름]

최종 수정일: [YYYY-MM-DD]

상태: [ ] 초안 / [ ] 검토 중 / [ ] 승인됨

목적

이 기능이 해결하는 문제를 구체적으로 기술하세요.

❌ "AI로 고객 서비스를 개선한다"
✅ "고객 문의 중 FAQ에 해당하는 60%를 AI가 즉시 응답하여,
   평균 응답 시간을 현재 4시간에서 30초 이내로 단축한다"

배경

현재 상황: [현재 어떤 문제가 있는가]
시도한 대안: [AI 외에 검토한 방법과 채택하지 않은 이유]
AI 선택 근거: [왜 AI가 적합한가]

성공 지표 (정량적, 측정 가능)

지표	현재값	목표값	측정 방법
응답 만족도	3.2/5.0	4.0/5.0	사용자 피드백
응답 시간	4시간	30초	시스템 로그
에스컬레이션 비율	100%	40%	티켓 데이터

2. 사용자 시나리오

타겟 사용자

페르소나: [예: “자주 제품 사용법을 문의하는 신규 고객”]
사용 빈도: [예: 일 평균 500건]
기술 숙련도: [예: 낮음]

주요 사용 흐름 (Happy Path)

1. 사용자가 채팅창에 질문을 입력한다
   예: "환불 정책이 어떻게 되나요?"

2. 시스템이 질문을 분석하고 AI가 응답을 생성한다
   - 컨텍스트: 환불 정책 문서 (RAG)
   - 처리 시간: 2초 이내

3. 사용자에게 응답이 표시된다
   예: "구매 후 7일 이내 미사용 제품은 전액 환불 가능합니다.
       자세한 내용은 [환불 정책]을 참고하세요."

4. 사용자가 "도움이 되었나요?" 피드백을 남긴다

엣지 케이스

케이스	설명	예상 동작
모호한 질문	”이거 어떻게 해요?”	명확화 질문 요청
범위 외 질문	경쟁사 제품 질문	정중한 거절 + 대안 제시
악의적 입력	프롬프트 인젝션 시도	입력 필터링 + 기본 응답
멀티턴 대화	3회 이상 연속 질문	대화 히스토리 활용
민감 정보 포함	개인정보 노출	PII 마스킹 후 처리

3. AI 기능 정의

입력 (Input)

항목	스펙
입력 타입	텍스트 (한국어/영어)
최대 길이	500자
필수 여부	필수
전처리	특수문자 제거, 소문자화 없음

입력 예시

"제가 3일 전에 구매한 상품 환불하고 싶은데 어떻게 해야 하나요?"

유효하지 않은 입력

빈 문자열
500자 초과
이미지/파일 (현재 버전 미지원)

출력 (Expected Output)

항목	스펙
출력 형식	마크다운 텍스트
최대 길이	1,000자
응답 언어	입력 언어와 동일
포함 요소	답변 + 관련 링크 (선택)

출력 예시

환불을 원하시는군요! 3일 전 구매하셨다면 **전액 환불**이 가능합니다.

**환불 절차:**

1. [마이페이지] > [주문내역]으로 이동
2. 해당 주문의 [환불 요청] 버튼 클릭
3. 환불 사유 선택 후 제출

환불은 영업일 기준 3-5일 내 처리됩니다.
더 궁금한 점이 있으시면 말씀해주세요!

출력 품질 기준 ⚠️ AI 특화

품질 차원	기준	측정 방법
정확성	사실 오류 5% 미만	RAG 소스 대조
관련성	질문에 직접 답변	LLM-as-Judge (4/5 이상)
완결성	후속 질문 없이 해결 가능	에스컬레이션율
톤	친근하고 전문적	스타일 가이드 준수
안전성	유해 콘텐츠 0%	콘텐츠 필터

불확실성 범위 ⚠️ AI 특화

✅ 허용되는 불확실성:
- 같은 질문에 대해 표현 방식이 다름 (의미는 동일)
- 관련 없는 추가 정보 10% 이내 포함

❌ 허용되지 않는 불확실성:
- 사실과 다른 정보 제공 (환불 기간 오류 등)
- 경쟁사 추천
- 개인정보 노출

4. 평가 기준 ⚠️ AI 특화

평가 방법론

방법	용도	빈도
자동 평가	레이턴시, 에러율, 포맷	매 요청
LLM-as-Judge	관련성, 완결성, 톤	일간 샘플링
인간 평가	골든셋, 엣지케이스	주간

평가 데이터셋

데이터셋	규모	용도
골든셋	100개	Go/No-Go 판단
엣지케이스	30개	극단 상황 대응
실제 쿼리	500개	일간 품질 모니터링

목표 점수

단계	품질 점수	레이턴시 P95	에러율
PoC 통과	75%	5초	5%
Pilot 통과	85%	3초	2%
Production	90%	2초	1%

5. 폴백 시나리오 ⚠️ AI 특화

AI 실패 시 대응

실패 유형	탐지 방법	대응
타임아웃	10초 초과	”잠시 후 다시 시도해주세요” + 재시도 버튼
API 장애	HTTP 5xx	캐시된 FAQ 응답 또는 상담원 연결
낮은 신뢰도	confidence < 0.7	”정확한 답변을 위해 상담원에게 연결해드릴까요?”
유해 콘텐츠	필터 탐지	응답 차단 + 기본 메시지
입력 오류	유효성 검사 실패	입력 가이드 메시지

품질 미달 시 처리

일간 품질 점수 80% 미만 → 알림 발송
3일 연속 80% 미만 → 트래픽 50% 롤백
치명적 오류 (개인정보 노출 등) → 즉시 서비스 중단

사용자 피드백 수집

모든 응답에 👍/👎 버튼 표시
👎 클릭 시 선택형 사유 수집
주간 피드백 분석 리포트 생성

6. 제약 조건

성능 요구사항

항목	목표	필수 여부
레이턴시 P50	1초	필수
레이턴시 P95	3초	필수
레이턴시 P99	5초	권장
처리량	100 req/s	필수
가용성	99.9%	필수

비용 제약

항목	한도
요청당 비용 상한	$0.02
월간 예산	$5,000
토큰 효율성	입력 500 / 출력 1000 토큰 이내

비용 최적화 전략

자주 묻는 질문 캐싱 (예상 30% 절감)
프롬프트 최적화 (토큰 20% 절감)
배치 처리 (가능한 경우)

보안/프라이버시

항목	요구사항
PII 처리	전송 전 마스킹, 로그에서 제외
데이터 보존	30일 후 자동 삭제
암호화	TLS 1.3 (전송), AES-256 (저장)
접근 제어	역할 기반, 최소 권한 원칙

7. 의존성

필요 데이터

데이터	출처	갱신 주기
환불 정책 문서	법무팀	분기
제품 FAQ	CS팀	주간
이전 상담 이력	CRM	실시간

외부 API/모델

컴포넌트	스펙
LLM	GPT-4o / Claude 3.5 Sonnet
임베딩	text-embedding-3-small
벡터 DB	Pinecone (us-east-1)

인프라

컴포넌트	스펙
컴퓨팅	AWS Lambda / ECS
스토리지	S3 (로그), RDS (메타데이터)
모니터링	Datadog / CloudWatch

8. 릴리스 계획

단계	기간	범위	성공 기준
PoC	2주	내부 팀 5명	품질 75%+
Pilot	4주	고객 100명	품질 85%+, 만족도 4.0+
GA	-	전체 고객	품질 90%+, 에스컬레이션 40%↓

9. 리스크

리스크	영향	확률	완화 방안
환각으로 잘못된 정보 제공	높음	중간	RAG 강화, 신뢰도 임계값
API 비용 초과	중간	중간	캐싱, 월간 예산 알림
사용자 불만 (AI 거부감)	중간	낮음	상담원 연결 옵션 명시

10. 승인

역할	이름	서명	날짜
PM
개발 리드
디자인
보안

작성 예시: 고객 문의 AI 챗봇

실제 작성 예시는 AI 챗봇 PRD 예시를 참고하세요.

Checklist

PRD 제출 전 다음 항목을 확인하세요.

모든 필수 섹션 작성 완료
성공 지표가 정량적이고 측정 가능함
출력 품질 기준이 명확함
폴백 시나리오가 모든 실패 유형을 커버함
비용 예산이 현실적임
보안/프라이버시 요구사항 확인
이해관계자 리뷰 완료

Summary

When to Use

AI PRD vs 일반 PRD

Template

1. 개요

2. 사용자 시나리오

3. AI 기능 정의

입력 (Input)

출력 (Expected Output)

출력 품질 기준 ⚠️ AI 특화

불확실성 범위 ⚠️ AI 특화

4. 평가 기준 ⚠️ AI 특화

5. 폴백 시나리오 ⚠️ AI 특화

6. 제약 조건

7. 의존성

8. 릴리스 계획

9. 리스크

10. 승인

작성 예시: 고객 문의 AI 챗봇

Checklist

Download

Related