📖 사용 가이드
이 화면은 Cuckoo Barista 의 추론 모델을 학습/운영하기 위한 워크스페이스입니다. *워크플로*는 다음 5단계로 단순화되어 있습니다.
- 1. 시스템 프롬프트 로 모델 *기본 지시*를 정합니다 (한 번만 잘 짜두세요).
- 2. 시나리오 에 사용자 발화 → 모델 모범 답안을 잔뜩 추가합니다.
- 3. 채팅 검증 으로 즉시 호출해서 결과를 확인합니다.
- 4. 적용 을 누르면 운영(LIVE) 트리에 반영되고, vertex 파인튜닝 데이터까지 자동 빌드됩니다 (scenarios 80/20 자동 분할).
📜 시스템 프롬프트 — 작성 팁
- 모델의 *역할/말투/금기/JSON 스키마* 를 명확하게 적습니다.
- 한국어 메인이라면
system.md1개만 운영해도 충분합니다. - 다른 언어가 필요하면
system_en.md처럼 새 파일을 만드세요. 채팅 검증의locale셀렉터에 맞춰 자동으로 골라집니다.
📚 시나리오 — 모델 키 설명
user | 사용자가 말한 발화 (음성 STT 결과 또는 텍스트) |
|---|---|
expected.target |
recipe(레시피 추천) / clarify(명확화 질문) /
drink(음용 안내) / kb(지식) /
feedback(감사·불만 응답) / meta(기능 설명) /
none(주제 외) |
expected.axes.flavor_group |
Floral(꽃향) / Fruity(과일) /
Sweet, Brown Sugar(단맛/흑설탕) / Nutty, Milk Chocolate(고소·밀크초코) /
Smoky, Dark Chocolate(스모키·다크초코) / null |
expected.axes.roast_level |
light / medium-light / medium /
medium-dark / dark / null |
expected.axes.bean_weight |
15(약함) / 20(보통) / 25(강함) / null |
expected.axes.temperature_type |
0(hot) / 1(iced) / null |
expected.message |
모델이 사용자에게 들려줄 자연어 1~3 문장 (TTS 로 읽힘) |
expected.confidence |
0.0 ~ 1.0 — 모델 자신감. 보통 0.85~0.95. |
expected.reason |
한 줄 결정 근거. 학습이 잘 됐는지 디버깅에 도움. |
폼 위에서 입력한 값은 자동으로 JSONL 한 줄로 직렬화되어 저장됩니다. 우측 상단의 { } JSON 모드 로 직접 JSON 텍스트를 다듬을 수도 있습니다.
🧪 파인튜닝 데이터
- scenarios.jsonl 하나만 관리하면 됩니다.
- 적용 시 자동으로 80% train / 20% eval 로 분할되어
train_vertex.jsonl,eval_vertex.jsonl이 생성됩니다. *_vertex.jsonl파일은 *Vertex AI SFT 표준* 으로 자동 생성되니 직접 만지지 마세요.
💬 채팅 검증
- 입력은 working 트리의 시스템 프롬프트 + 시나리오에 따라 추론합니다 (적용 전 검증).
thinking셀렉터로 추론 깊이 ↔ 속도를 제어합니다. 기본 0 = 약 3초.session을 바꾸면 대화 컨텍스트도 분리됩니다. 다중 사용자 동시 검증 가능.
🚀 적용 / 롤백
- 적용 = working 폴더 → live 폴더 복사 + vertex jsonl 자동 빌드 + 자동 스냅샷.
- 실수가 나면 스냅샷 에서 [↩ live 로 복원] 한 번이면 즉시 되돌아갑니다.
- 편집 화면까지 같이 되돌리려면 [↩ live + working 복원].
🌐 외부 배포
- 이 워크스페이스는 AWS Fargate (ECS) 로 패키징되어 https://barista.service.ai.dev-cuckoo-platform.com/platform 에서 접속 가능합니다 (배포 후).
- 외부에서도 prompts/scenarios/finetune 데이터를 *그대로* 편집/적용할 수 있도록 EFS 영구 볼륨에 mount 합니다.
- 자세한 인프라 코드와 배포 절차는
infra/web_workspace_stack/README.md참고.