Bỏ qua để đến nội dung

AI Tutor Platform - Exercise Coaching Integrity Policy

SharedShared Capabilities485 words2 min read

activebyDOL Product Design

Purpose

Khóa policy “AI không làm bài hộ” khi learner đang trong active attempt.
Chuẩn hóa cách AI hỗ trợ từ tổng quát -> chi tiết mà không lộ đáp án cuối.

Scope

Áp dụng khi activeAttempt = true cho assignment/test/exercise.
Không áp dụng ở mode review sau submit (post-attempt reference mode).
Có exception giới hạn cho context non_graded_sandbox (xem mục Sandbox Exception).

Hard Rules (must-pass)

Không đưa đáp án cuối cùng để nộp.
Không đưa trực tiếp đáp án option đúng trong trắc nghiệm.
Không viết full đoạn/bài final để learner copy nộp.

Hint Ladder

orientation_hint

Nêu learner nên nhìn vào phần nào của đề.

concept_hint

Nhắc quy tắc hoặc pattern cần áp dụng.

scaffolded_steps

Chia các bước xử lý theo logic.

self_check

Đưa checklist tự kiểm và yêu cầu learner tự xác nhận đáp án.

Repeated Direct-answer Request Policy

Nếu learner tiếp tục yêu cầu đáp án trực tiếp:
- AI nhắc ngắn policy integrity.
- AI chỉ tiếp tục ở mức hint hợp lệ tiếp theo.
- Không hạ guardrail dù user lặp lại nhiều lần.

Allowed vs Blocked Examples

Allowed

“Em đang sai thì nào?” -> AI nêu rule nhận biết và gợi ý tự kiểm tra.
“Cho em hướng làm bài này” -> AI tách thành bước tư duy.

Blocked

“Đáp án câu 12 là gì?” -> AI không đưa option đúng.
“Viết luôn đoạn essay để em nộp” -> AI từ chối và chuyển về scaffold.

Post-attempt Transition

Sau khi bài đã submit/finalized:
- AI có thể đưa lời giải hoàn chỉnh dưới dạng tài liệu tham khảo học tập.
- Cần label rõ reference explanation.

Sandbox Exception (Non-graded Only)

Chỉ cho phép khi đồng thời thỏa:
- non_graded_sandbox = true,
- no_score_or_streak_impact = true.
Trong sandbox exception:
- AI có thể cung cấp sample/reference answer sau khi user yêu cầu rõ hoặc đã có self-attempt.
- output bắt buộc có nhãn sample/reference (không phải đáp án nộp).
Không áp dụng exception cho:
- assignment/test chấm điểm,
- bài quan trọng trong course mode,
- mọi flow có submission impact.

QA Acceptance Checks

Active attempt test set không có answer leak.
Hint ladder hoạt động đúng thứ tự.
Repeated request không bypass guardrail.
Post-attempt mode chuyển đúng để learner review.
Sandbox exception không leak sang graded flows.

Dependencies

Change log

2026-03-01: Bổ sung sandbox exception có điều kiện cho non-graded practice theo DEC-0092, giữ nguyên hard rule ở graded attempts.
2026-03-01: Tạo policy chi tiết cho coaching integrity theo DEC-0084.