Bỏ qua để đến nội dung

AI Tutor Platform - Exercise Coaching Integrity Policy

SharedShared Capabilities485 words2 min read
activebyDOL Product Design
  • Khóa policy “AI không làm bài hộ” khi learner đang trong active attempt.
  • Chuẩn hóa cách AI hỗ trợ từ tổng quát -> chi tiết mà không lộ đáp án cuối.
  • Áp dụng khi activeAttempt = true cho assignment/test/exercise.
  • Không áp dụng ở mode review sau submit (post-attempt reference mode).
  • Có exception giới hạn cho context non_graded_sandbox (xem mục Sandbox Exception).
  1. Không đưa đáp án cuối cùng để nộp.
  2. Không đưa trực tiếp đáp án option đúng trong trắc nghiệm.
  3. Không viết full đoạn/bài final để learner copy nộp.
  1. orientation_hint
  • Nêu learner nên nhìn vào phần nào của đề.
  1. concept_hint
  • Nhắc quy tắc hoặc pattern cần áp dụng.
  1. scaffolded_steps
  • Chia các bước xử lý theo logic.
  1. self_check
  • Đưa checklist tự kiểm và yêu cầu learner tự xác nhận đáp án.
  • Nếu learner tiếp tục yêu cầu đáp án trực tiếp:
    • AI nhắc ngắn policy integrity.
    • AI chỉ tiếp tục ở mức hint hợp lệ tiếp theo.
    • Không hạ guardrail dù user lặp lại nhiều lần.
  • “Em đang sai thì nào?” -> AI nêu rule nhận biết và gợi ý tự kiểm tra.
  • “Cho em hướng làm bài này” -> AI tách thành bước tư duy.
  • “Đáp án câu 12 là gì?” -> AI không đưa option đúng.
  • “Viết luôn đoạn essay để em nộp” -> AI từ chối và chuyển về scaffold.
  • Sau khi bài đã submit/finalized:
    • AI có thể đưa lời giải hoàn chỉnh dưới dạng tài liệu tham khảo học tập.
    • Cần label rõ reference explanation.
  • Chỉ cho phép khi đồng thời thỏa:
    • non_graded_sandbox = true,
    • no_score_or_streak_impact = true.
  • Trong sandbox exception:
    • AI có thể cung cấp sample/reference answer sau khi user yêu cầu rõ hoặc đã có self-attempt.
    • output bắt buộc có nhãn sample/reference (không phải đáp án nộp).
  • Không áp dụng exception cho:
    • assignment/test chấm điểm,
    • bài quan trọng trong course mode,
    • mọi flow có submission impact.
  1. Active attempt test set không có answer leak.
  2. Hint ladder hoạt động đúng thứ tự.
  3. Repeated request không bypass guardrail.
  4. Post-attempt mode chuyển đúng để learner review.
  5. Sandbox exception không leak sang graded flows.
  • 2026-03-01: Bổ sung sandbox exception có điều kiện cho non-graded practice theo DEC-0092, giữ nguyên hard rule ở graded attempts.
  • 2026-03-01: Tạo policy chi tiết cho coaching integrity theo DEC-0084.