Bỏ qua để đến nội dung

Knowledge Page - Imported Corpus Overview

SharedKnowledge Base337 words2 min read
activebyDOL Product Design
  • Chuẩn hóa điểm vào cho gói tài liệu import từ cụm nguồn “Knowledge page”.
  • Giữ ranh giới rõ giữa mirror staging (machine-managed) và tài liệu đã biên tập (human-authored).
  • Cung cấp snapshot để team biết nhanh phạm vi dữ liệu trước khi promote sang core notes.
  • Sync gần nhất: 2026-03-02T07:15:29.239Z (theo .cache/kb-ingest/last-run.json).
  • Tổng file mirror trong Imported/Knowledge page: 35.
  • Loại nội dung theo cặp:
    • 17 file *Prompt*
    • 17 file *Knowledge*
    • 1 file khác cặp Prompt/Knowledge (nguồn đơn lẻ theo chủ đề SAT Inferences).
  • Category heuristic từ ingest run:
    • ux-flow: 29
    • decision: 4
    • glossary: 2
  • Cụm chính theo naming token:
    • Part_1: 10
    • Part_2: 10
    • Part_3: 10
    • Band_4_0: 4
    • Other: 1
  • Cặp Prompt/Knowledge vẫn cân bằng 1:1 trong cụm cặp chuẩn, đồng thời có thêm 1 tài liệu đơn lẻ theo chủ đề.
  • Vị trí mirror: docs/Shared/Knowledge Base/Imported/Knowledge page/.
  • Index tổng hợp toàn bộ imported sources: docs/Shared/Knowledge Base/Imported/NB_IMP_INDEX.md.
  • File trong Imported/ là machine-managed, không chỉnh tay.
  • Khi cần viết tài liệu chuẩn hóa:
    1. đọc mirror tại Imported/Knowledge page/,
    2. tổng hợp và biên tập sang docs/Shared/Knowledge Base/NB_*.md,
    3. giữ traceability ngược về file mirror tương ứng.
Terminal window
# thêm/refresh nguồn từ folder Drive (recursive)
node scripts/kb-add-folder-sources.mjs --folder "<DRIVE_FOLDER_URL>" --target-subdir "Knowledge page"
# ingest mirror
node scripts/kb-ingest.mjs --config config/knowledge-ingest/sources.local.json
# guard layout/naming trước khi merge
npm run kb:guard:imported
  • Category hiện vẫn heuristic; chưa có taxonomy cưỡng bức theo domain map.
  • Chưa có semantic dedup giữa file cùng chủ đề khác phiên bản.
  • Nên bổ sung step promote checklist cho cụm này (ưu tiên các file category decision).