Install
openclaw skills install vn-translateDịch truyện từ ngôn ngữ nguồn sang tiếng Việt. Chuyển đổi định dạng đầu vào, cắt file thành các phần nhỏ ~12kb, dịch tuần tự từng phần, tổng hợp tên nhân vật và xưng hô nhất quán, ghép các phần đã dịch thành file hoàn chỉnh.
openclaw skills install vn-translateQuy trình dịch truyện gồm 4 bước:
.md nếu cần (dùng scripts/convert_to_md.py)scripts/split_file.py)scripts/merge_parts.py)<project-dir>/
├── raw/ # File gốc đã cắt nhỏ: part_001.md, part_002.md, ...
├── out/ # File đã dịch: part_001.md, part_002.md, ...
├── TenRieng.md # Bảng tổng hợp tên riêng (nhân vật, địa danh, thuật ngữ)
├── XungHo.md # MA TRẬN xưng hô (người nói × người nghe)
├── full.md # File đã ghép hoàn chỉnh sau khi dịch
└── (file gốc)
Chạy:
python scripts/convert_to_md.py <file_goc>
Script tự động nhận diện .txt, .epub, .docx, .html, .pdf và xuất ra .md.
Chạy:
python scripts/split_file.py <file.md> raw/
Tạo các file raw/part_xxx.md, mỗi file ~12KB, chỉ cắt tại ký tự xuống dòng \n.
TenRieng.md và XungHo.md với format chuẩn (xem bên dưới).raw/part_x.md → out/part_x.md. Mỗi part dịch xong, kiểm tra chéo với bảng tên và xưng hô.TenRieng.md và XungHo.md. Các part sau phải tuân thủ tuyệt đối.TenRieng.md:Bảng 1 chiều: tên gốc → tên dịch + ghi chú. Bao gồm mọi tên riêng: nhân vật, địa danh, tổ chức, vật phẩm đặc biệt, thuật ngữ riêng.
# Tên Riêng
| Tên gốc | Tên dịch | Ghi chú |
|---------|----------|---------|
| Alice | Alice | Nữ chính, 16 tuổi |
| Bob | Bob | Bạn thân của Alice |
| Wonderland | Xứ sở thần tiên | Địa danh chính |
XungHo.md:Ma trận 2 chiều: hàng = người nói, cột = người nghe.
Ô giao nhau ghi Xưng\Hô (cách nhau bởi dấu gạch chéo).
# Bảng Xưng Hô
Ma trận: [Người nói] × [Người nghe], ô = `Xưng\Hô`
| Người nói \ Người nghe | An | Mẹ kế |
|------------------------|------|---------|
| An | - | Con / Dì |
| Mẹ kế | Mẹ / Con | - |
| Người nói \ Người nghe | Chị A | Em B |
|------------------------|-------|------|
| Chị A | - | Chị / Em |
| Em B | Em / Chị | - |
Nguyên tắc dịch xưng hô:
Chạy:
python scripts/merge_parts.py out/ full.md
# 1. Chuẩn bị
python scripts/convert_to_md.py truyen.epub
# 2. Cắt file
python scripts/split_file.py truyen.md raw/
# 3. Dịch (thủ công từng part, cập nhật TenRieng.md + XungHo.md)
# 4. Ghép
python scripts/merge_parts.py out/ full.md
\n — không cắt giữa chừng một câu/đoạn.TenRieng.md ngay từ lần đầu xuất hiện. Tuyệt đối không đổi giữa chừng..md có thể chứa BOM — script xử lý UTF-8 chuẩn.