support DPO training (2305.18290)

Former-commit-id: 6d98de148e4af63a7028dfaeb6cf86eb56a4488f
2025-12-19 05:10:35 +08:00 · 2023-08-11 03:02:53 +08:00
parent 50345ed29a
commit 7ada4f5f6f
34 changed files with 513 additions and 212 deletions
--- a/src/llmtuner/extras/constants.py
+++ b/src/llmtuner/extras/constants.py
@@ -1,10 +1,12 @@
 IGNORE_INDEX = -100

+LOG_FILE_NAME = "trainer_log.jsonl"
+
 VALUE_HEAD_FILE_NAME = "value_head.bin"

 FINETUNING_ARGS_NAME = "finetuning_args.json"

-LAYERNORM_NAMES = ["norm", "ln_f", "ln_attn", "ln_mlp"] # for LLaMA, BLOOM and Falcon settings
+LAYERNORM_NAMES = ["norm", "ln_f", "ln_attn", "ln_mlp"]

 METHODS = ["full", "freeze", "lora"]