[dataset] fix ultrachat_200k dataset (#7259)

The `HuggingFaceH4/ultrachat_200k` dataset doesn't contain the default "train" split. The correct split is "train_sft".
2026-03-11 06:16:00 +08:00 · 2025-03-13 13:20:18 +01:00
parent 3c974c466e
commit 0ecad4b178
1 changed files with 1 additions and 0 deletions
--- a/data/dataset_info.json
+++ b/data/dataset_info.json
@@ -232,6 +232,7 @@
  "ultrachat_200k": {
    "hf_hub_url": "HuggingFaceH4/ultrachat_200k",
    "ms_hub_url": "AI-ModelScope/ultrachat_200k",
    "split": "train_sft",
    "formatting": "sharegpt",
    "columns": {
      "messages": "messages"