rename package

Former-commit-id: a07ff0c083558cfe6f474d13027642d3052fee08
2026-01-09 07:30:35 +08:00 · 2024-05-16 18:39:08 +08:00
parent fe638cf11f
commit dfa686b617
109 changed files with 31 additions and 31 deletions
--- a/2
+++ b/2
@@ -6,7 +6,7 @@ COPY requirements.txt /app/
 RUN pip install -r requirements.txt

 COPY . /app/
-RUN pip install -e .[deepspeed,metrics,bitsandbytes,qwen]
+RUN pip install -e .[metrics,bitsandbytes,qwen]

 VOLUME [ "/root/.cache/huggingface/", "/app/data", "/app/output" ]
 EXPOSE 7860
--- a/README.md
+++ b/README.md
@@ -3,8 +3,7 @@
 [![GitHub Repo stars](https://img.shields.io/github/stars/hiyouga/LLaMA-Factory?style=social)](https://github.com/hiyouga/LLaMA-Factory/stargazers)
 [![GitHub Code License](https://img.shields.io/github/license/hiyouga/LLaMA-Factory)](LICENSE)
 [![GitHub last commit](https://img.shields.io/github/last-commit/hiyouga/LLaMA-Factory)](https://github.com/hiyouga/LLaMA-Factory/commits/main)
-[![PyPI](https://img.shields.io/pypi/v/llmtuner)](https://pypi.org/project/llmtuner/)
-[![Downloads](https://static.pepy.tech/badge/llmtuner)](https://pypi.org/project/llmtuner/)
+[![PyPI](https://img.shields.io/pypi/v/llamafactory)](https://pypi.org/project/llamafactory/)
 [![Citation](https://img.shields.io/badge/citation-44-green)](#projects-using-llama-factory)
 [![GitHub pull request](https://img.shields.io/badge/PRs-welcome-blue)](https://github.com/hiyouga/LLaMA-Factory/pulls)
 [![Discord](https://dcbadge.vercel.app/api/server/rKfvV9r9FK?compact=true&style=flat)](https://discord.gg/rKfvV9r9FK)
@@ -176,9 +175,9 @@ Compared to ChatGLM's [P-Tuning](https://github.com/THUDM/ChatGLM2-6B/tree/main/
 >
 > Remember to use the **SAME** template in training and inference.

-Please refer to [constants.py](src/llmtuner/extras/constants.py) for a full list of models we supported.
+Please refer to [constants.py](src/llamafactory/extras/constants.py) for a full list of models we supported.

-You also can add a custom chat template to [template.py](src/llmtuner/data/template.py).
+You also can add a custom chat template to [template.py](src/llamafactory/data/template.py).

 ## Supported Training Approaches

--- a/README_zh.md
+++ b/README_zh.md
@@ -3,8 +3,7 @@
 [![GitHub Repo stars](https://img.shields.io/github/stars/hiyouga/LLaMA-Factory?style=social)](https://github.com/hiyouga/LLaMA-Factory/stargazers)
 [![GitHub Code License](https://img.shields.io/github/license/hiyouga/LLaMA-Factory)](LICENSE)
 [![GitHub last commit](https://img.shields.io/github/last-commit/hiyouga/LLaMA-Factory)](https://github.com/hiyouga/LLaMA-Factory/commits/main)
-[![PyPI](https://img.shields.io/pypi/v/llmtuner)](https://pypi.org/project/llmtuner/)
-[![Downloads](https://static.pepy.tech/badge/llmtuner)](https://pypi.org/project/llmtuner/)
+[![PyPI](https://img.shields.io/pypi/v/llamafactory)](https://pypi.org/project/llamafactory/)
 [![Citation](https://img.shields.io/badge/citation-44-green)](#使用了-llama-factory-的项目)
 [![GitHub pull request](https://img.shields.io/badge/PRs-welcome-blue)](https://github.com/hiyouga/LLaMA-Factory/pulls)
 [![Discord](https://dcbadge.vercel.app/api/server/rKfvV9r9FK?compact=true&style=flat)](https://discord.gg/rKfvV9r9FK)
@@ -176,9 +175,9 @@ https://github.com/hiyouga/LLaMA-Factory/assets/16256802/ec36a9dd-37f4-4f72-81bd
 >
 > 请务必在训练和推理时使用**完全一致**的模板。

-项目所支持模型的完整列表请参阅 [constants.py](src/llmtuner/extras/constants.py)。
+项目所支持模型的完整列表请参阅 [constants.py](src/llamafactory/extras/constants.py)。

-您也可以在 [template.py](src/llmtuner/data/template.py) 中添加自己的对话模板。
+您也可以在 [template.py](src/llamafactory/data/template.py) 中添加自己的对话模板。

 ## 训练方法

--- a/pyproject.toml
+++ b/pyproject.toml
@@ -13,7 +13,7 @@ select = ["C", "E", "F", "I", "W"]

 [tool.ruff.lint.isort]
 lines-after-imports = 2
-known-first-party = ["llmtuner"]
+known-first-party = ["llamafactory"]
 known-third-party = [
    "accelerate",
    "datasets",
--- a/scripts/cal_flops.py
+++ b/scripts/cal_flops.py
@@ -8,7 +8,7 @@ import torch
 from deepspeed.accelerator import get_accelerator  # type: ignore
 from deepspeed.profiling.flops_profiler import get_model_profile  # type: ignore

-from llmtuner.chat import ChatModel
+from llamafactory.chat import ChatModel


 def calculate_flops(
--- a/scripts/cal_lr.py
+++ b/scripts/cal_lr.py
@@ -12,10 +12,10 @@ from torch.utils.data import DataLoader
 from tqdm import tqdm
 from transformers import DataCollatorForLanguageModeling, DataCollatorForSeq2Seq

-from llmtuner.data import get_dataset
-from llmtuner.extras.constants import IGNORE_INDEX
-from llmtuner.hparams import get_train_args
-from llmtuner.model import load_tokenizer
+from llamafactory.data import get_dataset
+from llamafactory.extras.constants import IGNORE_INDEX
+from llamafactory.hparams import get_train_args
+from llamafactory.model import load_tokenizer


 BASE_LR = 3e-4  # 1.5e-4 for 30B-70B models
--- a/scripts/cal_ppl.py
+++ b/scripts/cal_ppl.py
@@ -12,10 +12,10 @@ from torch.utils.data import DataLoader
 from tqdm import tqdm
 from transformers import DataCollatorForLanguageModeling, DataCollatorForSeq2Seq

-from llmtuner.data import get_dataset
-from llmtuner.extras.constants import IGNORE_INDEX
-from llmtuner.hparams import get_train_args
-from llmtuner.model import load_model, load_tokenizer
+from llamafactory.data import get_dataset
+from llamafactory.extras.constants import IGNORE_INDEX
+from llamafactory.hparams import get_train_args
+from llamafactory.model import load_model, load_tokenizer


@dataclass
--- a/scripts/length_cdf.py
+++ b/scripts/length_cdf.py
@@ -7,9 +7,9 @@ from collections import defaultdict
 import fire
 from tqdm import tqdm

-from llmtuner.data import get_dataset
-from llmtuner.hparams import get_train_args
-from llmtuner.model import load_tokenizer
+from llamafactory.data import get_dataset
+from llamafactory.hparams import get_train_args
+from llamafactory.model import load_tokenizer


 def length_cdf(
--- a/setup.py
+++ b/setup.py
@@ -5,7 +5,7 @@ from setuptools import find_packages, setup


 def get_version():
-    with open(os.path.join("src", "llmtuner", "cli.py"), "r", encoding="utf-8") as f:
+    with open(os.path.join("src", "llamafactory", "cli.py"), "r", encoding="utf-8") as f:
        file_content = f.read()
        pattern = r"{}\W*=\W*\"([^\"]+)\"".format("VERSION")
        (version,) = re.findall(pattern, file_content)
@@ -38,7 +38,7 @@ extra_require = {

 def main():
    setup(
-        name="llmtuner",
+        name="llamafactory",
        version=get_version(),
        author="hiyouga",
        author_email="hiyouga" "@" "buaa.edu.cn",
@@ -53,7 +53,7 @@ def main():
        python_requires=">=3.8.0",
        install_requires=get_requires(),
        extras_require=extra_require,
-        entry_points={"console_scripts": ["llamafactory-cli = llmtuner.cli:main"]},
+        entry_points={"console_scripts": ["llamafactory-cli = llamafactory.cli:main"]},
        classifiers=[
            "Development Status :: 4 - Beta",
            "Intended Audience :: Developers",
--- a/src/api.py
+++ b/src/api.py
@@ -2,8 +2,8 @@ import os

 import uvicorn

-from llmtuner.api.app import create_app
-from llmtuner.chat import ChatModel
+from llamafactory.api.app import create_app
+from llamafactory.chat import ChatModel


 def main():
--- a/src/llamafactory/init.py
+++ b/src/llamafactory/init.py
--- a/src/llamafactory/api/init.py
+++ b/src/llamafactory/api/init.py
--- a/src/llamafactory/api/app.py
+++ b/src/llamafactory/api/app.py
--- a/src/llamafactory/api/chat.py
+++ b/src/llamafactory/api/chat.py
--- a/src/llamafactory/api/common.py
+++ b/src/llamafactory/api/common.py
--- a/src/llamafactory/api/protocol.py
+++ b/src/llamafactory/api/protocol.py
--- a/src/llamafactory/chat/init.py
+++ b/src/llamafactory/chat/init.py
--- a/src/llamafactory/chat/base_engine.py
+++ b/src/llamafactory/chat/base_engine.py
--- a/src/llamafactory/chat/chat_model.py
+++ b/src/llamafactory/chat/chat_model.py
--- a/src/llamafactory/chat/hf_engine.py
+++ b/src/llamafactory/chat/hf_engine.py
--- a/src/llamafactory/chat/vllm_engine.py
+++ b/src/llamafactory/chat/vllm_engine.py
--- a/src/llamafactory/cli.py
+++ b/src/llamafactory/cli.py
--- a/src/llamafactory/data/init.py
+++ b/src/llamafactory/data/init.py
--- a/src/llamafactory/data/aligner.py
+++ b/src/llamafactory/data/aligner.py
--- a/src/llamafactory/data/collator.py
+++ b/src/llamafactory/data/collator.py
--- a/src/llamafactory/data/formatter.py
+++ b/src/llamafactory/data/formatter.py
--- a/src/llamafactory/data/loader.py
+++ b/src/llamafactory/data/loader.py
--- a/src/llamafactory/data/parser.py
+++ b/src/llamafactory/data/parser.py
@@ -32,6 +32,8 @@ class DatasetAttr:
    prompt: Optional[str] = "instruction"
    query: Optional[str] = "input"
    response: Optional[str] = "output"
+    chosen: Optional[str] = "chosen"
+    rejected: Optional[str] = "rejected"
    history: Optional[str] = None
    """ columns for the sharegpt format """
    messages: Optional[str] = "conversations"
--- a/src/llamafactory/data/preprocess.py
+++ b/src/llamafactory/data/preprocess.py
--- a/src/llamafactory/data/template.py
+++ b/src/llamafactory/data/template.py
--- a/src/llamafactory/data/utils.py
+++ b/src/llamafactory/data/utils.py
@@ -10,7 +10,7 @@ if TYPE_CHECKING:
    from datasets import Dataset, IterableDataset
    from transformers import Seq2SeqTrainingArguments

-    from llmtuner.hparams import DataArguments
+    from ..hparams import DataArguments


 logger = get_logger(__name__)
--- a/src/llamafactory/eval/init.py
+++ b/src/llamafactory/eval/init.py
--- a/src/llamafactory/eval/evaluator.py
+++ b/src/llamafactory/eval/evaluator.py
--- a/src/llamafactory/eval/template.py
+++ b/src/llamafactory/eval/template.py
--- a/src/llamafactory/extras/init.py
+++ b/src/llamafactory/extras/init.py
--- a/src/llamafactory/extras/callbacks.py
+++ b/src/llamafactory/extras/callbacks.py
--- a/src/llamafactory/extras/constants.py
+++ b/src/llamafactory/extras/constants.py
--- a/src/llamafactory/extras/logging.py
+++ b/src/llamafactory/extras/logging.py
--- a/src/llamafactory/extras/misc.py
+++ b/src/llamafactory/extras/misc.py
@@ -30,7 +30,7 @@ except Exception:
 if TYPE_CHECKING:
    from trl import AutoModelForCausalLMWithValueHead

-    from llmtuner.hparams import ModelArguments
+    from ..hparams import ModelArguments


 logger = get_logger(__name__)
--- a/src/llamafactory/extras/packages.py
+++ b/src/llamafactory/extras/packages.py
--- a/src/llamafactory/extras/ploting.py
+++ b/src/llamafactory/extras/ploting.py
--- a/src/llamafactory/hparams/init.py
+++ b/src/llamafactory/hparams/init.py
--- a/src/llamafactory/hparams/data_args.py
+++ b/src/llamafactory/hparams/data_args.py
--- a/src/llamafactory/hparams/evaluation_args.py
+++ b/src/llamafactory/hparams/evaluation_args.py
--- a/src/llamafactory/hparams/finetuning_args.py
+++ b/src/llamafactory/hparams/finetuning_args.py
--- a/src/llamafactory/hparams/generating_args.py
+++ b/src/llamafactory/hparams/generating_args.py
--- a/src/llamafactory/hparams/model_args.py
+++ b/src/llamafactory/hparams/model_args.py
--- a/src/llamafactory/hparams/parser.py
+++ b/src/llamafactory/hparams/parser.py
--- a/src/llamafactory/model/init.py
+++ b/src/llamafactory/model/init.py
--- a/src/llamafactory/model/adapter.py
+++ b/src/llamafactory/model/adapter.py
--- a/src/llamafactory/model/loader.py
+++ b/src/llamafactory/model/loader.py
--- a/src/llamafactory/model/patcher.py
+++ b/src/llamafactory/model/patcher.py
--- a/src/llamafactory/model/utils/init.py
+++ b/src/llamafactory/model/utils/init.py
--- a/src/llamafactory/model/utils/attention.py
+++ b/src/llamafactory/model/utils/attention.py
--- a/src/llamafactory/model/utils/checkpointing.py
+++ b/src/llamafactory/model/utils/checkpointing.py
--- a/src/llamafactory/model/utils/embedding.py
+++ b/src/llamafactory/model/utils/embedding.py
--- a/src/llamafactory/model/utils/longlora.py
+++ b/src/llamafactory/model/utils/longlora.py
--- a/src/llamafactory/model/utils/misc.py
+++ b/src/llamafactory/model/utils/misc.py
--- a/src/llamafactory/model/utils/mod.py
+++ b/src/llamafactory/model/utils/mod.py
--- a/src/llamafactory/model/utils/moe.py
+++ b/src/llamafactory/model/utils/moe.py
--- a/src/llamafactory/model/utils/quantization.py
+++ b/src/llamafactory/model/utils/quantization.py
--- a/src/llamafactory/model/utils/rope.py
+++ b/src/llamafactory/model/utils/rope.py
--- a/src/llamafactory/model/utils/unsloth.py
+++ b/src/llamafactory/model/utils/unsloth.py
--- a/src/llamafactory/model/utils/valuehead.py
+++ b/src/llamafactory/model/utils/valuehead.py
--- a/src/llamafactory/model/utils/visual.py
+++ b/src/llamafactory/model/utils/visual.py
--- a/src/llamafactory/train/init.py
+++ b/src/llamafactory/train/init.py
--- a/src/llamafactory/train/dpo/init.py
+++ b/src/llamafactory/train/dpo/init.py
--- a/src/llamafactory/train/dpo/trainer.py
+++ b/src/llamafactory/train/dpo/trainer.py
--- a/src/llamafactory/train/dpo/workflow.py
+++ b/src/llamafactory/train/dpo/workflow.py
--- a/src/llamafactory/train/orpo/init.py
+++ b/src/llamafactory/train/orpo/init.py
--- a/src/llamafactory/train/orpo/trainer.py
+++ b/src/llamafactory/train/orpo/trainer.py
--- a/src/llamafactory/train/orpo/workflow.py
+++ b/src/llamafactory/train/orpo/workflow.py
--- a/src/llamafactory/train/ppo/init.py
+++ b/src/llamafactory/train/ppo/init.py
--- a/src/llamafactory/train/ppo/trainer.py
+++ b/src/llamafactory/train/ppo/trainer.py
--- a/src/llamafactory/train/ppo/utils.py
+++ b/src/llamafactory/train/ppo/utils.py
--- a/src/llamafactory/train/ppo/workflow.py
+++ b/src/llamafactory/train/ppo/workflow.py
--- a/src/llamafactory/train/pt/init.py
+++ b/src/llamafactory/train/pt/init.py
--- a/src/llamafactory/train/pt/trainer.py
+++ b/src/llamafactory/train/pt/trainer.py
--- a/src/llamafactory/train/pt/workflow.py
+++ b/src/llamafactory/train/pt/workflow.py
--- a/src/llamafactory/train/rm/init.py
+++ b/src/llamafactory/train/rm/init.py
--- a/src/llamafactory/train/rm/metric.py
+++ b/src/llamafactory/train/rm/metric.py
--- a/src/llamafactory/train/rm/trainer.py
+++ b/src/llamafactory/train/rm/trainer.py
--- a/src/llamafactory/train/rm/workflow.py
+++ b/src/llamafactory/train/rm/workflow.py
--- a/src/llamafactory/train/sft/init.py
+++ b/src/llamafactory/train/sft/init.py
--- a/src/llamafactory/train/sft/metric.py
+++ b/src/llamafactory/train/sft/metric.py
--- a/src/llamafactory/train/sft/trainer.py
+++ b/src/llamafactory/train/sft/trainer.py
--- a/src/llamafactory/train/sft/workflow.py
+++ b/src/llamafactory/train/sft/workflow.py
--- a/src/llamafactory/train/tuner.py
+++ b/src/llamafactory/train/tuner.py
--- a/src/llamafactory/train/utils.py
+++ b/src/llamafactory/train/utils.py
--- a/src/llamafactory/webui/init.py
+++ b/src/llamafactory/webui/init.py
--- a/src/llamafactory/webui/chatter.py
+++ b/src/llamafactory/webui/chatter.py
--- a/src/llamafactory/webui/common.py
+++ b/src/llamafactory/webui/common.py
--- a/src/llamafactory/webui/components/init.py
+++ b/src/llamafactory/webui/components/init.py
--- a/src/llamafactory/webui/components/chatbot.py
+++ b/src/llamafactory/webui/components/chatbot.py
--- a/src/llamafactory/webui/components/data.py
+++ b/src/llamafactory/webui/components/data.py
--- a/src/llamafactory/webui/components/eval.py
+++ b/src/llamafactory/webui/components/eval.py
--- a/src/llamafactory/webui/components/export.py
+++ b/src/llamafactory/webui/components/export.py
--- a/src/llamafactory/webui/components/infer.py
+++ b/src/llamafactory/webui/components/infer.py
--- a/src/llamafactory/webui/components/top.py
+++ b/src/llamafactory/webui/components/top.py
--- a/src/llamafactory/webui/components/train.py
+++ b/src/llamafactory/webui/components/train.py
--- a/Show More
+++ b/Show More