LLaMA-Factory

mirror of https://github.com/hiyouga/LLaMA-Factory.git synced 2026-06-20 22:28:55 +08:00

Author	SHA1	Message	Date
ylfeng	62d55b71a3	remove empty line Former-commit-id: `b47e317447`	2024-05-31 21:43:08 +08:00
ylfeng	0feb2ad35c	fix eos Former-commit-id: `84aee57901`	2024-05-31 21:40:41 +08:00
ylfeng	8350e508d3	supervised packing with greedy knapsack algorithm Former-commit-id: `f9db439cb7`	2024-05-31 15:33:54 +08:00
hoshi-hiyouga	9b6bdf9449	Merge pull request #3829 from seanzhang-zhichen/add_dataset_sample_num Add dataset sample num Former-commit-id: `483eb47e5d`	2024-05-30 00:25:45 +08:00
hoshi-hiyouga	7b83c550ab	Update loader.py Former-commit-id: `ca5dd7c6c1`	2024-05-30 00:20:20 +08:00
hoshi-hiyouga	9fc713da89	Update loader.py Former-commit-id: `f9a88b89ca`	2024-05-30 00:17:21 +08:00
hoshi-hiyouga	c0f11a280e	Update loader.py Former-commit-id: `b55fb611c5`	2024-05-30 00:12:12 +08:00
hoshi-hiyouga	69a51cacb1	Update parser.py Former-commit-id: `51dd454337`	2024-05-30 00:05:20 +08:00
hiyouga	820404946e	better llamaboard * easily resume from checkpoint * support full and freeze checkpoints * faster ui Former-commit-id: `8070871732`	2024-05-29 23:55:38 +08:00
hiyouga	19a3262387	fix cohere system Former-commit-id: `d0aa36b8ad`	2024-05-29 20:58:23 +08:00
hiyouga	c05cb3769f	fix #3965 Former-commit-id: `0930f58699`	2024-05-29 20:55:51 +08:00
hiyouga	a71a6a05c3	update readme Former-commit-id: `89ca832740`	2024-05-29 18:39:11 +08:00
hzhaoy	ce1be3da4b	add TeleChat-12B/TeleChat-12B-v2 models Former-commit-id: `0dd632fe9e`	2024-05-29 15:00:37 +08:00
hiyouga	05277ee864	fix hf chat engine Former-commit-id: `97346c1d3d`	2024-05-29 01:20:07 +08:00
hiyouga	13e7b64641	add ds config to webui Former-commit-id: `e4b420c146`	2024-05-29 01:13:17 +08:00
hiyouga	468d0e7ed1	10x generate in ppo w/ zero3 https://github.com/huggingface/trl/pull/1483 Former-commit-id: `65cd8bdbdb`	2024-05-29 00:23:23 +08:00
hiyouga	bfac965f9c	update dpo, kto trainer Former-commit-id: `7c8e01bb74`	2024-05-29 00:14:29 +08:00
hiyouga	14f6cc2b7c	clean kto trainer Former-commit-id: `900e1ea622`	2024-05-28 21:43:26 +08:00
hiyouga	87e71df597	bump vllm version to 0.4.1 Former-commit-id: `1e80a3a638`	2024-05-28 21:27:27 +08:00
hiyouga	3152c7dd1c	update readme Former-commit-id: `087b9faa39`	2024-05-28 19:35:52 +08:00
hiyouga	3ea8f5e6b9	support DDP in webui Former-commit-id: `7c016b22aa`	2024-05-28 19:24:22 +08:00
Yimi81	7324984127	fix yi template Former-commit-id: `dc07413e7d`	2024-05-27 13:11:25 +00:00
hiyouga	0706dbf7e6	tiny fix Former-commit-id: `c1fdf81df6`	2024-05-27 20:54:26 +08:00
hoshi-hiyouga	ad3ca3f556	Merge pull request #3921 from gusye1234/main Add openchat-3.6-8B support Former-commit-id: `87ea0a8bcd`	2024-05-27 20:52:37 +08:00
hoshi-hiyouga	eceec1d7fd	Update template.py Former-commit-id: `f1002b9f93`	2024-05-27 20:51:56 +08:00
hoshi-hiyouga	b7b8223230	Update template.py Former-commit-id: `122213a7a7`	2024-05-27 20:51:26 +08:00
Jianbai Ye	d2c1df7f3d	add openchat-3.6-8B support Former-commit-id: `cff815391f`	2024-05-27 20:42:08 +08:00
hiyouga	b88ecd71fd	fix full/freeze tuning for mllm Former-commit-id: `08564838bd`	2024-05-27 20:37:57 +08:00
hoshi-hiyouga	605e70d0e1	Merge pull request #3835 from BUAADreamer/main fix some features in llava-style training Former-commit-id: `838f2fb3e4`	2024-05-27 20:23:45 +08:00
hiyouga	fc5a6b5c4e	support Aya23 Former-commit-id: `e626e26446`	2024-05-27 20:23:24 +08:00
BUAADreamer	5632ba3fa8	Merge branch 'hiyouga:main' into main Former-commit-id: `ea2afd429e`	2024-05-27 19:00:48 +08:00
BUAADreamer	606240aec0	add regex of only tune lm and mm_proj Former-commit-id: `57eb13b75d`	2024-05-27 18:59:00 +08:00
hiyouga	51a1097c64	add phi-3 7b/14b, mistral v0.3 models Former-commit-id: `efa4b196ca`	2024-05-27 18:20:16 +08:00
hiyouga	df33548b39	update readme Former-commit-id: `5581cb2e4e`	2024-05-27 18:14:02 +08:00
BUAADreamer	a6c2a2071d	Merge branch 'hiyouga:main' into main Former-commit-id: `4bc7c10c00`	2024-05-27 11:54:01 +08:00
hiyouga	4807c11db8	support SimPO #3900 Former-commit-id: `cb63b32986`	2024-05-26 23:46:33 +08:00
BUAADreamer	3eaf371a22	Merge branch 'hiyouga:main' into main Former-commit-id: `60170a1da4`	2024-05-25 14:18:49 +08:00
hiyouga	e5d2ef4434	fix #3853 Former-commit-id: `063f91cc80`	2024-05-24 23:29:45 +08:00
seanzhang-zhichen	9c8d79fbe3	Merge branch 'main' into add_dataset_sample_num Former-commit-id: `27cb51f7f8`	2024-05-24 15:57:47 +08:00
BUAADreamer	119af92620	Merge branch 'hiyouga:main' into main Former-commit-id: `047a06a1e5`	2024-05-24 09:50:00 +08:00
hiyouga	3e729798df	refactor data preprocessing, fix mllm rlhf Former-commit-id: `3a023bca2a`	2024-05-24 04:08:25 +08:00
hiyouga	d3490aceb7	fix paligemma sft requires transformers>=4.41.1 Former-commit-id: `de0e67aff1`	2024-05-24 00:23:40 +08:00
hiyouga	6d8ef03741	fix oom issues in export Former-commit-id: `67ebc7b388`	2024-05-23 23:32:45 +08:00
BUAADreamer	d8a27e40e2	Merge branch 'hiyouga:main' into main Former-commit-id: `8d53ec2b5f`	2024-05-21 22:18:20 +08:00
hiyouga	4ddc1c9c16	fix paligemma sft Former-commit-id: `7134fb02bb`	2024-05-21 20:03:09 +08:00
hiyouga	11f79ea20e	fix #3847 Former-commit-id: `335501e228`	2024-05-21 17:53:06 +08:00
BUAADreamer	071d674065	support pretraining of llava Former-commit-id: `29a6d5bdb8`	2024-05-21 08:57:14 +08:00
hiyouga	cce3892f91	support paligemma Former-commit-id: `2a67457e39`	2024-05-21 00:01:22 +08:00
hiyouga	a935c5105d	fix paligemma data preprocess Former-commit-id: `e55c85ac72`	2024-05-20 23:51:32 +08:00
hiyouga	446c681b58	fix paligemma inference Former-commit-id: `542229abb3`	2024-05-20 23:36:43 +08:00

1 2

78 Commits