LLaMA-Factory

mirror of https://github.com/hiyouga/LLaMA-Factory.git synced 2026-06-22 07:08:57 +08:00

Author	SHA1	Message	Date
hiyouga	64c931c0db	set dev version Former-commit-id: `3dfe4cf611`	2024-04-11 20:27:34 +08:00
hiyouga	431e9804ee	release v0.6.2 Former-commit-id: `9d4c949461`	2024-04-11 20:08:51 +08:00
hiyouga	797077a46e	Merge branch 'main' of https://github.com/hiyouga/LLaMA-Factory Former-commit-id: `51d0a1a19e`	2024-04-10 23:58:18 +08:00
hiyouga	d5ca8763ea	fix #3225 Former-commit-id: `a99f5ed0b6`	2024-04-10 23:57:59 +08:00
hoshi-hiyouga	77d16ada1e	Update adapter.py Former-commit-id: `98bc97d8d2`	2024-04-10 00:57:51 +08:00
hoshi-hiyouga	e5b4cb62e0	Update adapter.py Former-commit-id: `2111b586b6`	2024-04-10 00:57:30 +08:00
Erich Schubert	3dccd3c67e	Pass additional_target to unsloth Fixes #3200 Former-commit-id: `b5eefe5c4c`	2024-04-09 17:53:40 +02:00
hiyouga	0e08c209c4	fix quant infer and qwen2moe Former-commit-id: `7f6c2486b8`	2024-04-09 17:12:59 +08:00
hiyouga	3069f37021	tiny fix Former-commit-id: `9a99fbc86d`	2024-04-08 21:28:39 +08:00
hoshi-hiyouga	8682d033eb	Merge pull request #3161 from hiyouga/feature/add-mediatek-model support Breeze-7B Former-commit-id: `4c6c4a0d88`	2024-04-08 20:56:51 +08:00
codingma	b5f0ac4c3f	add empty line Former-commit-id: `7b76b4ca08`	2024-04-07 18:28:08 +08:00
codingma	fecab4d3f1	rename template to breeze Former-commit-id: `34bdcba017`	2024-04-07 18:27:20 +08:00
codingma	ed14f8bae7	rename template to breeze Former-commit-id: `5a780e9eec`	2024-04-07 11:39:54 +08:00
codingma	80aa1f70b6	support https://github.com/hiyouga/LLaMA-Factory/issues/3152 Former-commit-id: `2565a32bd9`	2024-04-07 11:34:01 +08:00
sliderSun	7037dcbf38	fix spell error Former-commit-id: `1d117b7bb6`	2024-04-07 10:59:15 +08:00
sliderSun	1fbf190eda	support Qwen1.5-32B Former-commit-id: `21650d467c`	2024-04-07 10:56:03 +08:00
sliderSun	09107affda	support Qwen1.5-32B Former-commit-id: `77044d9ef4`	2024-04-07 10:26:13 +08:00
hiyouga	51a23c3aaf	tiny fix Former-commit-id: `a6d943804b`	2024-04-04 02:19:03 +08:00
hiyouga	f334b89616	back to gradio 4.21 and fix chat Former-commit-id: `4b920f24d3`	2024-04-04 02:07:20 +08:00
hiyouga	54a4a8217a	fix bug in latest gradio Former-commit-id: `5ddcecda50`	2024-04-04 00:55:31 +08:00
hiyouga	a6d347726f	fix requires for windows Former-commit-id: `7f6e412604`	2024-04-03 21:56:43 +08:00
hiyouga	2ecf2bcbf0	fix resize vocab at inference #3022 Former-commit-id: `148bda353f`	2024-04-03 18:14:24 +08:00
hiyouga	88d9f47a0b	fix #3116 Former-commit-id: `ce77d98872`	2024-04-03 14:47:59 +08:00
hiyouga	bf5ffeeae0	simplify readme Former-commit-id: `92dab8a90b`	2024-04-02 20:07:43 +08:00
hiyouga	f4be51f356	add moe aux loss control #3085 Former-commit-id: `b267aeb53f`	2024-04-02 14:26:31 +08:00
hiyouga	c7104f8fab	fix #3022 Former-commit-id: `9ddbe2866a`	2024-04-02 13:58:39 +08:00
hiyouga	ab6476a9a4	set dev version Former-commit-id: `dd73a0c248`	2024-04-01 23:24:08 +08:00
hiyouga	829cf6458a	fix #3083 Former-commit-id: `4a6ca621c0`	2024-04-01 22:53:52 +08:00
hiyouga	8d987b7af7	add qwen1.5 moe Former-commit-id: `54b7d34908`	2024-04-01 21:49:40 +08:00
hiyouga	34f1de0574	fix #3077 Former-commit-id: `aee634cd20`	2024-04-01 21:35:18 +08:00
hiyouga	b7468ea0a8	support infer 4bit model on GPUs #3023 Former-commit-id: `eb259cc573`	2024-04-01 17:34:04 +08:00
hiyouga	cefe7f7bcf	update webui Former-commit-id: `d0842f6828`	2024-04-01 16:23:28 +08:00
hiyouga	bd52e2b404	fix ORPO loss Former-commit-id: `816d714146`	2024-04-01 14:42:41 +08:00
hiyouga	69e1d39832	fix IPO and ORPO loss Former-commit-id: `5b9b40403d`	2024-04-01 14:37:53 +08:00
hiyouga	e7ade84bba	fix plots Former-commit-id: `5907216a1c`	2024-03-31 19:43:48 +08:00
hiyouga	b873dcb09d	use log1p in orpo loss https://github.com/huggingface/trl/pull/1491 Former-commit-id: `68aaa4904b`	2024-03-31 19:27:08 +08:00
hiyouga	ddad9be81d	update readme Former-commit-id: `099db6acc0`	2024-03-31 18:46:34 +08:00
hiyouga	35b3516812	support orpo in webui Former-commit-id: `5195add324`	2024-03-31 18:34:59 +08:00
hiyouga	2f878bde11	support ORPO Former-commit-id: `17bf8a2c3a`	2024-03-31 18:29:50 +08:00
hiyouga	3cf35e57db	tiny fix Former-commit-id: `27776c3474`	2024-03-31 00:10:29 +08:00
marko1616	5721074af1	fix blank line contains whitespace Former-commit-id: `d9a5134617`	2024-03-30 23:46:55 +08:00
marko1616	67c05c2031	Fix Llama model save for full param train Former-commit-id: `eb178eaff3`	2024-03-30 23:45:04 +08:00
hiyouga	3bf6dde3a5	support save args in webui #2807 #3046 some ideas are borrowed from @marko1616 Former-commit-id: `7a086ed333`	2024-03-30 23:09:12 +08:00
hiyouga	808ad2071f	upgrade gradio to 4.21.0 Former-commit-id: `831c5321ac`	2024-03-30 20:37:08 +08:00
hiyouga	fc066cad7f	release v0.6.1 Former-commit-id: `ca793028c6`	2024-03-29 11:36:08 +08:00
hiyouga	e4f3d583df	fix #2982 Former-commit-id: `8d603f8820`	2024-03-28 20:22:31 +08:00
hiyouga	eac2a5b1d3	fix #3010 Former-commit-id: `b19c14870d`	2024-03-28 18:31:17 +08:00
hiyouga	89c400633a	update trainers Former-commit-id: `8c77b10912`	2024-03-28 18:16:27 +08:00
zhangzc	05afeb304d	Supports custom data set sampling quantity Former-commit-id: `449e2aa38e`	2024-03-27 14:22:50 +08:00
hoshi-hiyouga	ae9ad13f2a	fix ds optimizer Former-commit-id: `3bcd41b639`	2024-03-26 23:39:56 +08:00

... 9 10 11 12 13 ...

1313 Commits