LLaMA-Factory

mirror of https://github.com/hiyouga/LLaMA-Factory.git synced 2025-10-16 00:28:10 +08:00

Author	SHA1	Message	Date
anvie	af2d61178d	add NEFTune optimization Former-commit-id: 603e0298af64116ac07130fe6661a9ba823c186c	2023-10-21 13:24:10 +07:00
hiyouga	c2e84d4558	refactor export, fix #1190 Former-commit-id: 30e60e37023a7c4a2db033ffec0542efa3d5cdfb	2023-10-15 16:01:48 +08:00
hiyouga	97b74d328b	fix ppo args Former-commit-id: 0f12899951808f53a482082eb116bda309775930	2023-10-11 23:40:50 +08:00
hiyouga	386d85ae72	refactor finetuning Args Former-commit-id: be425a70a4c8f051717cf1e4464dbd79dae4c0b5	2023-09-27 22:28:06 +08:00
hiyouga	6310613699	update template Former-commit-id: a95f3a4d62de1073a78125401cf4289ec0523156	2023-08-22 19:46:09 +08:00
hiyouga	2b191ca776	support ppo score norm (trl 0.5.1.dev required) Former-commit-id: 2b25db6d260ec1532281a592e873579346c7d21c	2023-08-18 12:02:42 +08:00
hiyouga	be4d2822ea	fix PPO trainer #551 , update readme Former-commit-id: faead74849470cebae9e37cde5fab2a71b32aa43	2023-08-18 11:43:10 +08:00
hiyouga	d5f1b99ac4	Release v0.1.6 Former-commit-id: 43c8b3c3c8bfb2e32d17fb3e8b194938e37d54bd	2023-08-11 23:25:57 +08:00
hiyouga	ca719a8697	support DPO training (2305.18290) Former-commit-id: 6d98de148e4af63a7028dfaeb6cf86eb56a4488f	2023-08-11 03:02:53 +08:00
hiyouga	15acd17716	update args spec Former-commit-id: a006068346edda6e2851b23d2005fdb218a7287d	2023-08-07 15:23:35 +08:00
hiyouga	2e19afedb8	support Qwen-7B, fix InternLM-7B inference Former-commit-id: 25d2ca29ecb70cbfd5206333c667042a0c4d2e5a	2023-08-03 15:53:32 +08:00
hiyouga	bcdee9fc19	fix #194 Former-commit-id: 9792921531efefb4bcddbde4380169a78fe064a6	2023-07-19 17:07:33 +08:00
hiyouga	a8deee27f8	create chat model Former-commit-id: bddf583b2fc099c957a1037418bd8504a837663e	2023-07-15 19:26:20 +08:00
hiyouga	6261fb362a	modity code structure Former-commit-id: 0682ed357210897e0b67c4a6eb31a94b3eb929f1	2023-07-15 16:54:28 +08:00

14 Commits