LLaMA-Factory

mirror of https://github.com/hiyouga/LLaMA-Factory.git synced 2025-08-02 11:42:49 +08:00

Author	SHA1	Message	Date
hiyouga	d2df4c22ab	support mllm hf inference Former-commit-id: e057c8de486bfbc829240924f9238d6212c917f1	2024-04-26 05:34:58 +08:00
hiyouga	fc066cad7f	release v0.6.1 Former-commit-id: ca793028c69433eae405009c5ebb790c6c2d40c4	2024-03-29 11:36:08 +08:00
hiyouga	e4f3d583df	fix #2982 Former-commit-id: 8d603f8820efd1617557f2bc5d9674143abe7c57	2024-03-28 20:22:31 +08:00
hiyouga	89c400633a	update trainers Former-commit-id: 8c77b1091296e204dc3c8c1f157c288ca5b236bd	2024-03-28 18:16:27 +08:00
hiyouga	8717e98200	fix #2777 #2895 Former-commit-id: 9bec3c98a22c91b1c28fda757db51eb780291641	2024-03-20 17:59:45 +08:00
hiyouga	4a4e4b4354	support layerwise galore Former-commit-id: 8664262cde3919e10eaecbd66e8c5d356856362e	2024-03-10 00:24:11 +08:00
hiyouga	2c010c72b8	support galore Former-commit-id: 28f78621883917425fabe49f5473778111012127	2024-03-07 22:41:36 +08:00
hiyouga	d1e6e02461	fix #2649 Former-commit-id: 4e5fae2fac85227641bd16159cf296a32e0b18b4	2024-03-01 13:02:41 +08:00
stephen	1b4d54b873	update project_kwargs for ppo config Former-commit-id: 42c23798f27977af777587ded7f4845010f0184a	2024-02-21 13:47:38 +08:00
hiyouga	b27e91222c	format style Former-commit-id: 638234ceee1b19716e45b6e5f4ea54d9122da4df	2024-01-20 20:15:56 +08:00
hiyouga	2f7684a8ee	fix tests Former-commit-id: f6d6e00337ebef8740d180836dcb18d0e6a3c59a	2024-01-20 19:58:04 +08:00
hiyouga	4e3bfb799d	support function calling Former-commit-id: d9f1cae35150cce594a7abd96dd2beb811fa33f2	2024-01-18 09:54:23 +08:00
hiyouga	6378864390	fix #2161 Former-commit-id: 898ec3696a4d2db48485fb7263f866599437d626	2024-01-11 17:04:13 +08:00
hiyouga	61960189b2	fix #1789 Former-commit-id: 4571068e1e00dc234c9131185fe0924c726add84	2024-01-09 18:31:27 +08:00
hiyouga	1cb390b9b2	implement rm server #1543 Former-commit-id: 7df4f3ab206fddb462f6ed865eaf04234fd72ed6	2023-12-03 20:52:54 +08:00
hiyouga	f06c4c8f7a	update ppo trainer Former-commit-id: 5021062493ed63ad1f6133cfb543e4e7f528d2cc	2023-11-20 21:39:15 +08:00
hoshi-hiyouga	d72f123851	Merge pull request #1553 from hannlp/hans Change the default argument settings for PPO training Former-commit-id: 48211e3799a16de946360930d3d92f5a40e9d12d	2023-11-20 20:32:55 +08:00
hiyouga	682d81caa9	fix #1567 Former-commit-id: 99a3f06377d2886c4000ce7e3583b12ca965534d	2023-11-20 18:46:36 +08:00
Yuchen Han	a419122179	Update workflow.py Former-commit-id: eeb5249d0b6ce0816e1fa47afc3a853c7b267cbf	2023-11-17 00:16:27 -08:00
hiyouga	eb5a852dd5	fix import bug Former-commit-id: 35b91ea34caade45dd51813b94da5177b852aa4c	2023-11-16 02:27:03 +08:00
hiyouga	f441932bd1	support full-parameter PPO Former-commit-id: ce783036001397a20b0b4c5da2fea6d0c03389d2	2023-11-16 02:08:04 +08:00
hiyouga	06a4820836	disentangle model from tuner and rename modules Former-commit-id: 4736344eb1595ee023a50d49e8118f4eee46305f	2023-11-15 16:29:09 +08:00

22 Commits