я читав статті про навчання за навчальними планами для LLM приблизно 3 роки тому. Використання деяких характеристик/зменшення на градієнтах для упорядкування текстових корпусів, що прискорило зближення. Хотів би згадати цю статтю
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
16 лайків
Нагородити
16
6
Поділіться
Прокоментувати
0/400
TokenAlchemist
· 08-01 21:21
чесно кажучи, градієнтне замовлення — це просто копіум... оптимальний маршрут — ось де справжній альфа.
я читав статті про навчання за навчальними планами для LLM приблизно 3 роки тому. Використання деяких характеристик/зменшення на градієнтах для упорядкування текстових корпусів, що прискорило зближення. Хотів би згадати цю статтю