3. Градиентные обновления относятся к внутренним вычислениям модели, которая обновляется. Даже если функции награды являются "человеческими выборами", что не всегда так (например, RLAIF), способ, которым модель обновляется на наградах, зависит от весов и активаций модели, и
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
12 Лайков
Награда
12
7
Репост
Поделиться
комментарий
0/400
MidnightGenesis
· 10ч назад
Градиентная матрица выглядит странно, стоит изучить.
Посмотреть ОригиналОтветить0
AirdropChaser
· 21ч назад
Градированный уравнение смотрел в недоумении
Посмотреть ОригиналОтветить0
DataPickledFish
· 21ч назад
Это слишком сложно.
Посмотреть ОригиналОтветить0
GateUser-7b078580
· 21ч назад
Градиентное обновление этот Алгоритм неразумно....
3. Градиентные обновления относятся к внутренним вычислениям модели, которая обновляется. Даже если функции награды являются "человеческими выборами", что не всегда так (например, RLAIF), способ, которым модель обновляется на наградах, зависит от весов и активаций модели, и