Обучение с подкреплением

Материал из CDTOwiki
Перейти к: навигация, поиск

НачальнаяПолезноIT/softНетМашинное обучениеОбучение с подкреплением

Сегмент
IT/softIT/soft
Рекомендовано
ПолезноПолезно
Сложность
НачальнаяНачальная
Термин
Обучение с подкреплением
Определение
Один из способов машинного обучения, в ходе которого испытуемая система (агент) обучается, взаимодействуя с некоторой средой. Откликом среды на принятые решения являются сигналы подкрепления, поэтому такое обучение является частным случаем обучения с учителем, но учителем является среда или ее модель
Синонимы
Reinforcement Learning
Варианты определения в публикациях:
Тип машинного обучения, при котором алгоритм имеет конкретную цель — например, управлять роботизированным манипулятором или играть в Го. Каждый шаг на пути к цели отмечается вознаграждением либо штрафом. Учитывая такую обратную связь, алгоритм может выработать наиболее эффективный путь к цели