Tuesday, July 9, 2013

Reinforcement Learning Terminology and Lectures - Учене с подсилване, учене с подкрепение, подкрепящ стимул, подкрепление и др. термини

Семинар за начинаещи на колега от "Хакафе", който се проведе неотдавна в "Телерик": http://academy.telerik.com/seminars/software-engineering/agent-systems

На мен от цялата работа най-интересен ми е терминологичният езиков въпрос, той дава насока и на мисълта на студентите.

В психологията по принцип се използват термини като "подкрепление", "подкрепящ стимул", "учене с подкрепление". Аз лично използвам "с подсилване" (и одобрявам психологическите термини), може би  "с потвърждение" също са подходящи - определени стимули потвърждават или отхвърлят текущата посока на поведението.

Терминът на Стефан е "подсилено обучение", според мен е най-неподходящ.

...

Някои мои лекции по темата от университетските ми курсове "Универсален изкуствен разум" (2010) и "Математическа теория на разума" (2011):

Двигатели на човешкото  поведение. Бихевиоризъм - учене с подсилване. Учене с учител и подражание. (По-психологически и невропсихологически насочена)

http://research.twenkid.com/agi_2011/Reinforcement_Learning_Anatomy_of_human_behaviour_22_4_2010.pdf

Универсална интелигентност: Дефиниция на агента на Маркус Хутер (По-математическа, по работата на Хутер и Лег "Универсална интелигентност: Дефиниция на машинната интелигентност")

http://research.twenkid.com/agi_2011/Reinforcement_Learning_Anatomy_of_human_behaviour_22_4_2010.pdf

И разбира се тази класическа статия от 2004 г. "Анализ на смисъла на изречение въз основа на базата знания на действаща мислеща машина. Мисли за смисъла и изкуствената мисъл."
Има я препечатана и в блога:

http://eim.hit.bg/razum/netid-65395.html



No comments :