Идея маркера в обучении животных принадлежит психологу Б.Ф. Скиннеру. У меня было много возможностей поговорить с ним, когда он был в Ванкувере в гостях у дочери, которая была замужем за работником исторического факультета в моем университете. Во время таких визитов он часто заглядывал на факультет психологии к друзьям и знакомым. Я помню, как однажды спросил его о том, как дрессировщики собак могут использовать маркеры. Меня интересовало, нужен ли животному сигнал, который сообщает, что оно сделало что-то неправильно, раз уж мы используем маркер, который отмечает правильное поведение и предсказывает награду.
«Каждый раз, когда вы поощряете животное за что-то, вы подкрепляете поведение и повышаете вероятность его повторения в будущем. Если сообщать животному, что оно делает что-то неправильно, то такой сигнал станет своего рода наказанием. Дело в том, что животные хотят избегать всего, что связано с ситуациями, в которых может произойти наказание. Вы отгадываете кроссворды?» Я кивнул. «Кроссворды интересно решать, потому что когда угадываешь правильно, чувствуешь удовлетворение. Представьте, что будет, если каждый раз, когда вы впишете неверное слово в ряд или букву в квадрат, то головоломка зажужжит и сообщит об ошибке. Сравните такой кроссворд с обычным, где нужно просто немного поломать голову и получить правильный ответ, не слушая каких-либо негативных комментариев в процессе решения. Как думаете, вы бы добровольно выбрали головоломку, которая дает вам дополнительную информацию об ошибках, вместо привычного кроссворда?»
Я думал об этом и сделал вывод, что Скиннер был, вероятно, прав. Считаю, что я предпочел бы ситуацию, в которой бы мне сообщали только о правильных ответах, не устраивая шум из-за ошибок. Если это верно для людей, то можно предположить, что и животные, которых обучают, чувствуют то же самое. Однако до сих пор не было никаких фактических данных в поддержку этой гипотезы.
Недавно я получил копию диссертации, написанной Наоми Ротенберг, которая учится на степень магистра в Хантер колледже, Нью-Йорк. В работе сообщалось, что эксперимент был поставлен именно на эту тему. Исследование Ротенберг было довольно простым. Было задействовано 27 собак, которых обучали простому трюку (поставить обе лапы в их обруч на полу). Половина собак была обучена, используя только маркер вознаграждения (как правило, для этого используется кликер). Вторая половина группы обучалась как с кликером, так и со звуком, который сообщал собаке, что она совершила ошибку, выбрав неправильное поведение (звук был нотой, соответствующей «среднему C» на фортепиано).
В процессе обучения экспериментатор подавал команду «обруч», заманивал собаку в нужном направлении, после чего собака слышала щелчок и получала награду. Обучение было разбито на шесть различных уровней, в которых приманка постепенно убиралась. На самом сложном уровне уровне собака должна была выполнить действие по голосовой команде. Количество уровней, которые собака прошла успешно, было одним из показателей того, как много она выучила. Кроме того, дополнительной мерой успешности был процент правильных действий.
Результаты оказались вполне однозначными. У собак, правильные попытки которых вознаграждались, а неправильные игнорировались, результаты были намного лучше. Эти собаки учились быстрее и достигали более высокого уровня, чем собаки, которые получали «дополнительную информацию» об ошибке. Во время тренировок медианный показатель уровня собак, чьи ошибки были проигнорированы, был 4 (из 6), в то время как в группе тех, кто получал сигналы и о награде, и об ошибке, медианный показатель составил 1. В процентном соотношении правильных попыток собаки, которых учили только с кликером, достигли 60%, в то время как те собаки, которым также сообщалось об ошибке, выбирали верные действия 27% времени. Статистический анализ показал, что в целом собаки, которым сообщалось только о верном действии, обучались в два раза быстрее.
Другими словами, собаки, которые в процессе обучения выбирают верные действия и получают за них вознаграждение, придерживаются задачи и в итоге добиваются успеха, а те собаки, которые получают два вида маркеров, похоже, впадают в уныние и отказываются выполнять задачу.
Автор: Стенли Корен, https://www.psychologytoday.com/blog/canine-corner/201603/should-trainers-tell-dogs-when-their-behavior-is-wrong
Перевод: «Плохие собаки» © baddogs.by
Добавить комментарий