Дрессировка собак с поощрением

Подтянутая дама средних лет быстро шагала по резиновому коврику в тренировочном центре, ее черный лабрадор-ретривер радостно подпрыгивал рядом с ней. Она плавно остановилась, и Скип тут же сел рядом с ней, в идеальной позе на пятках. "Да!" Я подумал про себя, а затем вздрогнул, когда Карла наклонилась и с энтузиазмом погладила Скипа по голове. Скип вскочил и попятился от своего человека.

— Карла, — мягко сказал я. — Ты только что наказал его за то, что он сидит прямо. Лицо Карлы поникло. "Слей это!" — воскликнула она. «Почему я этого не помню!»

Подождите минуту . . . с каких это пор поглаживание собаки считается наказанием? С тех пор, как Скип дал нам понять, наклонив голову и отступив от руки Карлы, что ему не нравится, когда его гладят. Все остальные лабрадоры, которых Карла содержала и обучала на протяжении всей своей жизни, обожали прикосновения в качестве награды. Карла гладила свою собаку за то, что она была хорошей, даже не думая об этом — это была хорошо обусловленная реакция. К сожалению, поскольку Скипу не нравилось, когда к нему прикасались, каждый раз, когда она делала это с ним, она на самом деле наказывала его, уменьшая вероятность того, что он снова выполнит это идеальное приседание!

Жизненные решения собаки и ее результирующее поведение основаны на том, приносит ли конкретное поведение что-то, что ей нравится (награда), или что-то, что ей не нравится (наказание). Обучение — это просто вопрос обдуманного управления наградами и наказаниями. . . Но вы должны хорошо знать свою собаку — полностью осознавать ее симпатии и антипатии — и осознавать свое собственное поведение, чтобы «дрессировка» работала на вас.

Награды и наказания
В 1950-х годах ученый-бихевиорист Б. Ф. Скиннер разработал ряд принципов, применимых ко всем живым существам с центральной нервной системой. Он обнаружил, что животные, скорее всего, будут повторять поведение, которое доставляет им удовольствие/вознаграждение, и вряд ли будут повторять поведение, которое приводит к чему-то неприятному (наказание). Нейтральные стимулы — вещи, которые не имеют значения для животного — так или иначе не влияют на поведение.

Скиннер продемонстрировал, что люди могут использовать эти простые принципы для изменения поведения животных. Поощрения — самый надежный способ преднамеренно увеличить предлагаемое поведение животного; и наоборот, наказание уменьшает такое поведение. (См. «Четыре принципа оперантного обусловливания» далее в конце рассказа). Мы с большим успехом используем эти поведенческие принципы в дрессировке собак.

Однако, как и в случае со скипом, практическое применение «поощрений» и «наказаний» варьируется от собаки к собаке, даже если определение не так. Награда — это все, что нравится конкретной собаке. Наказание — это все, что собаке не нравится.

Мы часто используем лакомства в качестве вознаграждения в дрессировке, потому что мы почти всегда можем найти еду, которую собака будет ценить достаточно высоко, чтобы она могла служить непреодолимой наградой, но еда — не единственная доступная нам награда. Помните, наградой является все, что нравится собаке. Это может быть поглаживание по голове (но не для таких собак, как Скип, которые не любят, когда их трогают), словесная похвала, игра в перетягивание каната, погоня за клюшкой или теннисным мячом, прогулка на поводке. , поездка на машине, разрешение попрыгать на диване, сигнал к пробежке по аджилити, освобождение от «ждать» выбежать во двор, разрешение пойти попрыгать в озере или сигнал собрать стадо овец.

Когда среднестатистический неопытный кинолог слышит слово «наказание», он обычно думает об открытых формах физического наказания, таких как шлепки, щипки, пинки собаки или дергание поводка. Я не рекомендую и не использую физические наказания, так как они подвергают опасности дрессировщика, портят отношения с его собакой и могут разрушить энтузиазм собаки к дрессировке. К счастью, физическое наказание — не единственный способ избавиться от нежелательного поведения.

Помните, бихевиористы определяют слово «наказание» как все, что заставляет животное снижать определенное поведение. Так, в случае Скипа, Лабрадора, который не любил, когда к нему прикасаются, достаточно было погладить его по голове после того, как он выполнил прямое приседание, чтобы он перестал выполнять это прямое приседание.

«Позитивные тренеры» — люди, которые взяли на себя обязательство тренироваться без применения боли, страха, силы или запугивания — часто используют определенные формы «наказания» (в поведенческом смысле) для достижения своих целей обучения. Например, когда собака, которая жаждет физического контакта и внимания, прыгает через дрессировщика, она поворачивается к нему спиной и отступает, удаляя как свое внимание (зрительный контакт и взаимодействие), так и возможность физического контакта с собакой. Это награды, которые собака ищет, подпрыгивая. Когда прыгающее поведение собаки продолжает приводить к потере чего-то, чего она так сильно хочет, она перестанет прыгать, особенно когда это «наказание» сочетается с «наградой» в виде внимания, угощений и ласки за то, что она сидит спокойно.

То, что на самом деле является наказанием или наградой для каждой конкретной собаки, является индивидуальным делом; с точки зрения поведения контекст решает все.

Непреднамеренное обучение
Таким образом, дрессировка — это преднамеренное использование поощрений и наказаний для целенаправленного манипулирования поведением собаки. Что иногда трудно запомнить, так это тот факт, что собаки учатся все время, независимо от того, обращаем мы на это внимание или нет. Люди часто недоумевают, почему их собаки делают то, что делают они, или не делают то, что от них хотят люди.

На самом деле это довольно просто. Собаки делают то, что им подходит; они ничего не делают, если не получают от этого чего-то.

Собаки делают то, что мы считаем «неприемлемым поведением», потому что это весело, приятно или вкусно. С точки зрения собаки, поведение, которое для нас неприемлемо, например, лазить по мусору, гоняться за кошками или спать на диване, просто весело!

Разочарованные владельцы часто говорят своим тренерам:«Он знает, что не должен этого делать! Я наказываю его, когда он это делает, но он все равно делает это. Почему?" Иногда удовольствие, которое собака получает от поведения, перевешивает «наказание» владельца. Собаку, которая сильно возбуждается от погони за кошкой через забор заднего двора, может не волновать, что на нее за это накричат.

В других случаях «наказание» может быть полезным для собаки. Например, буйный лабрадор, на которого кричат, бьют или даже пинают за то, что он прыгнул на своего хозяина, может и не подозревать, что крики, удары и пинки должны быть наказанием. Для собак, которые жаждут внимания и любят физический контакт с людьми, такое грубое обращение — просто приглашение сыграть в приятную (вознаграждающую) игру.

Кроме того, владельцы собак могут не осознавать, что они часто бездумно наказывают собаку за то, что она поступает правильно. Если вы будете делать это достаточно часто, вы непреднамеренно «приучите» свою собаку перестать предлагать желаемое поведение.

Рассмотрим женщину, чья собака наслаждается веселой игрой с несколькими собачьими приятелями в собачьем парке. Пора уходить, поэтому она зовет к себе свою собаку. Он немедленно оставляет своих приятелей по играм и мчится к ней. "Хороший пес!" — восклицает она и хватает его за поводок, выводя из парка. По ее мнению, словесная похвала была достаточной наградой, и уход из парка не имеет никакого отношения к отзыву. Но вот как это видит собака:«Мама позвала, я пришла, и веселье закончилось. Когда я прихожу к маме, происходит неприятная вещь — веселье прекращается». Скорее всего, он дважды подумает, прежде чем прийти в следующий раз, когда она позвонит, пока он играет с друзьями!

Многие люди сталкиваются с большими трудностями при обучении своей собаки надежно реагировать на зов. Возможно, они не уделили должного внимания тому, что происходит с собакой большую часть времени после того, как она приходит. Не нужно быть собачьим Эйнштейном, чтобы понять, что приходить, когда его зовут, — плохая идея, если сразу после этого с ним постоянно происходит что-то «плохое» — скажем, его запихивают в подвал или запирают на кухне от всех гостей, или выброшены на улицу под холодный дождь.

Дрессировка также может потерпеть неудачу, когда награда недостаточно ценна, чтобы мотивировать собаку пытаться ее получить. Вы должны запрограммировать автоматический ответ на сигнал «приходи» с ценным вознаграждением в отсутствие заманчивых отвлекающих факторов, прежде чем пытаться применить его перед лицом лихих белок. Немногие собаки уйдут с беличьей охоты, чтобы прийти и заработать кусок сухого корма! Многие позитивные тренеры используют разнообразные заманчивые награды и смешивают их. Тогда собака никогда не будет уверена, насколько большой будет «выплата» за ее хорошее поведение; он просто знает, что все будет хорошо.

Если вы сомневаетесь, что сочетание небольших вознаграждений (например, словесной похвалы, похлопывания или кусочка сухого корма) с более крупными вознаграждениями (например, кусками свежего мяса, погоней за мячом или возможностью бегать на свободе) является сильным мотиватором, рассмотрим игровой автомат. До тех пор, пока он не выплачивает вознаграждения, небольшие вознаграждения и лишь случайный джекпот, игроки-люди будут продолжать сидеть и дергать за ручку, когда в этом нет смысла!

Случайные акты подкрепления
Разнообразие наград в вашем наборе инструментов для дрессировки дает вам большую гибкость и позволяет дрессировать собаку, не имея при этом всегда огромного запаса лакомств в кармане. Хорошая программа дрессировки переходит к переменному подкреплению, как только собака надежно выполняет новое поведение. Вместо того, чтобы щелкать и давать собаке лакомство каждый раз, когда она выполняет какое-либо действие, вы иногда пропускаете щелчок и вместо этого хвалите собаку, затем снова просите о поведении и нажимаете следующий. Постепенно увеличивайте разнообразие и продолжительность графика подкрепления, помня о важности случайности.

Если вы просто заставите свою собаку работать все больше и больше, чтобы получить щелчок, она, скорее всего, бросит вас. Если вы меняете график подкрепления, как игровой автомат в Лас-Вегасе, он не может предсказать, когда вы окупитесь. Получу ли я клик на этот раз? В это время? В это время? Нажмите! Точно так же, как люди будут продолжать вставлять монетки, ваша собака будет с энтузиазмом предлагать действия, уверенные, что следующая монета сорвет джекпот.

Чтобы поддерживать его энтузиазм по мере того, как вы постепенно удлиняете график подкрепления, используйте другие награды, чтобы дать ему понять, что он все еще на правильном пути. Я часто использую фразу «Хорошая собака!» в качестве похвалы после того, как я щелкну и угощу, чтобы мои собаки ассоциировали такое же теплое нечеткое чувство получения пищевого вознаграждения со словесной похвалой. Затем, когда я использую словесную похвалу даже без щелчка и угощения, у них по-прежнему возникает та же классическая условная реакция на ассоциацию похвалы с едой, и это заставляет их чувствовать себя хорошо. Таким образом, «Хорошая собака!» становится полезной наградой даже без еды.

Другие награды могут больше помешать тренировочной игре. Если вы используете игрушку в качестве поощрения, вы должны остановиться и дать собаке немного поиграть с ней. Это может работать очень хорошо, чтобы усилить его по шкале энтузиазма, особенно для собаки, которая без ума от мяча или любит тянуть. Это не работает, когда вы хотите сделать много повторений дискретного поведения подряд. Если вы подбрасываете мяч каждый раз, когда он отвечает на ваш сигнал «вниз», вам потребуется много времени, чтобы сделать полдюжины повторений. Это хорошо работает в качестве поощрения за продолжительное поведение, такое как пятка. Помешанная на мяче собака может научиться крениться с полным вниманием на длинных участках в ожидании погони за мячом, которая произойдет в конце.

Время имеет решающее значение
Для успешной программы дрессировки важно понимать, что нравится и не нравится вашей собаке, и эффективно использовать эти поощрения и наказания. Чтобы быть эффективными, последствия — хорошие или плохие — должны быть реализованы в непосредственной близости от поведения, на которое вы пытаетесь повлиять.

Скажем, ваша собака опрокидывает ваш кухонный мусорный бак, пока вас нет на работе. Если вы сделаете ей выговор, когда вернетесь домой с работы, через несколько часов после того, как произошел налет на мусор, это только научит вашу собаку тому, что вы иногда бываете непредсказуемы и опасны, когда приходите домой. Каким бы «виноватым» он ни выглядел, когда вы его ругаете, он не видит связи между тем, как вы накричали на него, и тем, как он залез в мусор несколько часов назад. Ваше восприятие его явной мучительной совести, проявляющейся в его опущенной голове, отсутствии зрительного контакта и крадении вдоль плинтуса, является ошибочной интерпретацией его классических собачьих попыток языка тела подавить ваш гнев, какой бы ни была причина.

Бихевиористы сходятся во мнении, что награда или наказание должны быть доставлены в течение трех секунд, а лучше одной секунды или меньше, после поведения, которое вы пытаетесь увеличить или уменьшить. Это довольно небольшой промежуток времени, и он подчеркивает ценность использования кликера или другого маркера вознаграждения (или маркера отсутствия вознаграждения), чтобы отметить момент желаемого (или неуместного) поведения. Если вы скажете «Ой!» в тот момент, когда ваша собака вскакивает и вы отворачиваетесь, вы обучаете свою собаку маркеру отсутствия награды, который вы можете использовать, чтобы сообщить своей собаке, какое поведение заставило уйти хорошее (негативное наказание). Если вы нажмете! или сказать «Да!» в тот момент, когда ваша собака сядет, она поймет, что посадка заслужила награду, даже если вам потребуется несколько секунд, чтобы положить лакомство ей в рот, и даже если она встанет с посадки до того, как вы успеете доставить лакомство. .

Пропуск вперед
Мы с Карлой долго обсуждали, как продолжить обучение Скипа. Мы определили два варианта. Используя десенсибилизацию, мы могли бы научить Скипа тому, что похлопывание Карлы по голове действительно было наградой, последовательно сочетая ее прикосновение с невероятным вознаграждением за угощение, используя сначала нежный контакт, а затем увеличивая интенсивность, пока он не научился ассоциировать энергичное похлопывание с «действительно хорошими вещами». Карла взяла на себя обязательство делать это в долгосрочной перспективе, так как очень хотела, чтобы Скип наслаждался ее прикосновениями.

Мы также инициировали краткосрочный подход к изменению поведения Карлы, согласившись использовать с ней положительное подкрепление и отрицательное наказание. Каждый раз, когда Скип садился, а она не пыталась его погладить, Карла получала вознаграждение в виде монетки, кусочка шоколада или собачьей игрушки. Каждый раз, когда она забывала и тянулась, чтобы погладить его, я молча выходил из тренировочной комнаты на время от 30 секунд до трех минут. Это сработало прекрасно, и вскоре Скип счастливо сидел в идеальной позе на пятках, когда Карла остановилась, не опасаясь наказания за свое хорошее поведение.

– Пэт Миллер

Тренировка аджилити для собак:The Ultimate Team Sport Обучение без поводка:повышение надежности

5 лучших способов использования положительного подкрепления для поощрения собаки

Использование положительного подкрепления — один из самых простых способов дрессировки собаки. При обучении методом положительного подкрепления вы даете собаке вознаграждение, чтобы подкрепить поведение, которое вам нравится. Например, если вы просите собаку сесть, и она это делает, вы даете ей лако

Дрессировочный жаргон для собак

Если вы когда-либо посещали курсы дрессировки собак, значение этих слов и выражений может быть неочевидным. Эта статья должна помочь. Лаура Пакис, сертифицированный профессиональный кинолог и дрессировщик собак Если вы когда-нибудь посещали курсы дрессировки собак, вы знаете, что существуют опред