Режим подкрепления

Кормление голубя зерном всякий раз, когда он сделает то, что вы хотите, — лучший способ научить его задуманному вами. Это также лучший из способов, гарантирующий, что задуманные вами конкретные действия будут осуществлены. Но если вы захотите сберечь зерно и свои силы, то почти тот же самый эффект можно получить, давая зерно через какие-то промежутки времени (В. F. Skinner, 1962). Несколько иной эффект получается при подкреплении (зерном) достаточно часто, скажем через каждые 5 мин, или при подкреплении после того, как действие, которое вы пытаетесь выработать, повторилось несколько раз.

Подобные способы предъявления подкрепления принято называть режимом подкрепления. Подкрепление каждой реакции или каждой десятой реакции есть пример режима с фиксированным коэффициентом. Подкрепление через каждые 10 мин есть пример подкрепления с фиксированным интервалом. Режимы, отличающиеся интервалом или коэффициентом, влияют на научение обычным образом и закрепляют конкретные действия. Различные режимы по-разному сказываются на поведении. Для изучающих научение и обучение важен фиксированный коэффициент, означающий, что подкрепление осуществляется всякий раз, когда производится требуемое действие, и переменный коэффициент, указывающий на нерегулярный характер подкрепления. В первом случае учитель всякий раз, когда обучающийся выполняет действие, которое он, учитель, рассматривает как часть научения, как-то подкрепляет это действие; режим такого типа ведет к научению кратчайшим путем. Во втором случае учитель осуществляет подкрепление от случая к случаю: обучающийся может поощряться за «правильные» действия, но никогда за «неверные» действия. Режим этого типа наиболее эффективен для сохранения поведения, к которому он относится.

Хотя первые работы с режимами подкрепления осуществлялись с обучающимися, не являющимися людьми, имеется достаточно доказательств, что те же процессы могут использоваться и при научении человека (К. D. O’Leary, S. G. O’Leary, 1977). При исследовании процесса научения у животных получены также доказательства, что определявшим ход научения типом графика можно объяснить человекоподобные действия, которые с первого взгляда кажутся слишком сложными для существ, непохожих на человека.

Скиннер обращает внимание на тот факт, что возможность подкрепления требуемого поведения существует и в обычной жизни, а не только в научной лаборатории. В своей работе о природе подобного подкрепления он приводит много примеров тому, а в своем романе «Уолден два» (В. F. Skinner, 1948) описывает гипотетическое  общество, использующее такие возможности. В качестве примера режима с фиксированным коэффициентом, действующего в осуществляемой человеком работе, Скиннер приводит сдельную работу на промышленных предприятиях, где уровень заработной платы зависит от числа правильно выполненных заданий. Примером действия режима с переменным коэффициентом является деятельность профессионального игрока, чей высокий уровень активности регулируется низким уровнем подкрепления (выигрыш) .

Но в психопедагогике нас интересует не столько выполнение весьма специфической деятельности, такой, как работа на машине, собирающей фрукты, или получение доходов от игры в бинго, сколько формирование новых способностей. Тем не менее необходимо возобновлять пути, по которым действует какое-то конкретное подкрепление, поскольку естественно предположить, что вновь выработанные способности предназначены для какой-то цели, а если обучающийся не получает никаких указаний, для чего ему понадобятся осваиваемые им навыки, то постепенно они забываются. Следовательно, на учителя возложена обязанность, как только ученик обучился новому навыку, показать ему, чем этот навык полезен. Другими словами, учителя должны так организовывать свой предмет, чтобы отчасти подкрепление происходило сразу после научения. Подкреплением научения в школе обычно выступает успешное выполнение какого-то задания (урока). Еще одним возможным подкреплением является одобрение учителя. Таким образом, закрепление нового научения может возрастать, если учитель соотнесет связанные с этим научением задания с возможностями обучающегося, что создаст у него уверенность как в успехе, так и в правомерности успеха, или же даст понять, что ему весьма приятно, когда он видит, как ученики пользуются вновь приобретенным научением. Разумеется, в идеале оба типа подкрепления должны действовать совместно.

Если учесть всю сложность одной из самых человеческих ситуаций — ситуации обучения, особенно в школе, где на одного учителя приходится не один ученик, то понятно, почему столь трудно построить подкрепление таким образом, чтобы оно фиксировало каждый правильный шаг на пути к новому научению. Частичное подкрепление позволяет подойти к решению этих проблем. Тщательная систематизация задач овладения новым научением, организованная таким образом, что обучающийся время от времени получает свидетельство успешности своих действий, помогает утвердиться новому навыку более прочно и реально, чем в случае, когда подкрепление дается каждый раз. К только что освоенному научению применимы те же принципы, но в этом случае появляется еще один важный аспект рассмотрения. Обучающийся, овладевая навыком на практике, может делать ошибочные шаги, замедляющие выполнение задачи, и даже если он успешно справится с задачей, успех, скорее всего, закрепит не только правильные, но и ошибочные действия, что в свою очередь утвердит обучающегося в его ошибках, если, конечно, он не поймет неправильность некоторых из своих умении. Проблемой того же типа является получение правильного ответа при помощи ошибочных действий, скажем догадка в математике. Сам факт, что догадка случайно оказалась правильной, играет роль подкрепления по типу режима с переменным коэффициентом (Е. A. Lun-zer, 1968). На эти трудные проблемы не так-то легко найти ответ. Подробный анализ природы научения помогает такие проблемы выявить, и тщательная экспериментальная проверка действенности используемых методов обучения в этом случае не помешает.

Помимо научения, которому учитель пытается обучить своих учеников, они, общаясь с ним, с соучениками и вообще присутствуя в школе, научаются массе других вещей. Маклейш (J. McLeish, 1976) в своей работе приводит интересные сведения, проливающие свет на способ, каким осуществляется подкрепление при групповом обучении. Проведя обширное исследование процесса научения в группах студентов-старшекурсников, он пришел к выводу. студенты из программ обучения усваивают очень немногое, а основную долю сведений они черпают в общении друг с другом. Он также установил, что научение в этом случае происходит под воздействием подкрепления в соответствии с принципами, провозглашенными Павловым и Скиннером, хотя стимул и ответная реакция, характерные для научения человеческих существ в социальном окружении, более сложны и динамичны.

Кроме того, подкрепление, и частичное в особенности, по-видимому, является мощным фактором формирования установок и социального поведения, и, разумеется, тех его аспектов, которые принято обозначать как школьное прилежание (class conduct). Такие вещи, как готовность ответить на вопрос учителя, участие в обсуждении во время урока и соблюдение правил поведения в классе, есть пример хорошего поведения, которое время от времени должно чем-то подкрепляться. Вместе с тем нежелательное поведение в классе могут закрепить случайные непродуманные действия учителя в ответ на плохие поступки, поскольку самая обычная реакция на них может привлечь внимание к ученику и обусловить такое поведение.