Психологи-экспериментаторы и учителя, исследующие научение или занимающиеся им, очень часто направляют усилия своих учеников, помогая решить встающие перед ними проблемы научения. Но в некоторых случаях они этого не делают: экспериментаторы — когда их целью является этнологическое, а не экспериментальное изучение деятельности; учителя — когда придерживаются доктрины научения посредством открытия. Если же руководство осуществляется, то обычно оно принимает форму, которую условно можно описать как тщательно продуманную систему поощрений. В описанном выше эксперименте Скиннер пользовался зернами в качестве поощрения голубей, когда они делали то, что он задумал. Фактически пища — обычное средство поощрения в экспериментах по обучению животных, хотя в подобных экспериментах могут использоваться и такие вещи, как вода (для испытывающего жажду животного) и удовлетворение любопытства.
В экспериментальной работе и все в большей степени при изучении научения в классе используется термин подкрепление для обозначения стимула, предъявляемого после какой-то конкретной деятельности и вызывающего повторение и научение этой деятельности. Заимствуя используемые в экспериментальной работе понятия, мы тем самым открываем для себя возможность использовать в обучении некоторые принципы научения животных, хотя в целом форма и способ применения подкрепления при обучении, по-видимому, будут совершенно иными.
Работы типа проведенной Скиннером заложили основы практического использования подкрепления. Фактически одним из первых ученых, применившим строгий и систематический подход к изучению научения, был И. П. Павлов (1951). Хотя весьма распространено представление о Павлове как о человеке, занимавшемся исследованием слюноотделения у собак, в действительности он сделал гораздо больше. В частности, в его работе о научении человека постоянно обращается внимание на важность языка как посредника, преобразующего и усложняющего более простые процессы научения, которые наблюдаются у других животных. Он также неоднократно обращал внимание на тот способ, благодаря которому человек получает удовлетворение (подкрепление) при взаимодействии с окружением. Язык и успешное выполнение поставленных задач в настоящее время окончательно признаны ключевыми факторами научения человека. Следовательно, в то время как у животных подкрепление связано с удовлетворением таких потребностей, как пища, человеческая деятельность может подкрепляться похвалой учителя или удачно выполненным заданием.
Но ни Павлов, ни любой другой экспериментатор не смогли бы выработать точных представлений о природе и воздействии подкрепления на сложный процесс пучения у животных и. человека до тех пор, пока в тщательно контролируемых экспериментах с достаточно простыми ответными реакциями не были бы исследованы основания таких представлений. Вот почему Павлов много лет работал с реакцией слюноотделения у собак, прежде чем ему удалось установить принципы, которые можно было применить к научению в самых различных условиях и для весьма различных видов обучающихся.
Первые шаги по изучению научения Павлов предпринял почти сто лет назад. На это его натолкнули наблюдения, которые он делал при исследовании процесса пищеварения у собак: у животных появлялась слюна не только, когда они держали пищу во рту, но и тогда, когда они видели ее. Поскольку слюноотделение облегчает усвоение пищи, то, по-видимому, находящаяся во рту пища — естественный стимулятор слюноотделения, а слюноотделение на увиденную пищу указывает на реакцию животного на стимул несколько иного типа, чем тот, который обычно вызывает этот процесс. Если эти реакции действительно различны, то что их различает? Вот вопрос, на который попытался ответить Павлов. Первое, что удалось установить ученому,— реакции различны. Слюноотделение, вызванное находящейся во рту пищей,— естественная, постоянная и не поддающаяся изменению реакция. Слюноотделение на такой стимул, как зрительное восприятие пищи,— приобретенный стимул, который постепенно исчезает, если после такого восприятия пища не попадает в рот.
В эксперименте использовались различные стимулы. Реакцию слюноотделения вызывали такие зрительные и слуховые стимулы, как звонок, тиканье метронома, изображения геометрических фигур. Со временем, благодаря бесчисленным экспериментам, в которых изменялись как характер и способ предъявления различных стимулов, так и условия проведения опыта, Павлов и его коллеги научились абсолютно точно регулировать характер и силу реакции.
Интересно разобраться в сути новых реакций. Хотя слюноотделение на звонок нельзя назвать естественной реакцией, эта реакция сохранялась до тех пор, пока вслед за ней следовал естественный стимул — пища. Слюноотделение у собаки, слышащей звонок, вызывает обильное выделение желудочного сока, когда пища попадает в рот, и пищеварение в результате улучшается. Следовательно, слюноотделение, опережающее попадание пищи в рот, обладает определенным преимуществом. Вместе с тем если вслед за звонком никогда не следует пищи, то слюноотделение на его звон никаких преимуществ не дает и, значит, не будет происходить.
Поскольку реакции, которым научаются, нестабильны, Павлов назвал их условными, подчеркивая тем самым их зависимость от других факторов. А естественную реакцию слюноотделения на находящуюся во рту пищу он назвал безусловной. Естественный стимул — пища во рту — был назван безусловным стимулом. Стимул и последующая реакция были названы рефлексом. Слюноотделение на пищу во рту — безусловным рефлексом, поскольку такой рефлекс безотносителен к другим факторам. Слюноотделение на звонок — условным рефлексом, поскольку он зависит от стабильности появляющегося вслед за этим рефлексом безусловного стимула.
Если следовать принятой ранее терминологии, то безусловный стимул, следующий за новым, или условным, поведением, является подкреплением. Реакция слюноотделения на звук, свет и т.д. подкрепляется появлением «естественного» для слюноотделения стимула — пищи. Как только условная реакция закрепилась, она может стать основой для новых реакций, и таким образом могут возникнуть цепочки условных рефлексов: один рефлекс вызывает следующий. Но, разумеется, стабильность такой цепочки, подобно стабильности отдельного рефлекса, в конечном счете зависит от входящего в нее безусловного стимула. Работа дрессировщика животных основана на использовании таких цепочек условных рефлексов.
Почти одновременно с Павловым начал изучение процесса научения американец Э. Л. Торндайк. Его работа, как и исследование Павлова, носила экспериментальный характер, но использовавшиеся в ней методы отличались от тех, которые применялись в работе Павлова. В отличие от Павлова, Торндайк употребил метод невмешательства (Е. L. Thorndike, 1921). Способ воздействия Торндайка состоял в следующем: перед находящимся в клетке голодным животным, чаще всего перед кошкой, ставилась задача — достать находящуюся вовне пищу, открыв клетку при помощи определенных движений.
Помещенное в клетку животное поначалу редко предпринимает попытки достать пищу. Рано или поздно открывающий клетку механизм срабатывает, животное освобождается и получает пищу. В последующих опытах активность животного постепенно растет, и оно сосредоточивает свои действия на той части клетки, которая ведет на свободу. Время, затрачиваемое животным на освобождение, от опыта к опыту уменьшается, и в конечном итоге животное почти сразу добирается до пиши.
Как видите, Торндайк не помогал своим подопечным, а Павлов осуществлял неослабный контроль над процессом научения своих животных. Но не приходится сомневаться, что оба подхода имеют много общего. Торндайк утверждал: «Обучение есть установление связей». Павлов же говорил о временных связях, обозначенных им как условный рефлекс. Как тот, так и другой отмечали обусловленность процессов научения. Поясним это на примере. Младенец очень скоро научается начинать сосание, как только он принимает положение, в котором происходит кормление, поскольку он связывает это положение с тем, что почти сразу же после этого у него во рту окажется сосок. Точно так же, если его начинают кормить, после того как он закричал, то между криком и кормлением у него устанавливается связь. Поэтому, ощущая голод, он, скорее всего, начнет кричать, что в свою очередь приведет к тому, что его покормят. Оба случая есть пример связи, которая устанавливается между двумя явно несвязанными явлениями. Первый случай есть тип связей, которые изучал Павлов, и его часто обозначают термином классическое обусловливание (classical conditioning). Связи этого типа возникают, когда один стимульный сигнал поступает вслед за другим стимульным сигналом. Нахождение в определенном положении является для младенца сигналом, что вскоре ему дадут сосок. Второй случай отличается от первого тем, что обучающийся, в данном случае младенец, должен сам что-то предпринять, чтобы возник другой условный стимул. Иными словами, ребенок кричит, возникает стимул (пища), и он реагирует на это безусловным (естественным) действием сосания. Этим типом научения занимался Торндайк. В его экспериментах лишенные свободы животные, чтобы добраться до пищи, должны были освободить себя. Такой тип научения называется инструментальным обусловливанием (instrumental conditioning) .
В принципе, связи любого типа могут устанавливаться только при условии, что связываемые явления находятся во временной или пространственной близости. Это относится не только к обусловливанию, но и к более высоким формам научения, таким, как решение проблемы и образование понятия, речь о которых пойдет позднее.
Основываясь на своих экспериментах, Торндайк сформулировал определенные законы, по которым, как он считал, происходит научение. Наиболее важный из этих законов (он до сих пор остается таковым) Торндайк назвал законом эффекта. Вкратце он означает следующее: способ, которым устанавливаются или не устанавливаются связи, определяется последствиями, к которым эти связи приводят. Если крик приводит к кормлению, то он будет раздаваться всегда, когда появляется потребность в пище. Поведению, которое не приводит к должному эффекту, не научаются. Таким образом, организм устанавливает только те связи, которые, по всей видимости, полезны ему. Благодаря этому механизму животные из мириадов стимулов, идущих от окружающей среды, выбирают те, на которые необходимо реагировать, образуя новые связи.
В некоторых из описанных мною экспериментов (а может быть, и во всех) в целом руководство не осуществлялось. Но даже в самых простых опытах с людьми по механическому запоминанию (запоминание пар слов по ассоциации или бессмысленных слогов) руководство осуществляется всякий раз, когда испытуемому сообщается, где он ошибся, а где все сделал правильно. Если же от такого минимального руководства отказываются, то научение идет значительно медленнее. В экспериментах по обусловливанию подкрепление, осуществляемое для постепенного, достижения задуманного, вполне правомерно рассматривать как руководство, но более принудительного характера. Обучающемуся посредством тех или иных сигналов помогают достигнуть цели научения гораздо быстрее, чем он смог бы это сделать сам по себе.
Хорошо известным примером решения проблемы научения при минимальном руководстве, в том числе научения довольно сложным связям, является работа Брунера по усвоению понятий (J. S. Bruner et al., 1956). Мне не хотелось бы вдаваться в подробности процесса научения понятию, поэтому я просто опишу, как проводился эксперимент. Испытуемым давали 81 карточку с различными конфигурациями и предлагали определить, какая комбинация из представленных на карточках элементов составляет задуманную экспериментатором фигуру. Испытуемые могли выбирать карточки в любом порядке и спрашивать экспериментатора, похожа или нет выбранная ими конфигурация на задуманную им фигуру. Это и есть то, что называется минимальным руководством. Экспериментатора не столько интересовала легкость, с которой испытуемые справлялись с задачей, сколько способ, который они выбирали для ее решения. При этом экспериментатор мог легко помочь испытуемому определить задуманную им фигуру, упорядочив карточки таким образом, чтобы максимально увеличилось количество информации, получаемой испытуемым при ответе на его вопрос. Учителя интересует легкость, с которой обучающиеся осваивают данное понятие, подобные сведения помогают ему соотнести способ подачи своим ученикам изучаемых понятий со скоростью их научения этим понятиям. Между прочим, психология усвоения понятия, практически воплощенная в руководстве научением, и есть реализация психопедагогического подхода.