Пиши и продавай!
как написать статью, книгу, рекламный текст на сайте копирайтеров

 <<<     ΛΛΛ     >>>   

В предшествующей четвертой главе были рассмотрены физиологические механизмы, принимающие кратковременную информацию и мгновенно оценивающие, но не накапливающие ее. Все они могут функционировать неограниченное число раз, без каких-либо изменений в их механизме от выполнения этой функции. Они составляют основу любого возможного опыта и как раз по этой причине должны быть защищены от любой модификации опытом.
В настоящей пятой главе был рассмотрен принципиально иной процесс, изменяющий в течение индивидуальной жизни самый механизм поведения, и притом таким образом, что улучшается его функция, способствующая сохранению вида.
Улучшение функции некоторой структуры и повышение ее ценности для сохранения вида посредством модификации не более вероятно, чем посредством мутации или рекомбинации наследственных задатков. Но если определенные внешние обстоятельства регулярно вызывают определенные модификации, осуществляющие приспособление именно к этим обстоятельствам, то можно с подавляющей вероятностью предположить, что имеются закрепленные в геноме открытые программы в смысле Эрнста Майра.
Такая генетическая программа содержит несколько отдельных программ для построения некоторого механизма и предполагает поэтому не меньше, а гораздо больше генетической информации, чем единственная замкнутая программа. Но благодаря этому открытая программа способна воспринимать дальнейшую информацию извне, в зависимости от которой определяется, какие из потенциально заложенных в программе возможностей она осуществит. Такое осуществление придает новому приспособлению постоянный характер, так что лежащая в его основе информация накапливается.
Тем самым центральная нервная система повторяет на высшем уровне функцию, уже присущую геному, но отсутствующую у процессов приобретения текущей информации, описанных в четвертой главе.
Любое обучение есть телеономная модификация тех физиологических механизмов, функцией которых является поведение.
Надежную модель открытой программы и адаптивной модификации доставляет нам механика развития, или экспериментальная эмбриология. Какая из "проспективных потенций" некоторой эмбриональной ткани будет осуществлена, зависит от "индуцирующих" влияний окрестности. Все процессы адаптивной модификации, в том числе процессы обучения, по существу, близки к индукции в смысле Шпемана.
Простейшие формы адаптивных модификаций поведения — это прокладывание моторных путей и сенситивизация рецепторных процессов. Последние имеют значение для сохранения вида лишь в тех случаях, когда стимулирующая ситуация с высокой вероятностью появляется в виде серий.
Все дальнейшие процессы модификации, рассмотренные в этой главе, основываются на ассоциации, т. е. на установлении связи между двумя

нервными функциями, ранее не находившимися в причинной зависимости друг от друга. Посредством этого процесса стимулирующая ситуация, часто очень сложная, приобретает влияние на врожденную форму поведения.
В случае привыкания, или десенситивизации, это влияние имеет тормозящий характер: первоначально запускающие ключевые стимулы вследствие ассоциации теряют свою действенность, но сохраняют или соответственно восстанавливают ее даже при малейшем изменении комплексной ситуации. Как знает каждая повариха, "перемена" придает новую действенность притупившимся ключевым стимулам.
При обратном процессе приучения врожденно действующие ключевые стимулы ассоциируются с некоторой комплексной комбинацией стимулов таким образом, что в дальнейшем остаются действенными шшь в их сопровождении. Таким образом врожденный механизм запуска чрезвычайно усиливает свою избирательность.
При интенсивных реакциях бегства запускающие ключевые стимулы часто уже после единственного очень сильного воздействия, именуемого "психической травмой", ассоциируются с сопровождающей комплексной стимулирующей ситуацией, в дальнейшем вызывающей сильное побуждение к бегству. Эта ассоциация часто необратима.
Многие формы поведения, в особенности социального, в ранних сенситивных фазах развития, в которых они еще вовсе не способны функционировать, необратимо фиксируются на некотором объекте. Эти процессы, именуемые запечатлением, своей связью с некоторым сенситивным периодом и своей необратимостью более всех процессов обучения напоминают явления, которые Шпеман назвал индукцией и детерминацией.

(conditioning by reinforcement)

1. НОВАЯ ОБРАТНАЯ СВЯЗЬ

Все животные, у которых центральная нервная система достигла определенного уровня дифференциации, т. е. головоногие, ракообразные, паукообразные, насекомые и позвоночные, включая человека, обладают способностью к приобретению знаний, превосходящей своей эффективностью все до сих пор рассмотренные когнитивные механизмы, а именно способностью к обучению в более узком смысле слова. У психологов, далеких от биологии и ничего не знавших о конвергентном* приспособлении, наличие этой способности у столь многих различных организмов вызвало ошибочное представление, что здесь идет речь о первичном феномене, об основной форме любого приобретения знаний или даже о единственном элементе поведения вообще. В действительности же пять указанных групп животных развили свой нервный аппарат, лежащий в основе рассматриваемой функции, столь же независимо друг от друга, посредством конвергентного приспособления, как они выработали свои глаза и конечности, также независимо возникшие в каждой из этих групп.
Обучение посредством проб и ошибок возникло как типичная фульгурация в смысле, объясненном на с. 270, посредством установления новой связи между уже существовавшими механизмами, способными действовать независимо друг от друга. Мы уже познакомились с функцией каждого из этих составляющих механизмов.
Комплекс поведения, который Гейнрот назвал свойственным виду импульсивным поведением (arteiegene Triebhandlung), состоит, как мы уже знаем, из аппетентного поведения срабатывания врожденного механизма запуска и выполнения генетически запрограммированной последовательности поведения с достижением в конце ее завершающей ситуации, удовлетворяющей побуждение. Эта цепь из трех отдельных процессов представляет основу, из которой возникло все обучение посредством проб и ошибок (conditioning). Линейная последовательность процессов приобретает новые неожиданные системные свойства вследствие поистине эпохального "изобретения": конечный успех последовательности начинает производить обратное модифицирующее воздействие на ведущие к нему формы поведения.
Формы поиска, более или менее случайно входившие в аппетентное поведение, усиливаются этим обратным воздействием, если выполнение всей последовательности достигает успеха, способствующего сохранению вида, а в противном случае ослабляются. Иными словами: успех действует, как то, что обычно называется "вознаграждением", а неудача — как то, что называется "наказанием". В литературе на английском языке все ведущее таким образом к усилению или к "положительной

дрессировке" предыдущего поведения называется reinforcement'*, и, к сожалению, это слово употребляется также пишущими по-немецки психологами; напрашивающиеся немецкие термины отвергаются ими как "субъективистские". Поскольку это понятие восходит к Ивану Петровичу Павлову, я попросил одну из моих сотрудниц, хорошо говорящую по-русски найти у этого автора, где он впервые употребил соответствующий термин и как он звучал по-русски. Оказалось, что великий физиолог написал свои ранние работы, где он ввел это понятие, по-немецки, использовав слова "Verstarkung"2* u "verstarken"3*. Этот выбор немецкого выражения кажется мне не вполне удовлетворительным. То, что достигается рассматриваемым процессом обучения, можно лучше всего выразить, сказав, что успех подкрепляет* поведение животного, ведущее к нему.
Вместе с новой обратной связью возникает когнитивный процесс, доставляющий индивиду за один раз больше прочного знания, чем метод генома мог бы доставить, в самом благоприятном случае, в течение целого поколения, — по меньшей мере вдвое больше, поскольку этот процесс может извлекать информацию не только из успеха, как геном, но также и из неудачи. Кроме того, рассматриваемый процесс действует не так, как геном, "пробующий" наудачу всевозможные существенные и несущественные факторы, а опирается на надежно испытанные врожденные рабочие гипотезы, а именно на те, которые прочно встроены в систему поведения всех высших животных в виде механизмов приобретения текущей информации, описанных в главе 4. Тем самым поведение, модифицируемое методом проб и ошибок, заранее направляется в сторону большей вероятности успеха. Не случайно "заранее" по-латыни звучит "a priori"*. Мы узнаем об этом больше в разделах, посвященных пониманию и обучению.
Ввиду большой эффективности возникающего таким образом нового когнитивного аппарата понятно, что из быстро движущихся высших животных способны к конкуренции лишь те, которые им обладают.

2. МИНИМАЛЬНАЯ СЛОЖНОСТЬ СИСТЕМЫ

С другой стороны, из сказанного понятно, почему обучение посредством успеха не могло возникнуть у одноклеточных и низших многоклеточных животных, лишенных центральной нервной системы. Система, способная оценить как источник знания успех или неудачу некоторой предыдущей формы поведения и применить результат такой оценки для обратного модифицирующего действия на механизм этой формы поведения, имеет, разумеется, своей предпосылкой существование нескольких не слишком простых, весьма эффективно действующих подсистем. Эти подсистемы и их образ действия мы рассмотрели при обсуждении свойственного виду импульсивного поведения.
Легче всего представить себе механизм, подкрепляющий животное в тех формах поведения, которые ведут к простому удовлетворению

1*Усиление (англ.). — Примеч. пер.
2 Усиление (нем.). — Примеч. пер.
3Усиливать (нем.). — Примеч. пер.

 

потребностей тканей. В этом случае достаточен был бы единственный "датчик"*, регистрирующий наличие или отсутствие некоторого необходимого для жизни вещества и посылающий свое сообщение в аппарат предыдущего поведения. Такая простейшая возможность подлинной условной реакции и в самом деле осуществляется в отдельных случаях, например, по наблюдениям Детье, при добывании пищи у многих мух. Но, вообще говоря, для большинства систем поведения, адаптивно модифицируемых подлинным обучением, должны быть выполнены следующие три предпосылки.
Во-первых. Форма поведения, с которой начинается все действие, должна быть "широко открытой", т. е. иметь программу, предоставляющую возможность разнообразных адаптивных модификаций; как мы уже знаем, такая программа предполагает особенно большой запас генетической информации.
Во-вторых. Должна каким-то образом "заноситься в протокол" или "запоминаться" форма, какую имели вводные звенья цепи действий при ее последнем выполнении, и эта запись должна связываться с обратным сообщением об успехе.
В-третьих. Это обратное сообщение должно быть достаточно надежным. Завершающее действие, которое удовлетворяет побуждение, т. е. "consummatory act"'* в смысле Уоллеса Крейга или, в случае аппетенции по состояниям покоя в смысле Мейер-Гольцапфель, целевая стимулирующая ситуация должны быть столь однозначно определены внутренними и внешними рецепторными процессами, чтобы с достаточной вероятностью исключить ошибочное сообщение об успехе или неудаче. Иными словами: рецепторный аппарат, передающий обратные сообщения, должен выполнять функции, аналогичные функциям врожденного механизма запуска (с. 290). Нельзя представить себе более простую мысленную модель физиологического аппарата, осуществляющего обучение посредством успеха (conditioning by reinforcement).
Система поведения, способная к такой функции, тем самым никак не может быть простым "рефлексом", как это подсказывает терминология И. П. Павлова. Конечно, существуют простые "рефлекторные" реакции избегания, подобные рассмотренным в 5.6, которые возникают путем простой ассоциации между реакцией бегства и приобретенным запускающим действием некоторой стимулирующей ситуации; они имеют внешнее сходство с рассматриваемыми здесь процессами обучения. Но нам не известен ни один случай, когда бы удалось адаптивно модифицировать некоторую систему поведения посредством дрессирующих, т. е. положительно действующих, "вознаграждающих" стимулов без участия аппетентного поведения. На это обстоятельство давно уже указал Э. Ч. Толмен.
Даже в классическом случае слюнных условных "рефлексов", исследованном И. П. Павловым, указанный рефлекторный процесс никоим образом не является единственным процессом, подкрепляемым дрес-

 

1 * "Завершающее действие" (англ.), от consummate — доводить до конца, завершать. — Примеч. пер.

сировкой; более того, слюноотделение составляет лишь малую часть гораздо более сложной последовательности форм поведения, большая часть которых, однако, в классическом лабораторном опыте выключается той простой мерой, что собака привязывается тщательно продуманной кожаной сбруей, едва ли позволяющей ей сделать какое-нибудь движение. Мой покойный друг Говард Лиделл, работавший в качестве приглашенного сотрудника в одной из павловских лабораторий, вызвал там некоторое неприятное удивление, произведя неортодоксальный опыт. Сначала он выдрессировал собаку на условный стимул, состоявший в ускорении звуков метронома. Когда собака научилась надежно выделять слюну на этот стимул, Лиделл освободил ее от уз. Тогда собака сразу же подбежала к метроному, продолжавшему равномерно тикать, подпрыгнула к нему, приветствовала его, виляя хвостом и подвывая, иначе говоря, продемонстрировала все поведение собаки, выпрашивающей еду у хозяина или старшего товарища по своре. При этом она интенсивно выделяла слюну, хотя метроном не ускорил своего хода, так что условный стимул вовсе не предлагался. У общественных псовых (Canidae) выпрашивание корма и взаимное кормление широко распространены. Согласно Крайслеру, волки уже в возрасте одного года кормят чужих более молодых детенышей, у гиеновых собак (Lycaon pictus L.) удачливый охотник кормит всех членов своры. У обоих этих видов врожденные координации выпрашивания те же, что у домашней собаки. Эти координации — а вовсе не одно только отделение слюны — воплощают ту реакцию, которая в классическом опыте выступает в качестве условной!
Я никоим образом не хочу преуменьшить значение опытов Павлова. Вполне законно искусственно изолировать некоторую отдельную реакцию, особенно если это доставляет такие хорошие возможности количественного исследования, как слюноотделение собаки. Но при этом не следует упускать из виду, что в таком случае мы вырезаем кусок из системы. Ни в коем случае не следует впадать в ошибку мышления, присущую некоторым людям с несомненными аналитическими способностями, которые полагают, что система состоит теперь из одной только изолированной части и что одной этой части уже достаточно, чтобы понять все свойства системы в целом.
Если мы теперь бросим взгляд с точки зрения биологического системного анализа на важнейшие известные в настоящее время факты о возникновении условных реакций при подкреплении (reinforcement), то мы увидим, что они полностью подкрепляют изложенное здесь мнение: положительная дрессировка посредством вознаграждения есть важный критерий "подлинной" условной реакции. В перечень "обусловливаемых" реакций, которые приводит в своей книге К. Фоппа, вкралось несколько случаев, где реакция избегания, основанная на простой ассоциации, принимается за подлинное "conditioning"*.

 

1 Кондиционирование" (англ.), в смысле создания условных реакций. — Примеч. пер.

 

3. ПОИСК ЭНГРАММЫ*

Прежде чем обратиться к вопросу, на какие части всей модифицируемой обучением системы воздействует адаптивная модификация и откуда происходит новая информация, воздействующая на них, я хотел бы высказать некоторые общие соображения о физиологической природе обучения и памяти.
Поиск энграммы, знака в памяти*, оставляемого обучением, до сих пор остался удручающе бесплодным. Для своего остроумного доклада "In Search of the Engram'"* К. С. Лешли избрал подзаголовок: "Thirty years of frustration"2*. В действительности же терпеливые исследования Лешли обнаружили, наряду с другими очень важными результатами, тот факт, что энграмма не локализована в каком-либо определенном месте мозга, а заключается в организации, связывающей всевозможные части мозга. Впрочем, даже сегодня мы не можем сказать, какие физиологические процессы лежат в ее основе. Отсюда понятно, почему многие серьезные исследователи сразу же после открытия генетического кодирования информации в цепных молекулах выдвинули гипотезу, что знание, приобретенное в индивидуальном опыте и хранимое в памяти, удерживается таким же способом. Между тем эта гипотеза вызывает большие сомнения. Если бы она была верна, то должно было бы существовать два механизма, функционирующих независимо друг от друга, один из которых тотчас же "записывает на пленку" все поступающие нервные импульсы, т. е. превращает их временную последовательность в пространственную конфигурацию соответствующей цепной молекулы, заключающей в своем коде воспринятые факты. Второй механизм должен быть в состоянии считывать записанные этим химическим кодом сообщения и переводить их обратно в нервные импульсы, координированные во времени и пространстве. Эта гипотеза, независимо от ее общей невероятности, не может объяснить, почему у всех известных живых существ способность к обучению находится в прямом отношении к числу ганглионарных клеток и вообще к величине и дифференцированное™ центральной нервной системы. В последнее время биохимики показали, что химическое кодирование индивидуально приобретенной информации в цепных молекулах невозможно по временным причинам. Поскольку, кроме того, большая часть результатов, как будто доказывавших химическую передачу индивидуально приобретенной информации, при критическом повторении не смогла быть воспроизведена, я твердо придерживаюсь предположения, что все функции обучения, во всяком случае в той мере, в какой они обусловливают более сложные адаптивные модификации поведения, разыгрываются в синапсах, т. е. в соединениях, связывающих отдельные нервные элементы, и что эти изменения, как уже было сказано (с. 302 и далее), ближе всего родственны эмбриогенетическим процессам индукции. Этим не исключается, что в таких локальных явлениях могут играть роль изменения в кодировании цепных молекул.

1 *"В поисках энграммы" (англ.). — Примеч. пер.
2Тридцать лет фрустрации" (англ.). — Примеч. пер.

 

4. ВРОЖДЕННЫЕ НАСТАВНИКИ
Открытая программа тех механизмов поведения, которыми каждый индивид благодаря эволюционному развитию его предков снабжается в начале жизненного пути, всегда сконструирована надежно испытанным способом, так, что оставленные открытыми переменные части ее относятся к условиям окружающей среды, не предсказуемым в их особенностях, в их временном и пространственном осуществлении, но достаточно постоянным в жизни индивида, чтобы оправдать хранение соответствующей информации. Только что вылупившийся серый гусь никоим образом не может знать, как выглядят индивиды, которые являются его родителями и за которыми ему придется следовать в течение месяцев; молодая пчела не может иметь врожденной информации о географическом строении окрестностей ее улья. Способность узнавать отдельных собратьев по виду и способность приобретать посредством дрессировки навыки отыскания пути представляют собой хорошие примеры установок обучения, доставляющих такую существенную информацию, которая не может быть получена ни от генома, ни от механизмов приобретения текущей информации.
С другой стороны, как мы знаем, именно открытая программа имеет своей предпосылкой большую массу филогенетически приобретенной, связанной с геномом информации. Эта информация превращается в целесообразное поведение животного не посредством морфогенетического* развития, а иным путем. Конечно, сначала морфогенез создает на основе этой информации вполне определенные нейтральные устройства, как, например, описанную на с. 312 врожденную установку обучения, позволяющую мгновенно ассоциировать очень сильный стимул к бегству со всей сопровождающей его стимулирующей ситуацией. Далее, вся описанная в 6.2 структура аппарата подкрепления успехом построена, разумеется, на основе информации, заключенной в геноме. И если мы хотим остаться в пределах естественнонаучного объяснения, то нельзя себе представить, чтобы заключенная в геноме информация могла превращаться в способствующее сохранению вида поведение каким-нибудь иным способом, чем посредством построения реальных структур нервной системы и органов чувств.
Именно это структурирование направляет обучение на целесообразные пути. Из него вырастают "наставники", заботящиеся о том, чтобы открытые места различных программ всегда заполнялись способом, содействующим сохранению вида. Как уже не раз говорилось, сами эти структуры должны быть как можно меньше подвержены изменению вследствие модификации, чтобы ничего не потерять из содержащейся в них врожденной информации. Если в некоторой системе форм поведения имеется подсистема, способная сильно модифицироваться обучением, это неизбежно предполагает, что другие подсистемы достаточно резистентны по отношению к модификациям, чтобы обеспечить выполнение учебной программы модифицируемых частей.
Если не допускать сверхъестественных факторов, например предустановленной гармонии между организмом и окружающим миром, то необходимо постулировать существование врожденных механизмов об

 <<<     ΛΛΛ     >>>   

Приобретает влияние на врожденную форму поведения
Продвижения в их направлении прежде объясняли
Возникшая таким образом десенситивизация относится лишь к очень узкой области высот
Таким образом системы процессы
Мне казалось разумным ограничиться вначале познавательными функциями человека

сайт копирайтеров Евгений