Пиши и продавай!
как написать статью, книгу, рекламный текст на сайте копирайтеров

 <<<     ΛΛΛ     >>>   

выходной слой

тренируемые связи

скрытый слой

входной слой

активация на входе

136

Рис. 2.10. Однонаправленная (feedforward) коннекционистская сеть, включающая скрытый слой элементов

восходит к классическим идеям проторения путей павловской физиологии и клеточных ансамблей Дональда Хэбба (см. 1.4.2).
В «Организации поведения» Хэбб (Hebb, 1949) предположил, что повторная стимуляция тех же рецепторов постепенно ведет к функциональному объединению нейронов ассоциативных областей мозга, так что этот клеточный ансамбль может сохранять активацию после окончания стимуляции и вновь возбуждаться при возникновении похожего узора стимуляции. В нейроинформатике используется следующее правило Хэбба: между всеми одновременно (синхронно) активированными нейронами (то есть элементами сети) снижаются пороги синаптических связей (повышаются весовые коэффициенты активационных связей). В результате многократных повторений распространение активации при возникновении на входе той же ситуации происходит быстрее, группа элементов, «ансамбль», активируется как целое, и, что важно, эта активация происходит даже при изменениях ситуации, например, выпадении каких-то компонентов изображения, а равно «отмирании» части «нейронов» самой сети. Тем самым удается моделировать особенности целостного восприятия, описанного гештальтпсихологией (см. 1.3.1). Подобная терпимость (graceful degradation) к искажениям на входе и к нарушениям механизма обработки информации разительно контрастирует с хрупкостью обычных символьных программ, где лишний пропуск или неправильно поставленная запятая способны остановить работу программы и даже самого компьютера. Кроме того, пластичность синаптических связей, лежащая в основе формирования ансамблей, позволяет дать физиологическое объяснение процессам обобщения (категоризации) отдельных стимульных ситуаций.
Недостатком описанного механизма самоорганизации нейронных связей является его чрезвычайно медленный, требующий сотен и тысяч повторений характер. В 1981 году немецко-американский нейрофизиолог К. фон дер Мальсбург предположил, что для объяснения одноразового обучения должны существовать быстрые синапсы, меняющие свои характеристики в ответ на однократное возникновение некоторой, обычно новой или значимой ситуации. Мальсбург назвал их «хэббов-скими синапсами». Такие синапсы действительно были обнаружены в последнее время и по предложению Нобелевского лауреата по биологии Фрэнсиса Крика иногда называются теперь «мальсбургскими». Мы подробнее остановимся на обсуждении этих нейрофизиологических механизмов в последующих главах, посвященных сознанию и памяти (см. 4.4.3 и 5.3.2).
Примером более эффективного компьютерного алгоритма обучения в самой нейроинформатике служит предложенный канадским информатикой Джеффри Хинтоном и его коллегами метод обратного распространения ошибки (backpropagation of error). В этом случае сети предъявляется некоторая конфигурация, а затем ответ на выходе сравнивается с идеальным, желаемым ответом. Результат подобного сравнения того, что должно быть (Sollwert), с тем, что есть (Istwert), вычисляется и пропускается затем в обратном направлении: от выхода сети к ее входному слою, причем на каждом промежуточном этапе осуществляются некоторые

коррекции весовых коэффициентов связей элементов с целью последующей минимизации рассогласования. Телеологизм этих процессов и необходимость эксплицитного надсмотра за обучающейся сетью порождают, с одной стороны, множество смутных психологических аналогий, а с другой стороны, известный скептицизм в оценке «обратного распространения» как подходящего средства моделирования когнитивных процессов. Дело в том, что «контролируемая минимизация рассогласования» оставляет сильное впечатление произвольного подбора желаемого результата15.
Ряд коннекционистских моделей использует обратные связи для повторного пропускания продуктов обработки через нейронную сеть. Это свойство, называемое рекуррентностью, позволяет обрабатывать конфигурации на входе в контексте предыдущих событий («прошлого опыта»). Два варианта рекуррентных сетей, использовавшихся для моделирования синтаксического анализа речи, показаны на рис. 2.11. Существует практически открытое множество других вариантов коммутации элементов, а также возможность соединения коннекционистских моделей с традиционными символьными архитектурами в рамках гибридных моделей, включающих как символические, так и коннекцио-нистские компоненты. Так, в литературе интенсивно обсуждается возможность существования разных нейролингвистических механизмов для работы с регулярными и нерегулярными глаголами (Pinker, 2000). В случае регулярных глаголов, склоняемых по определенным фиксированным правилам, в памяти могла бы сохраняться лишь корневая морфема, по отношению к которой осуществляются традиционные символьные трансформации (скажем, добавление «-ed» при переходе к прошедшему времени в английском языке). Работа с нерегулярными глаголами, напротив, требует заучивания индивидуальных паттернов (как в случае грамматических форм английского глагола «to be»: am, are, is, was, were). При моделировании такого, скорее механического, заучивания могли бы помочь нейронные сети (см. 7.1.3).
Коннекционизм не мог не вызвать острых научных дискуссий. Они возникли прежде всего с представителями символьного и модулярного подходов (Fodor & Pylyshin, 1988), для которых подобное применение идеи параллельности ведет слишком далеко, вплоть до отказа от основных принципов переработки символьной информации, выделенных к началу 1980-х годов. В самом деле, в распределенных архитектурах не выполняются основные логические требования к символьной записи информации, а следовательно, к коннекционистским репрезентациям не применимы средства исчисления предикатов (см. 2.3.3). Поэтому,
15 Вне психологии — нейроинформатика, компьютерное зрение и роботика — широко используются алгоритмы обучения нейронных сетей, не требующие внешнего надсмотра. Речь идет прежде всего о разновидности разработанных финским информатикой 138        Т. Кохоненом самоорганизующихся карт (self-organizingmaps).

 


-   контекстные нейроны ''
Рис. 2.11. Рекуррентные нейронные сети, применяющиеся для (А) моделирования построения форм прошлого времени английских глаголов и (Б) предсказания грамматической категории следующего слова в предложении (по: Cooper, 1996).
кстати, сами коннекционисты говорят об изучении субсимвольных процессов. Для некоторых видных психологов и лингвистов (например, Levelt, 1990) попытки моделирования познания с помощью обучающихся искусственных нейронных сетей представляют собой лишь слегка осовремененную редакцию упрощенных ассоцианистских взглядов. Интересно, что слабые и сильные стороны более традиционных символьных и относительно новых коннекционистских моделей различаются между собой. Символьные программы относительно удобны при реализации эксплицитных правил и практически беспомощны в области интуитивных достижений, таких как разделение сцены .на фигуру и фон в процессах зрительного восприятия (см. 1.3.1 и 4.3.3). Искусственные нейронные сети, напротив, впервые позволили легко смоделировать эффекты перцептивной организации и, скажем, эффекты ассоциативного обучения и запоминания, но они плохо, путем многочисленных повторных приближений справляются с выделением, казалось бы, совсем простых правил. Это позволяет предположить, что наиболее вероятным будущим в области моделирования познавательных возможностей человека и животных станет использование интегральных или гибридных архитектур, сочетающих достоинства символьного и субсимвольного подходов (и, будем надеяться, свободных от их недостатков!).

Одним из самых первых примеров интегрального подхода, заполняющего брешь между субсимвольными и символьными репрезентациями,

139

являются работы ученика Румелхарта Пола Смоленского (Smolensky, 2005). Использовав математический аппарат тензорного исчисления, он доказал принципиальную возможность построения коннещионистско-символъных когнитивных архитектур (ICS = Integrated Connectionist/ Symbolic), в которых свойства символьных преобразований реализуются
1                                                                            на макроуровне описания, тогда как на микроуровне ментальные репре-
зентации описываются как массивно-параллельные процессы распространения волн активации по нейронным сетям. Этот подход был применен Смоленским и его коллегами в области теоретической лингвистики, где они, прежде всего, попытались объяснить разнообразные феномены маркированности — использование специальных лингвистических средств для выражения относительно нетипичных (или «менее гармоничных») в данном контексте языковых конструкций (см. 7.3.2 и 8.1.2). Несмотря на то, что их реализация осуществляется посредством нейро-сетевых механизмов, подобные «гармоничные грамматики» способны, по мнению Смоленского, полностью заменить генеративные грамматики при описании общих принципов функционирования языка. Процесс порождения речевых звуков (модель относится пока преимущественно к сфере фонологии речи — Prince & Smolensky, 1997) описывается при этом как оптимизация решения, удовлетворяющая нескольким гетерогенным правилам, таким как запрет на возникновение последовательностей из большого числа согласных звуков (см. 7.1.1).
В столь динамичной области, как когнитивная наука, трудно предсказывать будущее развитие событий. В рамках работ по вычислительной нейронауке (нейроинтеллекту) и эволюционному моделированию в последнее время начинают рассматриваться более реалистичные, с биологической и биофизической точки зрения, альтернативы искусственным нейронным сетям (такие как самоорганизующиеся карты, клеточные автоматы и, в отдаленной перспективе, квантовые компьютеры — см. Doyle, 2003; O'Reilly & Munakata, 2003). При увеличении объема мозга в процессе эволюции исходный сетевой принцип «всё связано со всем» перестает выполняться, возникают элементы модулярной макроорганизации (Striedter, 2004). Кроме того, при моделировании познания до сих пор практически никак не учитывалась роль нейро-трансмиттеров, химических передатчиков сигналов между нейронами и модуляторов их активности. Диффузное, не ограниченное одним лишь преодолением синапсов действие нейротрансмиттеров может, лежать в основе регуляции эмоциональных состояний и интеграции нейронов в сложные самоорганизующиеся системы. Последнее представляется очень существенным — ведь целостный мозг демонстрирует не только способности решения тех или иных узкопознавательных задач, но и множество других биологически и социально необходимых функций, в частности, связанных с эмоциями и мотивированным поведением (см. 2.4.3 и 9.4.3).
140

2.4 Усиливающееся влияние нейронаук
2.4.1 Интерес к нейропсихологическим данным

Глобальная тенденция, ярко выступившая в течение последнего десятилетия 20-го века, связана с ростом интереса к мозговым механизмам — реальной архитектуре познавательных процессов. Возникновение когнитивного подхода многие психологи восприняли первоначально как освобождение от (пусть часто лишь декларируемой) необходимости интересоваться мозговым субстратом и возможными нейрофизиологическими механизмами тех или иных познавательных процессов. Если уподобить психику компьютерным программам, то очень важно, что одна и та же программа может быть запущена на разном «хардвере» — на различных реализациях машины Тьюринга. Есть, следовательно, известная независимость программного обеспечения, или «софтвера», от машинного субстрата. Суть ранней компьютерной метафоры состояла в предположении о том, что психика относится к мозгу так же, как программа относится к машинному субстрату. Компьютерные программы в качестве психологической теории позволяют интерпретировать наблюдаемые в исследованиях эффекты, «не дожидаясь — по словам Найссера — пока придет нейрофизиолог и все объяснит» (см. 2.3.2).
В 1982 году Дэвид Марр (Магг, 1982), изучавший сенсорные механизмы зрительного восприятия и координации движений, сформулировал альтернативный методологический принцип, предполагающий одновременный анализ как биологических, так и искусственных систем переработки информации на трех уровнях их описания:

общий функциональный анализ решаемых системой задач; алгоритмическое описание выполняемых операций; анализ воплощения этих алгоритмов на конкретном субстрате, или
«хардвере».

В последующие годы с появлением множества нестандартных архитектур в коннекционизме и, в особенности, в связи со спекуляциями о мозговой локализации тех или иных «когнитивных модулей» естественно стал возникать вопрос о том, как эти гипотетические механизмы реализованы на самом деле. Требование Марра к доведению анализа до уровня нейрофизиологического «воплощения» постепенно стало если не необходимым, то во всяком случае желательным элементом любого претендующего на научную полноту когнитивного исследования.
Все это, наряду с наметившимися трудностями проверки формальных моделей (см. 9.1.2), привело к настоящему всплеску интереса к нейропсихологическим данным о нарушениях и мозговых механизмах познавательных процессов. Изменился и сам характер когнитивных исследований, которые в значительной степени опираются сегодня на данные нейропсихологических и нейрофизиологических работ. Поэтому общие очертания многих моделей познавательных процессов в нача-


 


Рис. 2.12. Новая метафора когнитивных исследований: А. Левое полушарие коры с обозначением долей: (1) фронтальных, (2 теменных, (3) затылочных и (4) височных; Б. Продольный разрез мозга, позволяющий увидеть некоторые субкортикальные структуры, такие как таламус и средний мозг.
ле 21-го века напоминают рис. 2.12. Напротив, начиная с 1990-х годов ослабло влияние собственно компьютерной метафоры и машинных (или машиноподобных) моделей. В связи с этим развитием в психологических работах стали использоваться анатомо-физиологические термины, в частности, для обозначения локализации возможных мозговых механизмов: антериорные (передние), постериорные (задние), дорзаль-ные (расположенные в верхней части коры), вентральные (в нижней ее части), латеральные (на боковой поверхности), медианные (вблизи разделяющей кору на два полушария продольной борозды). Типичным стало и упоминание долей коры головного мозга: фронтальных (лобных), темпоральных (височных), париетальных (теменных), окципитальных (затылочных), а также и более локальных их областей16.
Традиционным нейропсихологическим подходом является выделение разнообразных синдромов — систематического сочетания отдельных симптомов нарушения поведения и работы мозга. Значение синдромного анализа двояко. Во-первых, он позволяет относительно упорядочить материал клинических наблюдений, главным образом, поведенческих коррелятов локальных поражений мозга. Во-вторых, он дает возможность, хотя бы в самом первом приближении, опреде-

142

16 В этой книге при упоминании различных долей коры используются принятые в русскоязычной литературе термины с одним исключением — вместо термина «лобные доли» мы вынуждены чаще использовать международный термин «фронтальные доли». Это связано с тем, что вслед за упоминанием общего региона сегодня часто приходится вводить дальнейшие уточнения локализации, такие как «префронтальные» или «фронтополяр-ные» структуры (см. 4.4.2). Соответствующих производных от прилагательного «лобные» не существует.

 <<<     ΛΛΛ     >>>   

Количество информации н
Ные структу- рование зри- nbsp
Ориентировка средний мозг
3первый кризис научной психологии46 1
Групп глагола

сайт копирайтеров Евгений