В.Ф.ТурчинФеномен науки
|
Турчин В.Ф.
Феномен науки: Кибернетический подход к эволюции.
Изд. 2-е – М.: ЭТС. — 2000. — 368 с.
ISBN 5-93386-019-0
Автор книги — выдающийся ученый, физик и кибернетик, создатель языка Рефал и нового направления в программировании, связанного с преобразованием программ. Известен широкому кругу отечественных читателей как составитель сборника “Физики шутят”. Вынужденный покинуть Родину, с 1977 года он живет и работает в США.
В этой книге В.Ф.Турчин излагает свою концепцию метасистемного перехода и с ее позиций прослеживает эволюцию мира от простейших одноклеточных организмов до возникновения мышления, развития науки и культуры. По вкладу в науку и философию монография стоит в одном ряду с такими известными трудами как “Кибернетика” Н.Винера и “Феномен человека” П.Тейяра де Шардена.
Книга написана ярким образным языком, доступна читателю с любым уровнем подготовки. Представляет особый интерес для интересующихся фундаментальными вопросами естествознания.
Предисловие редактора к первому русскому изданию
Глава 1. Начальные стадии эволюции
Глава 2. Иерархические структуры
Глава 5. Со ступеньки на ступеньку
Глава 6. Логический анализ языка
Глава 10. От Фалеса до Евклида
Глава 11. От Евклида до Декарта
Глава 12. От Декарта до Бурбаки
Приложение. Кибернетический манифест
Предметный и именной указатель
Замечания по электронной версии книги присылайте, пожалуйста, членам редакционного совета. Спасибо!
Редакционный совет: А.В.Климов, А.М.Чеповский, В.С.Штаркман
Предисловие редактора к первому русскому изданию
Глава 1. Начальные стадии эволюции
1.4. Дискретные и непрерывные системы
1.5. Надежность дискретных систем
1.9. Простой рефлекс (раздражимость)
Глава 2. Иерархические структуры
2.2. Распознаватели и классификаторы
2.5. Кое-что о реальных иерархиях
2.9. Как возникает регулирование
2.13. Структурные и функциональные схемы
2.14. Переход к феноменологическому описанию
2.15. Определение сложного рефлекса
3.3. Рефлекс как функциональное понятие
3.4. Зачем нужны ассоциации представлений
3.7. Условный рефлекс и обучение
4.1. Управление ассоциированием
4.4. Воображение, планирование, преодоление инстинкта
4.9. Язык как средство моделирования
Глава 5. Со ступеньки на ступеньку
5.1. Материальная и духовная культура
5.3. Масштаб метасистемного перехода
5.4. Орудия для производства орудий
Глава 6. Логический анализ языка
6.11. Физический предмет и логический объект
7.4. Подтверждение и отрицание
7.5. Феноменологическое определение семантики
7.13. Лингвистическая относительность
7.14. Метасистемный переход в языке
7.16. Мышление человека и животных
8.1. Системный аспект культуры
8.3. Метасистемный переход к языковой деятельности
8.6. Мусорная куча представлений
8.8. Консерватизм докритического мышления
8.9. Возникновение цивилизации
9.6. Познания древних в геометрии
9.7. Арифметика с птичьего полета
Глава 10. От Фалеса до Евклида
10.5. Точность сравнения величин
10.6. Достоверность утверждений математики
10.8. Об аксиомах арифметики и логики
10.10. Платонизм в ретроспективе
Глава 11. От Евклида до Декарта
11.4. Упадок греческой математики
Глава 12. От Декарта до Бурбаки
12.3. Четыре типа языковой деятельности
12.5. Формализация и метасистемный переход
12.6. Лейтмотив новой математики
12.7. “Несуществующие” объекты
12.11. Формализация теории множеств
13.1. Экспериментальная физика
13.6. Соотношение неопределенностей
13.7. Наглядные и знаковые модели
13.9. “Сумасшедшие” теории и метанаука
14.4. Формализация научного языка
14.6. Научное управление общество
Приложение. КИБЕРНЕТИЧЕСКИЙ МАНИФЕСТ
Предметный и именной указатель
В этой книге, первое издание которой стало библиографической редкостью сразу после выхода в 1993 году, выдающийся ученый Валентин Федорович Турчин излагает свою концепцию метасистемного перехода, объясняющую структуру скачков в эволюции и указывающую “почки роста” с кибернетической точки зрения. Его философия предлагает ответы на мировоззренческие вопросы — “Кто я?”, “Откуда я пришел и куда иду?”, “Сколь истинно мое знание?”, “Что есть добро и что есть зло?”.
Концепция метасистемного перехода проходит красной нитью через все работы В.Ф.Турчина. В 1976 году он написал следующую после “Феномена науки” книгу “Инерция страха. Социализм и тоталитаризм”1. В ней был дан анализ состояния советского общества как эволюционного тупика и высказаны предположения о том, как должно измениться общество, чтобы оно было способно к дальнейшему неограниченному развитию с высокими целями. В математике он сконструировал новые кибернетические основания2, а в программировании и информатике разработал метаязык Рефал и заложил основы метавычислений, предложив качественно новый метод преобразования и оптимизации программ — суперомпиляцию3. Эти достижения уже используются в высокотехнологичных коммерческих проектах. Их успешное применение и дальнейшее развитие требует понимания лежащей в их основе концепции метасистемного перехода.
Кибернетический подход Турчина развивается сегодня международным коллективом ученых в рамках Интернет-проекта Principia Cybernetica4, цель которого — выработка кибернетического взгляда на все явления вплоть до вопросов о смысле жизни и “Что есть Бог?”.
В конце XX века мы с Вами стали свидетелями крупных преобразований как в промышленности и технологиях — компьютерная и информационная революции, так и в общественном развитии. Прочитав эту книгу, Вы поймете, как и почему это было закономерно (хотя и не предопределено), какие предшествующие события в развитии материальной и духовной культуры человечества готовили эти скачки и что можно ожидать в ближайшие десятилетия.
Дорогой читатель! Хотелось ли Вам в своей научной, технической или другой деятельности полагаться не на удачу в случайных блужданиях, а руководствоваться целостной системой понятий, которая помогала бы “за деревьями видеть лес”, отличать важное от несущественного, понимать, куда идет развитие, чтобы прилагать свои творческие усилия в плодотворном направлении? Если да, то смело открывайте эту книгу!
Андрей Климов
1 Книга В.Ф.Турчина “Инерция страха. Социализм и тоталитаризм” была издана только в английском переводе: “The Inertia of Fear and the Scientific Worldview”, издательство “Хроника”, 1978. На русском языке она доступна в Интернете в Открытой Русской Электронной Библиотеке — http://orel.rsl.ru/.
2 “A constructive interpretation of the full set theory”, The Journal of Symbolic Logic, Vol. 52, No. 1, March 1987.
3 Информация о работах по Рефалу и суперкомпиляции доступна в Интернете по адресу http://www.refal.net/.
4 Адреса проекта Principia Cybernetica в Интернете — http://pespmc1.vub.ac.be/ и http://pcp.lanl.gov/.
Среди огромной массы научной и научно-популярной литературы совсем немного книг, которые можно считать вехами на пути человечества в формировании целостного и оптимистического мировоззрения, т. е. книг философских в истинном смысле этого слова. Книга, которую держит в руках читатель, несомненно, принадлежит к этой редкой категории. И это не случайно, так как ее автор являет собой редкий тип ученого-естественника, который философствует не потому, что это модно, престижно или, скажем, принято. Он философствует для того, чтобы привести в прямое соответствие философские знания и практику собственной жизни.
Автор излагает оригинальную теорию эволюции, базируясь на современных кибернетических концепциях и на одной основной идее, а именно — идее метасистемного перехода как кванта эволюции. Внешне все очень просто. Если у вас есть некоторая исходная кибернетическая система (амеба, человек, общество и т.п.), то метасистемный переход — это переход к некоторой другой системе, включающей в себя множество систем типа исходной. По сути здесь всегда возникает новый уровень управления. Примеры: переход от простейших одноклеточных организмов к многоклеточным, возникновение нервной системы, мозга, речи и т.д.
Но заслуга автора не ограничивается тем, что он высказывает идею метасистемного перехода как кванта эволюции. Он прослеживает с позиции этой идеи эволюцию на Земле от простейших макромолекул до современной науки (математики, философии) и культуры. Делает он это столь ярко и интересно, что не остается никаких сомнений в огромной мощности исходной идеи. По сути своей “Феномен науки” — глубокая научно-философская книга, но написана она как роман и, чтобы прочесть ее, достаточно любопытства и знаний в объеме средней школы.
Читатель, который возьмет на себя труд последовать за автором, узнает массу интереснейших вещей. Он, в частности, узнает, каким видится мир глазами лягушки, чем же все-таки (одним и принципиальным) отличается мышление животного (собаки, обезьяны) от мышления человека, что должно было произойти в мышлении человека, чтобы оно из “примитивного” стало “современным”, что такое юмор и на какой стадии эволюции он возникает, что такое научная теория и чем отличается “хорошая” теория от “плохой”, много ли на самом деле зависит от простого человека (“винтика”) в обществе, что есть Добро, Высшее благо и Высшая цель, и еще многое другое.
Сказанного, думаю, достаточно, чтобы читатель получил представление о предмете и характере книги. Углубляться в детали нет смысла, так как при этом пришлось бы невольно и безнадежно конкурировать с авторским текстом, одновременно паразитируя на нем. Поэтому будем считать своей дальнейшей задачей — рассказать немного об авторе и коротко осветить историю его диссидентства. Ведь когда писалась книга, В.Ф.Турчин был советским гражданином, а с октября 1977 г. он живет в Америке, работает профессором в области компьютерных наук в Нью-Йоркском городском университете и в 1982 г. получил гражданство США.
В.Ф.Турчин родился в 1931 г. в Москве. Окончил физический факультет МГУ и с 1953 по 1964 г. работал под Москвой в Обнинске в Физико-энергетическом институте, где изучал рассеяние медленных нейтронов в жидкостях и твердых телах и защитил докторскую диссертацию. В 33 года он уже был известным физиком-теоретиком с большими перспективами.
И тем не менее в 1964 г. В.Ф.Турчин оставляет физику, переходит в Институт прикладной математики АН СССР (ныне Институт им. М.В.Келдыша) и погружается в информатику. Намек на причину такой рискованной смены среды содержит предпоследний абзац следующего далее авторского предисловия. Он оставил науку ради метанауки.
В информатике, как и в физике, ему сопутствует успех. Он создает новый язык программирования — язык Рефал, на котором удобно описываются алгоритмические языки, трансляторы, символьные математические преобразования и многое другое. Более того, вокруг В.Ф.Турчина складывается неформальная научная школа — научное направление, которое живет и успешно развивается до сих пор, даже после отъезда, а точнее изгнания его лидера из СССР.
Читатель уже мог догадаться, что человек с таким научно-философским диапазоном, как В.Ф.Турчин, обычно имеет четкую точку зрения на социально-политические процессы в мире и тем более в своей стране. К чести В.Ф.Турчина, он не только имел такую точку зрения, но и не боялся ее высказывать. В 1968 г. он написал статью “Инерция страха” и предложил ее для публикации журналу “Коммунист”. В ней, в частности, доказывалось, что тоталитарное общество обречено, и предлагался вариант перехода от тоталитарного общества к свободному. (Корни перестройки, как видите, можно обнаружить много раньше 80-х годов.) Статья не была напечатана, но естественно имела “последствия” для ее автора. Небольшое количество экземпляров ходило в “самиздате”; в 1976 г. статья была переработана в солидную книгу “Инерция страха. Социализм и тоталитаризм”, которая годом позже была опубликована в США на русском, а затем и на английском языках.
Одним из первых читателей “Инерции страха” был А.Д.Сахаров. С 1968 г. общественная деятельность этих людей протекала совместно. Именно по инициативе В.Ф.Турчина в 1970 г. было написано и направлено в правительство письмо, о котором рассказал А.Д.Сахаров в своих воспоминаниях. В письме обращалось внимание на необходимость либерализации и демократизации общества, поскольку без этого экономике страны угрожает полный крах.
Но вернемся к книге “Феномен науки”. Она была написана в 1970 г. по договору с издательством “Советская Россия”. Хотя она и собрала самые положительные рецензии, три года тянулась волокита с ее набором. В редакции “не понимали”, как можно положить на стол главного редактора книгу с такой последней главой. Слишком очевидным было противоречие духу марксистско-ленинской философии. И все же к 1973 г. книга была набрана и прошла стадию верстки. До выхода в свет оставалось совсем немного, но... началась кампания против А.Д.Сахарова. В центральной прессе публикуется открытое письмо, клеймящее его позором, за подписями 40 членов Академии наук... В.Ф.Турчин выступает на пресс-конференции перед иностранными корреспондентами в защиту А.Д.Сахарова. Вскоре после этого ему звонят и, извиняясь, объясняют, что в типографии то ли рухнула штукатурка с потолка, то ли рухнул весь потолок как раз на набор книги, то ли сам набор рухнул с полки на пол, но восстановить его нет никакой возможности. Вот некоторые обстоятельства, проливающие свет на то, почему переводы книги на английский и японский языки вышли много раньше русского оригинала.
В начале 1973 г. В.Ф.Турчин переходит в ЦНИПИАС (Центральный научно-исследовательский проектный институт автоматизации в строительстве) на должность заведующего лабораторией. Здесь сыграли роль два соображения. Во-первых, он считал свое новое место работы менее режимным и, следовательно, более совместимым с теми контактами, которые неизбежно возникали в связи с его правозащитной деятельностью. Во-вторых, в ЦНИПИАС были обещаны более широкие возможности для организационного оформления научной школы В.Ф.Турчина.
В апреле 1974 г. В.Ф.Турчин становится председателем московского отделения Amnesty International — группы “Международная амнистия”, выступающей в защиту узников совести во всех странах независимо от их политической системы. В том же 1974 г. ученый совет ЦНИПИАС не переаттестовывает его в должности, после чего его “клеймят позором” на собрании сотрудников и увольняют. Все дальнейшие попытки получить хоть какую-нибудь работу были тщетны. Семья с двумя сыновьями оказалась на зарплате жены Т.И.Турчиной — младшего научного сотрудника института Нефтехимсинтеза им. Губкина.
В декабре 1976 г. В.Ф.Турчин получает “последнее предупреждение” от КГБ: либо он уезжает, либо его ждет арест. Обыск и допросы к тому времени он уже прошел. В 1977 г. начались аресты членов Хельсинкской группы: Ю.Орлова, А.Гинзбурга, А.Щаранского и др. Хотя В.Ф.Турчин и не был формально членом Хельсинкской группы, но готовил материалы для нее и участвовал в пресс-конференции Хельсинкской группы в качестве представителя Международной амнистии. Пришлось делать “выбор”. Кто был близко знаком с В.Ф.Турчиным, знает, как он не хотел уезжать. Вот вкратце те обстоятельства, при которых наша наука потеряла Турчина, а американская — нашла.
Для полноты картины следует еще сказать, что В.Ф.Турчин — веселый, жизнерадостный, остроумный человек, блестящий рассказчик. Общение с ним — это всегда радость. Он был капитаном команды КВН города Обнинска в 1963 г., когда КВН только начинался. Команда под его водительством победила команду из Дубны! Он же был одним из составителей сборников “Физики шутят” и “Физики продолжают шутить”, доставляющих своим читателям много веселых минут и ставших давно библиографической редкостью.
Читатель! Вас ждет встреча с весьма неординарным автором, ученым и гражданином. Счастливого пути!
В заключение хочу выразить благодарность всем, кто содействовал изданию книги. Особую благодарность я выражаю нескольким людям. А.Б.Ходулев установил на компьютере и настроил систему LATEX, которой я пользовался при подготовке оригинал-макета книги. Он же был моим учителем по системе и безотказным консультантом. Т.Н.Малышева и Н.Б.Дзалаева взяли на себя очень большую работу по первоначальному вводу в компьютер текста книги (в системе LEXICON). Самую разнообразную помощь я получал от Анд.В.Климова, который, в частности, отлично выполнял функции “канала связи” с “удаленным” автором.
Коллега В.Ф.Турчина
по Институту прикладной математики
В.С.Штаркман
февраль 1992 г.
Русское издание этой книги выходит через двадцать с лишним лет после ее написания. За это время наука существенно продвинулась вперед. Достаточно вспомнить раскрытие генетического кода, открытия в астрофизике, новую теорию элементарных частиц. Персональные компьютеры вошли чуть ли не в каждый дом. Между тем книга выходит в том виде, в каком она была подготовлена к печати в 1970 г. Если бы я стал что-то добавлять к ней, то это превратилось бы, в конечном счете, в написание новой книги, гораздо большей по объему, и она включала бы в себя старую практически целиком и без перемен. Ибо основная тема книги — Эволюция Вселенной как последовательность метасистемных переходов — не пострадала от времени. Напротив, появились новые указания на плодотворность этого подхода. В настоящее время мы с группой коллег начали работу над проектом PRINCIPIA CYBERNETICA, который включает дальнейшее развитие этих идей. Некоторое представление об этом проекте дает написанная мною совместно с Клиффом Джослиным статья “Кибернетический манифест”. Эта статья также включает краткое изложение основных идей книги и включена в качестве приложения к настоящему изданию.
“Феномен науки” вышел в английском и японском переводах. Я очень рад, что он может, наконец, выйти и в русском оригинале.
Одно место в “Феномене науки” требует комментария в свете последних достижений физики. В разделе “Сумасшедшие теории и метанаука” я высказал мысль, что для того, чтобы разрешить трудности в современной теории элементарных частиц, надо разработать методы “метанауки”, т. е. теории о том, как строить теории. Причину я усматривал в том, что основные понятия физики на ранних стадиях ее развития брались из нашей интуиции макроскопического мира. Но для познания законов микромира (а точнее, для построения математических моделей этого мира) наша “макроскопическая” интуиция неадекватна. Если интуиция не дает нам впрямую тех “колесиков”, из которых можно строить модели микромира, то нам нужны какие-то теории о том, как эти колесики выбирать и как модели строить. Это и будет метанаука.
С тех пор как была написана моя книга, физика элементарных частиц сделала огромный шаг вперед — и без всякой метанауки, а лишь на основе старой идеи, что одни частицы могут как бы состоять из других, более элементарных частиц. Тем не менее я полагаю, что моя логика остается в силе, и если не на данной, то на какой-то последующей стадии развития точных наук метатеоретические методы докажут свою плодовитость.
В.Ф.Турчин
Обнинск, август 1990 г.
Что такое научное познание действительности? Ответить на этот вопрос с научной же точки зрения — значит взглянуть на человечество как бы со стороны, из космического пространства. Тогда люди предстанут в виде определенного рода материальных образований, совершающих определенные действия, в частности произносящих какие-то слова и пишущих какие-то знаки. Как возникают эти действия в процессе эволюции жизни? Можно ли объяснить их появление на основе каких-то общих принципов, относящихся к процессу эволюции? Что представляет собой научная деятельность в свете этих общих принципов? Таковы те вопросы, на которые мы попытаемся ответить в этой книге.
Принципы, столь общие, что они применимы как к развитию науки, так и к биологической эволюции, требуют для своего выражения столь же общих понятий. Такие понятия дает кибернетика — наука о связях, управлении и организации в объектах любой природы. В кибернетических понятиях с равным успехом описываются явления физико-химические, биологические, социальные. Именно развитие кибернетики и особенно ее успехи в описании и моделировании целенаправленного поведения и распознавания понятий сделали возможным написание этой книги. Поэтому более точно ее предмет можно определить так: кибернетический подход к науке как к изучаемому явлению.
Идейным стержнем книги является понятие о метасистемном переходе, т. е. переходе от кибернетической системы к метасистеме, включающей в себя множество систем типа исходной, организованных и управляемых определенным образом. Сначала это понятие было положено автором в основу анализа развития знаковых систем, используемых наукой. Затем, однако, оказалось, что исследование под этим углом зрения всей эволюции жизни на Земле позволяет воссоздать связную и подчиненную единым закономерностям картину или, лучше сказать, киноленту, которая начинается с первых живых клеток и кончается современными научными теориями и системой промышленного производства. Эта кинолента указывает, в частности, место феномена науки в ряду других явлений мира и раскрывает его значение на фоне общей картины эволюции Вселенной. Так возник замысел настоящей книги. Сколь убедительно нарисована картина, мы предоставим судить читателю.
В соответствии с замыслом книги в ней излагается много фактов и концепций, которые весьма разнородны. Одни из фактов хорошо известны, о таких мы стараемся говорить кратко, приводя их в систему и соотнося с основной идеей книги. Другие факты менее известны, тогда мы останавливаемся на них подробнее. То же относится и к концепциям: некоторые общеприняты, другие менее известны и, возможно, спорны. Разнородность материала приводит также к тому, что разные разделы книги требуют от читателя различных усилий. Одни из них описательны и легки для чтения. В других местах, приходится углубляться в довольно специальные вопросы. Поскольку книга рассчитана на широкий круг читателей и не предполагает познаний вне рамок программы средней школы, мы во всех таких случаях сообщаем читателю необходимые теоретические сведения. Эти страницы потребуют от неподготовленного читателя определенной работы.
Важное место в книге отводится проблемам теории познания и логики; они трактуются, конечно, с кибернетических позиций. Кибернетика сейчас ведет наступление на традиционную философскую гносеологию, давая новую, естественно-научную интерпретацию одним ее понятиям и отвергая другие как несостоятельные. Некоторые философы противятся этому наступлению, считая его посягательством на свою территорию. Они обвиняют кибернетиков в “огрублении” и “упрощении” истины, в игнорировании “принципиального различия” между формами движения материи (и это несмотря на тезис о единстве мира!). Но философ, которому чуждо землевладельческое отношение к различным областям знания, должен приветствовать атаки кибернетиков. В свое время развитие физики и астрономии уничтожило натурфилософию, избавив философов от необходимости говорить приблизительно о том, о чем ученые могут говорить точно. Очевидно, развитие кибернетики сделает то же с философской гносеологией или — скажем более осторожно — со значительной ее частью. Этому надо только радоваться. У философов всегда будет достаточно своих забот: наука избавляет их от одних, но доставляет другие.
Так как книга посвящена науке в целом как определенному способу взаимодействия человеческого общества с окружающей средой, в ней почти ничего не говорится о конкретных естественнонаучных дисциплинах; изложение остается целиком на уровне понятий кибернетики, логики и математики, которые общезначимы для всей современной науки. Исключение делается только для некоторых представлений современной физики, имеющих принципиальную важность для теории знаковых систем. В нашу задачу не входит также конкретный анализ взаимодействия науки с производством и общественной жизнью. Это отдельный вопрос, которому посвящена обширная литература; мы и здесь остаемся на уровне общих понятий кибернетики.
Попытки соединить в целостной картине большое количество материала из различных областей знания всегда чреваты опасностью искажения деталей, ибо человек не может быть специалистом во всем. Поскольку данная книга является именно такой попыткой, весьма вероятно, что специалисты в затронутых здесь областях науки найдут в ней упущения и неточности. Ничего не поделаешь, такова цена, которую приходится платить за картины с большим охватом, но такие картины необходимы. Автору остается только надеяться, что картина, нарисованная в этой книге, содержит лишь такие погрешности в деталях, которые могут быть устранены без ущерба для картины в целом.
В процессе эволюции жизни, насколько нам известно, всегда происходило и происходит сейчас увеличение общей массы живого вещества и усложнение его организации. Усложняя организацию биологических образований, природа действует по методу проб и ошибок. Существующие образования воспроизводятся во многих экземплярах, которые, однако, не вполне тождественны оригиналу, а отличаются от него наличием небольших случайных вариаций. Эти экземпляры служат затем материалом для естественного отбора. Они могут выступать и как отдельные живые существа — тогда отбор приводит к закреплению полезных вариаций, и как элементы более сложного образования — тогда отбор направлен также и на структуру нового образования (например, при возникновении многоклеточных организмов). И в том и в другом случае отбор является результатом борьбы за существование, в которой более жизнеспособные образования вытесняют менее жизнеспособные.
Этот механизм развития жизни, открытый Чарльзом Дарвином, можно назвать основным законом эволюции. В наши цели не входит обоснование или обсуждение этого закона с точки зрения тех законов природы, которые можно было бы провозгласить более фундаментальными. Будем принимать основной закон эволюции как нечто данное.
Историю жизни до появления человека можно разбить на два периода, которые мы назовем «химической» эрой и «кибернетической» эрой. Границей между ними служит появление животных с четко оформленной нервной системой, включающей органы чувств, нервные волокна для передачи информации и нервные узлы для ее преобразования. Такая терминология не означает, конечно, что понятия и методы кибернетики неприменимы к жизни «химической» эры; просто животное «кибернетической» эры является классическим объектом кибернетики, на котором она возникла и оформилась как научная дисциплина.
Историю и логику эволюции в докибернетическом периоде мы рассмотрим лишь бегло, ссылаясь на воззрения современных биологов1. В этом периоде можно выделить три этапа.
На первом этапе закладываются химические основы жизни, образуются макромолекулы нуклеиновых кислот и белков, обладающие свойством редупликации — снятия копий, «отпечатков», когда одна макромолекула служит матрицей для синтеза из элементарных радикалов подобной ей макромолекулы. Основной закон эволюции, который вступает в действие на этом этапе, приводит к тому, что матрицы, обладающие большей интенсивностью воспроизведения, получают преимущество перед матрицами с меньшей интенсивностью воспроизведения, в результате чего образуются все более сложные и активные макромолекулы и системы макромолекул. Биосинтез требует свободной энергии. Первичным ее источником является солнечное излучение. Продукты частичного распада живых образований, непосредственно использующих солнечную энергию (фотосинтез), также содержат некоторый запас свободной энергии, который может быть реализован с помощью уже имеющейся химии макромолекулы. Он и реализуется специальными образованиями, для которых продукты распада служат вторичным источником свободной энергии. Так возникает расслоение жизни на растительный и животный миры.
Второй этап эволюции — возникновение и развитие у животных двигательного аппарата.
В характеристике доступа к источнику энергии есть существенное различие между растениями и животными. При данной освещенности интенсивность поглощения солнечной энергии зависит только от величины поверхности растения, но никак не от того, движется оно или покоится. Совершенствование растений пошло по пути создания выносных светоуловителей — зеленых листьев, крепящихся на системе опор и стрел — стеблей, веток и т. п. Конструкция эта отлично работает, обеспечивая медленное перемещение зеленых поверхностей к свету, отвечающее медленному изменению освещенности.
Совсем другое положение у животного, в частности, у самого примитивного животного, например, амебы. Источник энергии — пища — заполняет среду вокруг него. Приток энергии определяется скоростью диффузии пищевых молекул через оболочку, отделяющую пищеварительный аппарат от внешней среды. Скорость диффузии зависит не только — и даже не столько — от величины поверхности пищеварительного аппарата, сколько от движения этой поверхности относительно среды, дающего возможность выедать пищу из различных ее участков. Поэтому даже простое хаотическое движение в среде или, напротив, движение среды относительно организма (так делают, например, губки, прогоняя через себя воду с помощью ресничек) имеет большое значение для примитивного животного и, следовательно, появляется в процессе эволюции. Возникают специальные образования (внутриклеточные — у одноклеточных организмов и содержащие группы клеток — у многоклеточных), основной функцией которых является производство движения.
На третьем этапе эволюции движения животных становятся направленными, и у них появляются зачатки органов чувств и нервной системы. Это также является естественным следствием основного закона. Животному выгоднее двигаться в том направлении, где концентрация пищи выше, а чтобы осуществить это движение, надо иметь датчики, характеризующие состояние внешней среды в различных направлениях (органы чувств), и информационные каналы связи между этими датчиками и двигательным аппаратом (нервная система). Вначале нервная система чрезвычайно примитивна. Органы чувств различают лишь несколько ситуаций, на которые животное должно реагировать по-разному. Объем информации, который передает нервная система, ничтожен. Специальный аппарат для обработки информации отсутствует. С течением времени органы чувств усложняются и поставляют все больше информации о внешнем мире. Одновременно совершенствуется двигательный аппарат. Это предъявляет все увеличивающиеся требования к пропускной способности нервной системы. Появляются специальные образования — нервные узлы, которые перерабатывают информацию, поступающую от органов чувств, в информацию, управляющую органами движения. Начинается новая — «кибернетическая» эра.
Анализ эволюции в кибернетический период, вскрытие законов, по которым происходит усложнение организации живых существ этого периода — мы будем для краткости называть их «кибернетическими животными», — требует введения некоторых фундаментальных понятий и законов кибернетики.
Сам термин «кибернетика« ввел, как известно, Норберт Винер, определив его описательно как учение о связях и управлении в живом организме и машине. Чтобы более точно дать определение кибернетики, как и всякой научной дисциплины, мы должны ввести ее основные понятия. Собственно говоря, ввести основные понятия — это и значит уже определить данную науку, ибо остается только добавить: описание мира с помощью этой вот системы понятий и есть данная конкретная наука.
В основе кибернетики лежит прежде всего понятие системы как некоторого материального объекта, состоящего из других объектов, называемых подсистемами данной системы. Подсистема некоторой системы, в свою очередь, может рассматриваться как система, состоящая из подсистем. Поэтому, если быть точным, смысл введенного нами понятия заключается не в термине «система» самом по себе, т. е. не в приписывании некоторому объекту свойства «быть системой», что довольно бессодержательно, ибо каждый объект может считаться системой, а в связи между терминами «система» и «подсистема», отражающей определенное отношение объектов.
Второе важнейшее понятие кибернетики — понятие состояния системы (подсистемы). Подобно тому как понятие системы непосредственно опирается на нашу пространственную интуицию, понятие состояния непосредственно опирается на нашу интуицию времени, и его невозможно определить иначе, как сославшись на опыт. Когда мы видим, что объект в чем-то изменился, мы говорим, что он перешел в другое состояние. Как и понятие системы, понятие состояния является скрытым отношением — отношением между двумя моментами времени. Если бы мир был неподвижным, понятие состояния не могло бы возникнуть, и в тех дисциплинах, где мир рассматривается статически, например, в геометрии, понятие состояния отсутствует.
Кибернетика изучает организацию систем в пространстве и времени, т. е. то, каким образом связаны подсистемы в систему и как влияет изменение состояния одних подсистем на состояние других подсистем. Основной упор делается, конечно, на организацию во времени, которая в случае, когда она целенаправленна, называется управлением. Причины связи между состояниями системы и вытекающие отсюда особенности ее поведения во времени часто называют заимствованным из физики термином динамика системы. Этот термин в применении к кибернетике неудачен, так как, говоря о динамике системы, мы склонны рассматривать ее как нечто целое, в то время как в кибернетике главным является исследование воздействия друг на друга подсистем, образующих данную систему. Поэтому мы предпочитаем говорить об организации во времени, употребляя термин динамическое описание только тогда, когда его нужно противопоставить статическому описанию, учитывающему лишь пространственные отношения между подсистемами.
Кибернетическое описание может иметь различный уровень детализации. Одну и ту же систему можно описывать либо в общих чертах, разбив ее на несколько крупных подсистем, «блоков», либо более детально, описав строение и внутренние связи каждого блока. Но так или иначе кибернетическое описание всегда имеет какой-то конечный уровень, глубже которого оно не распространяется. Подсистемы этого уровня рассматриваются как элементарные, не разложимые на составные части. Реальная физическая природа элементарных подсистем кибернетика не интересует, ему важно только, как они связаны между собой. Два физических объекта могут радикально отличаться друг от друга по своей природе, но если на каком-то уровне кибернетического описания они организованы из подсистем одинаково (с учетом динамического аспекта!), то с точки зрения кибернетики их можно считать — на данном уровне описания — тождественными. Поэтому одни и те же кибернетические соображения могут быть применимы к таким разным объектам, как радиотехническая схема, программа для вычислительной машины или нервная система животного.
Состояние системы определяется через совокупность состояний всех ее подсистем, т. е. в конечном счете элементарных подсистем. Элементарные подсистемы бывают двух типов: с конечным и бесконечным числом возможных состояний. Подсистемы первого типа называют также подсистемами с дискретными состояниями, второго типа — с непрерывными состояниями. Примером подсистемы с дискретными состояниями может служить колесико арифмометра или счетчика в такси. Нормально это колесико находится в одном из десяти положений, соответствующих десяти цифрам от 0 до 9. Время от времени оно поворачивается и переходит из одного состояния в другое. Этот процесс поворота нас мало интересует. Правильная работа системы (арифмометра, счетчика) зависит только от того, как связаны между собой «нормальные» положения колесиков, а как происходит переход из одного положения (состояния) в другое — несущественно. Поэтому мы и можем рассматривать арифмометр как систему, элементарные подсистемы которой могут находиться только в дискретных состояниях. Современная быстродействующая цифровая вычислительная машина также состоит из подсистем (триггерных схем) с дискретными состояниями. Все, что мы знаем в настоящее время о нервной системе животных и человека, указывает на то, что решающую роль в ее работе играет взаимодействие подсистем (нейронов) с дискретными состояниями.
С другой стороны, человек, катящийся на велосипеде, или аналогичная вычислительная машина дают нам примеры систем, которые описываются как состоящие из подсистем с непрерывными состояниями. В случае велосипедиста таковыми являются все движущиеся друг относительно друга части велосипеда и человеческого тела: колеса, педали, руль, ноги, руки и т. д. Их состояния — это их положения в пространстве, описывающиеся координатами (числами), которые могут принимать непрерывные множества значений.
Если система состоит исключительно из подсистем с дискретными состояниями, то и сама она может находиться лишь в конечном числе состояний, т. е. является системой с дискретными состояниями. Такие системы мы будем называть просто дискретными системами, а системы с непрерывным множеством состояний — непрерывными. Дискретные системы во многих отношениях проще для анализа, чем непрерывные. В частности, пересчет числа возможных состояний системы, который играет важную роль в кибернетике, требует в дискретном случае лишь знания элементарной арифметики. Пусть дискретная система A состоит из двух подсистем a1 и a2, причем подсистема a1 может иметь n2, а подсистема a2 — n2 возможных состояний. Допуская, что каждое состояние системы a1 может сочетаться с каждым состоянием системы a2, мы находим, что число N возможных состояний системы A есть n1n2. Если система A состоит из m подсистем ai, где i = 1, 2, ..., m, то
N = n1n2...nm.
В дальнейшем мы будем рассматривать только дискретные системы. Кроме того прагматического соображения, что они принципиально проще, чем непрерывные системы, существует еще два довода в пользу целесообразности такого ограничения.
Во-первых, все непрерывные системы можно, в принципе, рассматривать как дискретные системы с чрезвычайно большим числом состояний. В свете тех знаний, которые дала нам квантовая физика, такой подход даже следует рассматривать как теоретически более правильный. Причина, по которой непрерывные системы все же не исчезают из кибернетики, — это наличие весьма совершенного аппарата — математического анализа и, в первую очередь, дифференциальных уравнений для рассмотрения таких систем.
Во-вторых, самые сложные кибернетические системы, как возникшие естественным путем, так и созданные руками человека, неизменно оказываются дискретными. Особенно наглядно это видно на примере животных. Относительно простые биохимические механизмы, регулирующие температуру тела, содержание в крови различных веществ и т. п., являются непрерывными, но нервная система устроена по дискретному принципу.
Почему же, когда необходимо выполнять сложные функции, дискретные системы оказываются предпочтительнее, чем непрерывные? Потому что они отличаются более высокой надежностью. В кибернетическом устройстве, основанном на принципе дискретных состояний, каждая элементарная подсистема может находиться лишь в небольшом числе возможных состояний, поэтому она, как правило, игнорирует малые отклонения от нормы различных физических параметров системы, восстанавливая «в первозданной чистоте» одно из своих допустимых состояний. В то же время в непрерывной системе малые возмущения непрерывно накапливаются и, если система слишком сложна, она перестает правильно работать. Конечно, и в дискретной системе всегда существует возможность сбоя, ибо небольшие изменения физических параметров все-таки приводят к конечной вероятности перехода подсистемы в «неправильное» состояние. И все-таки преимущество, бесспорно, на стороне дискретных систем. Покажем это на следующем простом примере.
Пусть нам надо передать сообщение с помощью электрического провода на расстояние, скажем, 100 км. И пусть через каждый километр провода мы имеем возможность поставить автоматическую станцию, которая будет усиливать сигнал до той мощности, которую он имеет на предыдущей станции, и — если нужно — как-то преобразовывать его (рис. 1.1).
Рис. 1.1. Передача сигнала в непрерывной и дискретной системах. Затенением показана область неопределенности сигнала
Допустим, что максимальная величина сигнала, который позволяет послать наша аппаратура, составляет 1 В и что среднеквадратичное искажение сигнала при передаче от станции к станции (помеха) равно 0,1 В.
Рассмотрим сначала непрерывный способ передачи информации. Тогда содержанием сообщения будет величина напряжения, приложенного к проводу у его начала. Величина напряжения на другом конце провода — принятое сообщение — будет из-за помех отличаться от начального напряжения. Как велико будет это отличие? Считая помехи на различных участках линии независимыми, мы находим, что после прохождения ста станций среднеквадратичная величина помехи составит 1 В (складываются средние квадраты помех). Таким образом, помеха в среднем равна максимальному сигналу, поэтому ясно, что никакой полезной информации мы фактически не получим. Значение принятого напряжения может совпадать со значением переданного напряжения разве что случайно. Если, например, нас устраивает точность в 0,1 В, то вероятность такого совпадения равна примерно 1/10.
Теперь рассмотрим дискретный способ передачи. Определим два «осмысленных» состояния начального участка провода: когда приложенное напряжение равно нулю и когда оно максимально (1 В). На промежуточных станциях установим автоматические устройства, которые в одном случае, если принято напряжение меньше 0,5 В, передают дальше нулевое напряжение, а если оно больше 0,5 В, посылают нормальный сигнал в 1 В. Следовательно, в данном случае за один раз (одним сигналом) передается информация вида «да» или «нет» (такое количество информации — единица информации — называется 1 бит). Какова вероятность получения правильной информации? Она сильно зависит от закона распределения вероятности для величины помехи. Как правило, помехи подчиняются так называемому нормальному закону. Приняв этот закон, можно найти, что вероятность ошибки при передаче от предыдущей станции к следующей (равная вероятности того, что помеха превысит 0,5 В) равна 0,25×10-6. Следовательно, вероятность ошибки при передаче на всю длину линии есть 0,25×10-4. Чтобы передать то же сообщение, что и в предыдущем случае, т. е. значение с точностью до 0,1 некоторой величины, лежащей в пределах от 0 до 1, нам достаточно послать четыре сигнала вида «да» или «нет». Вероятность того, что хотя бы в одном из сигналов будет допущена ошибка, равна 10-4. Итак, полная вероятность ошибки при дискретном способе составляет 0,01% против 90% при непрерывном способе.
Начав описывать конкретную кибернетическую систему, мы невольно употребляем термин информация, который в своем разговорном, неформальном значении хорошо знаком и понятен каждому культурному человеку. Теперь мы введем кибернетическое понятие информации, имеющее точный количественный смысл.
Представим себе две подсистемы A и B (рис. 1.2), связанные между собой таким образом, что изменение состояния системы A влечет изменение состояния системы B. Это можно выразить такими словами: подсистема A воздействует на подсистему B.
Рис. 1.2. Связанные подсистемы
Рассмотрим подсистемы B в некоторый момент времени t1 и в более поздний момент времени t2. Первое обозначим через S1, второе — через S2. Cостояние S2 зависит от состояния S1. Однако оно не определяется состоянием S1 однозначно, а зависит от него вероятностным образом, ибо мы рассматриваем не идеализированную теоретическую систему, подчиняющуюся детерминистическому закону движения, а реальную систему, состояния которой S суть результаты опытных данных. При таком подходе тоже можно говорить о законе движения, понимая его в вероятностном смысле, т. е. как условную вероятность состояния S2 в момент t2 при условии, что в момент t1 система имела состояние S1. Теперь забудем на минуту о законе движения. Обозначим через N полное число возможных состояний подсистемы B и будем представлять себе дело таким образом, что в любой момент времени подсистема B может с равной вероятностью принять любое из N состояний независимо от того, какое состояние она имела в предыдущий момент. Попытаемся количественно выразить степень (или силу) причинно-следственного влияния подсистемы A на такую безынерционную и «беззаконную» подсистему B. Пусть B под действием A переходит в некоторое совершенно определенное состояние. Ясно, что «сила влияния», которая требуется для этого от A, зависит от числа N и тем больше, чем больше N. Если, например, N = 2, то система B, даже будучи совершенно не связана с A, под действием каких-то случайных причин может с вероятностью 1/2 перейти в то самое состояние, которое «рекомендует» система A. Если же N = 109, то, заметив такое совпадение, мы вряд ли усомнимся во влиянии A на B. Следовательно, мерой «силы влияния» A на B в данном единичном акте, т. е. по существу мерой интенсивности причинно-следственной связи между двумя событиями — состоянием подсистемы A в интервале времени от t1 до t2 и состоянием подсистемы B в момент t2 — должна служить какая-то монотонно возрастающая функция N. В кибернетике эта мера называется количеством информации, переданной от A к B между моментами времени t1 и t2, а монотонно возрастающей функцией служит логарифм. Итак, в нашем примере количество информации I, переданное от A к B, равно log N.
Выбор логарифмической функции определяется тем ее свойством, что
log N1 N2 = log N1 + log N2.
Пусть система A действует на систему B, состоящую из двух независимых подсистем B1 и B2 с возможным числом состояний N1 и N2 соответственно (рис. 1.3). Тогда число состояний системы B есть N1×N2, а количество информации I, которое надо передать системе B, чтобы она приняла одно определенное состояние, есть благодаря указанному свойству логарифма сумма
I = log N1 N2 = log N1 + log N2 = I1 + I2,
где I1 и I2 — количества информации, потребные подсистемам B1 и B2. Благодаря этому свойству информация принимает определенные черты субстанции, она распределяется по независимым подсистемам подобно жидкости, разливающейся по сосудам. Мы говорим о слиянии и разделении информационных потоков, об информационной емкости, о переработке информации и ее хранении.
Рис. 1.3. Воздействие на две независимые подсистемы
Вопрос о хранении информации связан с вопросом о законе движения. Выше мы мысленно отключили закон движения, чтобы определить понятие передачи информации. Если мы теперь рассмотрим закон движения с новой точки зрения, то он сводится к передаче информации от системы B в момент времени t1 к той же самой системе B в момент t2. Если состояние системы не меняется с течением времени, то это и есть хранение информации. Если состояние S2 однозначно определяется состоянием S1 в предыдущий момент времени, то систему называют полностью детерминированной. Если имеет место однозначная зависимость S1 от S2, то систему называют обратимой; для обратимой системы можно, в принципе, по заданному состоянию вычислить все предыдущие состояния, поэтому потери информации не происходит. Если система необратима, информация теряется. Закон движения в сущности есть нечто, регулирующее поток информации во времени от системы к ней самой.
Рис. 1.4. Канал связи
На рис. 1.4 изображена схема передачи информации от системы A к системе C через систему B. Эта последняя носит название канала связи. На состояние B может влиять не только состояние системы A, но еще какой-либо не поддающийся контролю фактор X, называемый помехой. Конечное состояние системы C в этом случае зависит не только от состояния A, но и от фактора Х (искажение информации). Еще одна важная схема обмена информации изображена на рис. 1.5. Это так называемая схема обратной связи. Состояние системы A в момент времени t1 влияет на состояние B в момент времени t2, а это последнее влияет на состояние системы A в момент времени t3. Путь информации замыкается.
Рис. 1.5. Обратная связь
На этом мы пока ограничим наше знакомство с общими понятиями кибернетики и вернемся к эволюции жизни на Земле.
Внешний вид нервной клетки (нейрона) показан схематически на рис. 1.6. Нейрон состоит из довольно крупного (до 0,1 мм) тела, от которого отходят несколько отростков — дендритов, дающих начало все более и более тонким отросткам, подобно ветвям дерева. Кроме дендритов, от тела нервной клетки отходит еще один отросток — аксон, напоминающий длинный тонкий провод. Аксоны бывают очень длинны — до метра — и заканчиваются, подобно дендритам, древовидным разветвлением. На концах веточек, отходящих от аксона, можно видеть маленькие пластинки или луковички. Луковички одного нейрона близко подходят к различным участкам тела или дендритов другого нейрона, почти прикасаясь к ним. Эти контакты носят название синапсов; через них нейроны взаимодействуют друг с другом. Число луковичек, подходящих к дендритам одного нейрона, может исчисляться десятками и даже сотнями. Таким образом, нейроны очень тесно связаны друг с другом; они образуют нервную сеть.
Рис. 1.6. Схема строения нейрона
С точки зрения физико-химических свойств, в первую очередь распределения электрического потенциала по поверхности клетки, нейрон может находиться в одном из двух состояний, которые называют состояниями покоя или возбуждения, и время от времени нейрон под воздействием других нейронов или каких-либо внешних факторов переходит из одного состояния в другое. Этот процесс, конечно, занимает некоторое время, так что исследователь, изучающий, например, динамику электрического состояния нейрона, рассматривает его как систему с непрерывными состояниями. Однако, сведения, которыми мы располагаем в настоящее время, указывают на то, что для работы нервной системы в целом существенным является не характер переходных процессов, а самый факт нахождения тех или иных нейронов в спокойном или возбужденном состоянии. Поэтому можно считать, что нервная сеть — это дискретная система, состоящая из элементарных подсистем — нейронов — с двумя состояниями.
Когда нейрон возбуждается, волна электрического потенциала бежит по аксону и доходит до луковичек на его разветвленных концах. С луковичек через синапсы возбуждение передается на соответствующие участки клеточной поверхности других нейронов. Поведение нейрона зависит от состояния, в котором находятся его синапсы. Простейшая модель функционирования нервной сети исходит из предположения, что состояние нейрона в каждый момент времени есть однозначная функция состояния его синапсов. Экспериментально установлено, что возбуждение одних синапсов способствует возбуждению клетки, другие синапсы, напротив, будучи возбуждены, препятствуют возбуждению в клетке. Наконец, некоторые синапсы могут вовсе не проводить возбуждение от луковичек и, следовательно, не влиять на состояние нейрона. Установлено также, что проводимость синапса увеличивается после первого прохождения через него возбуждения и нескольких следующих прохождений. Происходит как бы замыкание контакта. Это объясняет, каким образом без изменения положения нейронов друг относительно друга может меняться система связей между нейронами и, следовательно, характер функционирования нервной сети.
Представление о нейроне как о мгновенном переработчике информации, поступающей от синапсов, является, конечно, сильно упрощенным. Нейрон, как и всякая клетка, — сложная машина, работа которой еще мало изучена. Эта машина обладает большой внутренней памятью, поэтому ее реакции на внешнее воздействие могут отличаться большим разнообразием. Однако, чтобы понять общие закономерности работы нервной системы, мы можем отвлечься от этих сложностей (у нас, собственно говоря, нет другого выхода!) и исходить из очерченной выше простой модели.
Общая схема нервной системы «кибернетического животного» в его взаимодействии с внешней средой представлена на рис. 1.7. Чувствительные нервные клетки, возбуждающиеся под действием внешних факторов, носят название рецепторов (т. е. получателей), ибо они служат первичным приемником информации о состоянии внешней среды. Эта информация поступает в нервную сеть и перерабатывается ею. В результате возбуждаются некоторые из нервных клеток, называемых эффекторами. Разветвления эффекторных клеток пронизывают те ткани организма, на которые нервная система оказывает непосредственное влияние. Возбуждение эффектора вызывает сокращение соответствующей мышцы или стимулирует деятельность соответствующей железы. Состояние всех рецепторов в некоторый момент времени назовем ситуацией в этот момент. (Точнее было бы говорить «результат воздействия ситуации на органы чувств», но это слишком длинно.) Состояние всех эффекторов назовем действием. Следовательно, роль нервной сети сводится к преобразованию ситуации в действие.
Рис. 1.7. Нервная система «кибернетического животного»
Под «средой» на рис. 1.7 удобно понимать не только предметы, окружающие животное, но также и его костно-мышечную систему и вообще все то, что не входит в состав нервной системы. Это снимает необходимость изображать на схеме отдельно тело животного и «не тело», тем более что никакого принципиального значения для деятельности нервной системы это разграничение не имеет. Важно лишь то, что возбуждение эффекторов приводит к определенным переменам в «среде». При том общем подходе к проблеме, который лежит в основе нашего рассмотрения, нам достаточно квалифицировать эти изменения как «полезные» или «вредные» для животного, не вдаваясь в дальнейшие подробности.
Какова задача нервной системы? Способствовать выживанию и размножению животного. Нервная система работает хорошо, когда возбуждение эффекторов приводит к полезным с этой точки зрения изменениям состояния среды, и плохо — в противном случае. Совершенствуясь в процессе эволюции, нервная система выполняет эту задачу все лучше и лучше. Каким образом это удается? Каким законам подчиняется процесс ее совершенствования?
Мы попытаемся ответить на эти вопросы, выделив в эволюции нервной системы животных несколько этапов, четко отличающихся между собой с кибернетической точки зрения, и показав, что из основного закона эволюции следует неизбежность перехода от каждого предыдущего этапа к каждому последующему. Так как в кибернетическую эру эволюция живых существ — это прежде всего эволюция их нервной системы, периодизация развития нервной системы дает периодизацию развития жизни в целом.
Простейший вариант нервной сети — это вообще ее отсутствие. В этом случае рецепторы непосредственно связаны с эффекторами и возбуждение с одного или нескольких рецепторов передается на один или несколько эффекторов. Такую прямую связь между возбуждением рецептора и эффектора мы назовем простым рефлексом.
Этот этап — третий по нашей сквозной нумерации этапов эволюции — является пограничным между химической и кибернетической эрами. Тип кишечнополостных представляет животных, застывших на уровне простого рефлекса. Возьмем, например, гидру, которую изучают в школе как типичного представителя кишечнополостных. Тело гидры (рис. 1.8) имеет вид удлиненного мешочка. Его внутренность — кишечная полость — сообщается с внешней средой через ротовое отверстие, окруженное несколькими щупальцами. Стенки мешочка состоят из двух слоев клеток: внутреннего (энтодерма) и внешнего (эктодерма). И в эктодерме, и в энтодерме много мышечных клеток, содержащих волоконца, которые могут сокращаться, приводя тело гидры в движение. Кроме того, в эктодерме есть и нервные клетки, причем клетки, расположенные ближе всего к поверхности, — это рецепторы, а клетки, заложенные глубже, среди мышц, — эффекторы. Если к гидре прикоснуться иглой, она сжимается в комочек. Это простой рефлекс, вызванный передачей возбуждения от рецепторов к эффекторам.
Рис. 1.8. Строение гидры
Но гидра способна и к гораздо более сложному поведению. Захватив добычу, она подтягивает ее щупальцами к ротовому отверстию и заглатывает. Такое поведение тоже можно объяснить совокупным действием простых рефлексов, связывающих эффекторы и рецепторы локально — в пределах большого участка тела. Например, следующая модель щупальца объясняет его способность обвиваться вокруг падающих предметов (рис. 1.9). Представим себе некоторое количество звеньев, соединенных между собой шарнирами (для простоты рассматриваем плоскую картину). Точки A и B, A' и B', B и C, В' и C' и т. д. соединены между собой тяжами, которые могут сокращаться (мышцы). Все эти точки являются чувствительными, возбуждаясь от прикосновения к предмету (рецепторы). Возбуждение каждой точки приводит к сокращению двух соседних с нею тяжей (рефлекс).
Рис. 1.9. Модель щупальца
Простая рефлекторная связь между возбудимой и мышечной клетками естественно возникает в процессе эволюции по методу проб и ошибок: если оказывается, что корреляция между возбуждением одной клетки и сокращением другой полезна для животного, то эта корреляция устанавливается и закрепляется. При механическом копировании связанных клеток в процессе роста и размножения природа получает систему параллельно действующих простых рефлексов, подобную щупальцу гидры. Но когда в ее (природы) распоряжении оказывается множество рецепторов и эффекторов, связанных попарно или локально, у нее «возникает искушение» усложнить систему связей путем введения промежуточных нейронов. Выгодность этого следует из того, что при наличии системы связей между всеми нейронами становятся возможными такие формы поведения, которые невозможны при ограничении парными или локальными связями. Последнее утверждение можно доказать простым подсчетом всевозможных способов преобразования ситуации в действие при том и другом способах связи. Пусть, например, у нас есть n попарно связанных рецепторов и эффекторов. Связь в каждой паре может быть либо положительная (возбуждение вызывает возбуждение, покой — покой), либо отрицательная (возбуждение вызывает покой, покой — возбуждение). Следовательно, всего возможно 2n вариантов связи, т. е. 2n вариантов поведения. Если же предположить, что система связей может быть произвольная, т. е. состояние возбуждения или покоя каждого эффектора может произвольным образом зависеть от состояния всех рецепторов, то подсчет всевозможных вариантов поведения приводит к числу 2(2n)n, неизмеримо большему, чем 2n. Совершенно такой же расчет приводит к заключению, что объединение любых подсистем, связывающих независимо друг от друга группы рецепторов и эффекторов в единую систему, всегда приводит к огромному возрастанию числа возможных вариантов поведения. Поэтому на протяжении всей истории жизни эволюция нервной системы проходит под знаком увеличения централизации.
Однако централизация централизации рознь. Если связать все нейроны в один бессмысленно запутанный клубок, то, несмотря на крайнюю «централизованность» такой системы, она вряд ли будет иметь шансы выжить в борьбе за существование. Централизация ставит следующую проблему: как из всех мыслимых способов соединения многих рецепторов с многими эффекторами (с помощью промежуточных нейронов, если потребуется) выбрать такой способ, который будет каждой ситуации сопоставлять правильное, т. е. полезное для выживания и размножения, действие? Ведь подавляющее большинство способов соединения не обладает этим свойством.
Мы знаем, что каждый новый шаг на пути усложнения живых структур природа делает по методу проб и ошибок. Посмотрим, что дает непосредственное применение метода проб и ошибок к нашей проблеме. Рассмотрим для примера небольшую систему из ста рецепторов и ста эффекторов. Допустим, что в нашем распоряжении сколько угодно нейронов для создания промежуточной нервной сети и что мы умеем легко определять, дает ли данный способ соединения нейронов правильную реакцию на каждую ситуацию. Будем перебирать все мыслимые способы, пока не натолкнемся на нужный. При n = 100 число функционально различных нервных сетей между n рецепторами и n эффекторами есть
2(2n)n ≈ 10(1032).
Число это невообразимо велико. Перебор такого числа вариантов недоступен не только нам, но и нашей матушке-природе. Если бы каждый атом во всей видимой нами части Вселенной занимался просмотром вариантов и перебирал бы их со скоростью миллиард штук в секунду, то и за миллиард миллиардов лет (а наша Земля существует не более десяти миллиардов лет) не была бы просмотрена и миллиардная доля общего числа вариантов.
Между тем как-то ведь происходит формирование эффективно работающей нервной сети! Причем число рецепторов и эффекторов у высших животных исчисляется не сотнями и не тысячами, а миллионами.
Разгадка кроется в иерархическом строении нервной системы.
Здесь нам снова необходим экскурс в область общекибернетических понятий. Четвертый этап эволюции мы назовем этапом сложного рефлекса, но дать определение этому понятию сможем лишь после того, как познакомимся с некоторыми фактами об иерархически устроенных нервных сетях.
1 Мы следуем в основном докладу С.Э.Шноля «Сущность жизни. Инвариантность общего направления биологической эволюции» (Диалектика и современное естествознание: Матер. семинара. Дубна, 1967)
Рассмотрим такую нервную сеть, которая на входе имеет много рецепторов, а на выходе — всего один эффектор, так что нервная сеть делит множество всех ситуаций на два подмножества: ситуации, вызывающие возбуждение эффектора, и ситуации, оставляющие его в покое. Задачу, решаемую в этом случае нервной сетью, называют задачей распознавания (имеется в виду распознавание принадлежности ситуации к тому или иному множеству). Животному в борьбе за существование приходится сплошь и рядом решать задачу распознавания, например: отличить ситуацию, опасную для жизни, от неопасной, отличить съедобные предметы от несъедобных и т. п. Это только наиболее яркие примеры, детальный анализ поведения животного приводит к выводу, что для выполнения сколь-нибудь сложного действия оно должно непрерывно решать множество «мелких» задач распознавания.
Множество ситуаций в кибернетике называют понятием1. Чтобы лучше уяснить, как кибернетическое понимание слова «понятие» связано с его обычным пониманием, допустим, что рецепторы рассматриваемой нами нервной сети — это светочувствительные нервные окончания сетчатки глаза или же вообще какие-то светочувствительные точки на экране, подающем информацию в нервную сеть. Рецепторы возбуждаются тогда, когда соответствующий участок экрана освещен (точнее, когда его освещенность больше некоторой пороговой величины), и остаются в состоянии покоя — в противном случае. Если на месте каждого возбужденного рецептора представить себе светлую точку, а на месте каждого невозбужденного — темную, то получится картина, которая отличается от изображения, падающего на экран, лишь своей дискретностью (т. е. тем, что она распадается на отдельные точки) и отсутствием полутонов. Будем считать, что точек (рецепторов) на экране достаточно много, а изображения, которые могут оказаться на экране, — их мы будем называть «картинками» — предельно контрастны, т. е. состоят лишь из белого и черного цвета. Тогда каждая ситуация соответствует определенной картинке.
Рис 2.1. Картинки, представляющие различные понятия
Согласно традиционной (аристотелевской) логике, когда мы думаем или говорим о какой-то определенной картинке (например, о той, которая находится в левом верхнем углу на рис. 2.1), то мы имеем дело с единичным понятием. Кроме единичных понятий, есть еще общие, или абстрактные, понятия. Например, мы можем думать о пятне вообще — не о каком-либо конкретном пятне (допустим, из числа изображенных в верхнем ряду на рис. 2.1), а о пятне как таковом. Точно так же мы можем обладать абстрактным понятием прямой линии, контура, четырехугольника, квадрата и т. д.2
Однако что значит «обладать абстрактным понятием»? Как можно проверить, обладает ли кто-то данным абстрактным понятием, например понятием «пятно»? Очевидно, только одним способом: предложить испытуемому серию картинок и попросить, чтобы он о каждой из них сказал, пятно это или нет. Если окажется, что он называет пятном только те и все те картинки, на которых «изображено пятно» (это уже с точки зрения испытующего), то, значит, понятием пятна он обладает. Иначе говоря, мы должны проверить его способность распознавать принадлежность любой предъявленной картинки к множеству картинок, которые мы описываем словом «пятно». Итак, абстрактное понятие в обычном смысле слова — во всяком случае когда речь идет о чувственно воспринимаемых образах — совпадает с введенным нами кибернетическим понятием понятия как множества ситуаций. Поэтому задачу распознавания называют также, желая сделать термин более конкретным, задачей распознавания образов (имеется в виду «обобщенных» образов) или задачей распознавания понятий (имеется в виду распознавание частных случаев понятий).
Множеству, состоящему из одной ситуации (картинки), соответствует в традиционной логике конкретное понятие «данная картинка». Отношения между множествами имеют свои непосредственные аналоги в отношениях между понятиями. Если большими буквами обозначить понятия, а маленькими — соответствующие множества, то дополнение множества a, т. е. множество всех мыслимых ситуаций, не входящих в a, соответствует понятию «не A». Пересечение множеств a и b, т. е. множество ситуаций, которые входят и в a, и в b, соответствует понятию «A и B одновременно». Например, если A — понятие «прямоугольник», а B — понятие «ромб», то «A и B одновременно» — понятие «квадрат». Объединение множеств a и b, т. е. множество ситуаций, которые входят хотя бы в одно из множеств a и b, соответствует понятию «либо A, либо B, либо A и B». Если множество a включает в себя множество b, т. е. каждый элемент множества b входит в множество a, но не наоборот, то понятие B есть частный случай понятия A. При этом говорят, что понятие A более общее (абстрактное), чем понятие B, а понятие B более конкретное, чем A. Например, квадрат есть частный случай прямоугольника. Наконец, если множества a и b совпадают, то понятия A и B по существу тождественны и отличаются, быть может, лишь внешней формой их описания — способом распознавания. Встав на точку зрения кибернетики, т. е. отождествив понятие с множеством ситуаций, мы должны рассматривать перечисленные соответствия не как определение новых терминов, а просто как указание на наличие в нашем языке нескольких пар синонимов.
Нервную сеть, решающую задачу распознавания, мы назовем распознавателем, а состояние эффектора на его выходе будем называть просто состоянием распознавателя. Отправляясь от понятия распознавателя, мы введем несколько более общее понятие классификатора. Распознаватель делит множество всех мыслимых ситуаций на два непересекающихся подмножества: A и не A. Можно представить себе деление полного множества ситуаций на произвольное число n пересекающихся подмножеств. Такие подмножества называют обычно классами. Теперь вообразим некую подсистему C, имеющую n возможных состояний и связанную нервной сетью с рецепторами таким образом, что, когда ситуация принадлежит к i-му классу (i-му понятию), подсистема C приходит в i-е состояние. Такую подсистему вместе с нервной сетью мы будем называть классификатором по множеству n понятий (классов), а, говоря о состоянии классификатора, подразумевать состояние подсистемы C (выходной подсистемы). Распознаватель — это, очевидно, классификатор с числом состояний n = 2.
В системе, организованной по двоичному принципу подобно нервной системе, подсистема C с n состояниями будет, конечно, состоять из какого-то числа элементарных подсистем с двумя состояниями, которые можно рассматривать как выходные подсистемы (эффекторы) распознавателей. Состояние классификатора, следовательно, будет описываться указанием состояний ряда распознавателей. Однако эти распознаватели могут быть тесно связаны между собой как по структуре сети, так и по выполняемой функции в нервной системе, и в этом случае их следует рассматривать в совокупности как один классификатор.
Если не накладывать никаких ограничений на число состояний, то понятие «классификатор» фактически теряет смысл. Действительно, всякая нервная сеть сопоставляет каждому входному состоянию одно определенное выходное состояние; следовательно, каждому выходному состоянию соответствует множество входных состояний, и эти множества не пересекаются. Таким образом, всякое кибернетическое устройство с входом и выходом можно формально рассматривать как классификатор. Придавая этому понятию более узкий смысл, мы будем считать, что число выходных состояний классификатора гораздо меньше, чем число входных состояний, так что классификатор действительно «классифицирует» входные состояния (ситуации) по относительно небольшому числу больших классов.
На рис. 2.2 приведена схема классификатора, организованного по иерархическому принципу. Иерархия вообще — это такое построение системы из подсистем, когда каждой подсистеме приписывается определенное целое число, называемое ее уровнем, причем взаимодействие подсистем существенно зависит от разности их уровней, подчиняясь некоторому общему принципу. Обычно этот принцип — передача информации в определенном направлении (сверху вниз или снизу вверх) от данного уровня к следующему. В нашем случае рецепторам приписывается нулевой уровень, и информация распространяется снизу вверх. Каждая подсистема первого уровня связана с некоторым числом рецепторов, и ее состояние определяется состояниями соответствующих рецепторов. Точно так же каждая подсистема второго уровня связана с рядом подсистем первого уровня и т. д. На высшем (на схеме — четвертом) уровне находится одна выходная подсистема, которая и выносит окончательный приговор о принадлежности ситуации к тому или иному классу.
Рис. 2.2. Иерархия классификаторов
Из этого определения, которое трудно назвать шедевром ясности мысли, можно все-таки заключить, что общие понятия, которые образуются не путем перечисления единичных объектов, входящих в него, а путем указания ряда признаков, объявляемых существенными, и отвлечения от остальных (несущественных) признаков, можно также считать абстрактными. Мы будем рассматривать только такие общие понятия и будем называть их также абстрактными. Например, абстрактный треугольник — это любой треугольник, независимо от величины его сторон и углов и его положения на экране, следовательно, это абстрактное понятие. Такое употребление термина «абстрактный» имеет место в обиходе, а также в математике. В то же время, согласно учебнику логики, «треугольник», «квадрат» и т. п. суть конкретные общие понятия, а вот «треугольность» и «квадратность», которые им свойственны, это понятия абстрактные. По существу, здесь в ранг логического возводится чисто грамматическое различие, ибо даже с точки зрения сторонника последнего варианта терминологии обладание абстрактным понятием равнозначно обладанию соответствующим общим понятием.
Все подсистемы промежуточных уровней также являются классификаторами. Непосредственным входом k-го уровня служат состояния классификаторов k-1-го уровня, совокупность которых является для него ситуацией, подлежащей классификации. В иерархической системе, содержащей более одного промежуточного уровня, можно выделить иерархические подсистемы, охватывающие несколько уровней. Например, в качестве входных ситуаций для классификатора третьего уровня можно рассматривать состояния всех связанных с ним классификаторов первого уровня. Иерархические системы можно достраивать «вширь» и «ввысь» подобно тому, как из восьми кубиков можно сложить кубик с вдвое большим ребром, а из этих кубиков — еще больший кубик и т. д.
Так как с каждым классификатором связана система понятий, иерархия классификаторов порождает иерархию понятий. Передаваясь от уровня к уровню, информация преобразуется, выражаясь в терминах все более «высокопоставленных» понятий. При этом количество передаваемой информации постепенно уменьшается за счет отбрасывания информации, несущественной с точки зрения задачи, поставленной перед «верховным» (выходным) классификатором.
Поясним этот процесс на примере картинок, изображенных на рис. 2.1. Пусть поставлена задача распознавания «домиков». Введем два промежуточных понятийных уровня. На первом разместим совокупность понятий «отрезки», на втором — понятия «многоугольники». Понятие «домик» окажется на третьем уровне.
Под понятием «отрезки» мы понимаем совокупность понятий «отрезок с координатами концов x1, y1 и x2, y2», где числа x1, y1, x2, y2 могут принимать любые совместимые с устройством экрана и системой координат значения. Чтобы быть конкретнее, допустим, что экран содержит 1000 × 1000 светочувствительных точек. Тогда координатами могут служить десятиразрядные двоичные числа (210 = 1024 > 1000), а отрезок с заданными концами требует для своей характеристики четыре таких числа, т. е. 40 двоичных разрядов. Всего, следовательно, существует 240 таких понятий. Их-то и должны различать классификаторы первого уровня.
Не надо думать, что отрезок с заданными концами — конкретное понятие, т. е. множество, состоящее из одной картинки. Классифицируя предъявленную картинку как отрезок с заданными концами, мы отвлекаемся от незначительных искривлений линии, вариаций ее толщины и т. п. (см. рис. 2.1). Критерий того, какие отклонения от нормы нам следует считать незначительными, может устанавливаться по-разному. Сейчас это нас не интересует.
Каждый классификатор первого уровня должен иметь на выходе подсистему из 40 двоичных разрядов, на которых «записаны» координаты концов отрезка. Сколько нужно классификаторов? Это зависит от того, какие картинки ожидаются на входе системы. Допустим, что для описания любой картинки достаточно 400 отрезков. Значит, достаточно 400 классификаторов. Разделим этот экран на 400 квадратов (50 × 50 точек) и свяжем с каждым квадратом классификатор, который будет фиксировать ближайший к нему, в каком-то смысле (детали разделения труда между классификаторами несущественны), отрезок. Если отрезка нет, пусть классификатор принимает какое-то стандартное «бессмысленное» состояние, например: все четыре координаты равны 1023.
Если предъявить нашей системе картинку, на которой изображено сколько-то отрезков, то соответствующее число классификаторов первого уровня укажет координаты концов отрезков, а остальные примут состояние «нет отрезка». Это и есть описание ситуации в терминах понятий «отрезки». Сравним количество информации на нулевом и на первом уровнях. На нулевом уровне нашей системы 1000 × 1000 = 106 рецепторов получают информацию в миллион бит. На первом уровне 400 классификаторов, каждый из которых содержит 40 двоичных разрядов, т. е. 40 бит информации, всего 16 000 бит. При переходе на первый уровень количество информации уменьшилось в 62,5 раза. Система сохранила ту информацию, которую она сочла «полезной» и отбросила информацию «бесполезную» с ее точки зрения. Относительность этих понятий видна из того, что если предъявленная картинка не соответствует иерархии понятий системы распознавания, то реакция системы будет неправильной или просто бессмысленной. Если, например, на картинке более 400 отрезков, то не все отрезки будут зафиксированы, а если предъявить картинку с пятном, то реакция на нее будет такая же, как на пустую картинку.
Совокупность понятий «многоугольники», занимающую второй уровень иерархии, мы делим на две меньших совокупности: равнобедренные треугольники и параллелограммы. Из числа параллелограммов мы выделяем в особую совокупность прямоугольники. Считая, что для задания угла и длины надо столько же бит (10), как и для координаты, находим, что для задания определенного равнобедренного треугольника надо 50 бит информации, параллелограмма — 60 бит, прямоугольника — 50 бит. Соответственно этому должны быть сконструированы классификаторы второго уровня. Легко видеть, что вся нужная им информация имеется в наличии на первом уровне. Наличие многоугольника констатируется при наличии нескольких отрезков, находящихся между собой в определенных отношениях. При переходе на второй уровень происходит дальнейшее сжатие информации. Отводя из полного числа 400 отрезков по одной трети на каждый вид многоугольников, получаем систему, способную зафиксировать 44 треугольника, 33 прямоугольника и 33 параллелограмма (одновременно). Ее информационная емкость 5830 бит, т. е. почти втрое меньше, чем емкость первого уровня. Зато перед неправильным треугольником или четырехугольником система встанет в тупик!
Понятие «домик» легко описать на языке понятий второго уровня. Домик состоит из четырех многоугольников: одного прямоугольника, одного равнобедренного треугольника и двух параллелограммов, находящихся в определенных отношениях друг к другу (основание равнобедренного треугольника совпадает с одной стороной прямоугольника и т. д.).
Во избежание недоразумений следует указать, что иерархия понятий, о которой мы говорим, имеет гораздо более общий смысл, чем иерархия понятий по абстрактности (общности), которую часто называют просто «иерархия понятий». Примером иерархии по общности может служить пирамида понятий, относящихся к систематике животных. На нулевом уровне располагаются отдельные особи животных («конкретные» понятия), на первом — виды, на втором — роды, затем — семейства, отряды, классы, типы. На вершине пирамиды находится понятие «животное». Такая пирамида является частным случаем иерархии понятий в общем смысле, отличающимся тем, что каждое понятие k-го уровня образуется из некоторого числа понятий k-1-го уровня путем их объединения. Это соответствует очень просто устроенным классификаторам. В общем случае классификаторы могут быть устроены как угодно. Распознаватели, нужные животному, — это скорее иерархии по сложности и тонкости понятий, а не по общности.
Вернемся снова к эволюции нервной системы. Может ли иерархия классификаторов возникнуть эволюционным путем? Очевидно, может, но при одном условии: если создание каждого нового уровня иерархии и его последующего расширения полезны животному в борьбе за жизнь. Из факта существования животных с высокоорганизованной нервной системой мы делаем вывод, что так оно и есть в действительности. Кроме того, изучая примитивных животных, мы видим, что система понятий, которые способна распознавать их нервная система, также весьма примитивна. Следовательно, в пользе нижайшего уровня иерархии классификаторов мы убеждаемся воочию.
Набросаем в общих чертах путь развития нервной системы. На начальных стадиях мы находим у животного всего несколько рецепторов. Число возможных способов связи между ними (соединений) относительно невелико и допускает прямой перебор. По методу проб и ошибок находится выгодное соединение. То, что выгодное соединение может существовать даже при очень малом числе нейронов, легко видеть на таком примере. Пусть есть всего два светочувствительных рецептора. Если они расположены на разных сторонах тела, то информация, которую они дают (разность освещенностей), достаточна, чтобы животное могло двигаться на свет или против света. Когда выгодное соединение найдено и осуществлено, допустим, с помощью одного промежуточного нейрона (такие нейроны называются ассоциативными), вся группа в целом может быть размножена. Так возникает система ассоциативных нейронов, регистрирующих, например, разности между освещенностями рецепторов и суммирующих эти разности (рис. 2.3).
Рис. 2.3. Простейшие типы связей между рецепторами
Может быть размножена также любая часть системы связанных нейронов, например, один или несколько рецепторов. Тогда возникает система связей типа изображенной на рис. 2.3,б. Схемы обоих типов образуют в совокупности первый уровень иерархии, основанный на понятиях суммы и разности освещенностей. Поскольку для корректировки движения животного очень важно регистрировать изменение освещенности в данной точке со временем, можно предположить, что на самых ранних стадиях должны появиться нейроны, срабатывающие при изменении освещенности в точке. Это может быть как рецептор, так и ассоциативный нейрон, связанный с одним или несколькими рецепторами. В общем виде можно охарактеризовать классификаторы первого уровня как регистрирующие суммы и разности возбуждений рецепторов в пространстве и времени.
Доказав свою полезность для животного, классификаторы первого уровня прочно входят в число его средств борьбы за существование. Тогда начинается следующая серия проб и ошибок: небольшое число классификаторов первого уровня (точнее, их выходных подсистем) связывается между собой в один пробный классификатор второго уровня, пока не получится полезное соединение. Затем оказывается полезным размножение этого соединения. Можно предположить, что на втором уровне иерархии — поскольку это касается органов зрения — появляются такие понятия, как граница между светом и тенью, средняя освещенность пятна, движение границы между светом и тенью и т. п. Таким же путем возникают и следующие уровни иерархии.
Набросанная нами схема наводит на мысль, что любая сложная система, возникшая в процессе эволюции по методу проб и ошибок, должна иметь иерархическую организацию. Действительно, не имея возможности перебрать все мыслимые соединения большого числа элементов, природа перебирает соединения из нескольких элементов, а найдя полезную комбинацию, размножает ее и использует как целое в качестве элемента, который может быть связан с небольшим числом других таких же элементов. Так и возникает иерархия. Это понятие играет огромную роль в кибернетике. Фактически всякая сложная система, как возникшая естественно, так и созданная человеком, может считаться организованной, только если она основана на некой иерархии или переплетении нескольких иерархий. Во всяком случае, до сих пор мы не знаем организованных систем, устроенных иначе.
До сих пор наши выводы были чисто умозрительны. Как они подтверждаются реальным строением нервной системы животных и что можно сказать о понятиях промежуточных уровней иерархии, реально складывающейся в процессе эволюции?
При сравнении нашей схемы с действительностью необходимо учитывать следующее.
Деление системы понятий на уровни не является столь безусловным, как мы молчаливо предполагали. Могут быть случаи, когда понятия k-го уровня непосредственно используются на k+2-м уровне, минуя k+1-й. На рис. 2.2 мы втиснули такую возможность в общую схему, введя классификаторы, связанные лишь с одним классификатором предыдущего уровня и повторяющие его состояния; они изображены перечеркнутыми квадратиками. В действительности, конечно, их нет, что затрудняет расчленение системы на уровни. Далее, иерархия классификаторов, изображенная на рис. 2.2, имеет четко выраженный пирамидальный характер: чем выше уровень, тем меньше классификаторов, а на верхнем уровне он всего один. Такая ситуация имеет место, когда система чрезвычайно «целенаправленна», т. е. служит для какой-то весьма узкой цели, для какого-то четко определенного способа классификации ситуаций. В примере, который мы приводили, это было распознавание «домиков». И мы видели, что уже неправильные трех- или четырехугольники для такой системы оказываются «бессмысленными»; они не вписываются в иерархию понятий. Чтобы быть более универсальной, система должна быть подобной не одной пирамиде, а многим пирамидам, вершины которых расположены приблизительно на одном уровне и образуют множество понятий (а точнее, множество систем понятий), в терминах которых происходит управление действиями животного и которые обычно обнаруживаются при исследовании его поведения. Об этих понятиях говорят, что они составляют основу определенного «образа» внешнего мира, который складывается в представлении животного (или человека). Состояние классификаторов этого уровня является непосредственной информацией для исполнительной части нервной сети (т. е. в конечном счете для эффекторов). Каждый из этих классификаторов опирается на определенную иерархию классификаторов — пирамиду, по которой движется информация так, как это было описано выше. Однако пирамиды могут перекрываться в своих средних частях (и заведомо перекрываются в своей нижней части — рецепторах). Общее число вершин пирамиды может быть теоретически как угодно велико, в частности, оно может быть много больше общего числа рецепторов. Это тот случай, когда одна и та же информация, доставляемая рецепторами, представляется множеством пирамид в множестве различных форм, рассчитанных на все случаи жизни.
Отметим еще одно обстоятельство, которое следует учитывать при поисках иерархии в реальной нервной сети. Если мы видим нейрон, соединенный синапсами с сотней рецепторов, то это еще не значит, что он фиксирует какое-то простое понятие первого уровня типа суммарного числа возбуждений рецепторов. Логическая функция, связывающая состояние нейрона с состоянием рецепторов, может быть весьма сложной и имеющей собственную иерархическую структуру.
Для исследования иерархии классификаторов и понятий, относящихся к зрительному восприятию у животных, чрезвычайно интересна работа четырех ученых из Массачусетского технологического института (Дж.Летвин и др.) «Что сообщает глаз лягушки мозгу лягушки»3. Лягушка была избрана авторами в качестве подопытного животного потому, что ее зрительный аппарат обладает некоторыми качествами простоты, которые делают его удобным для изучения. Прежде всего, сетчатка глаза лягушки однородна; она не имеет в отличие от глаза человека области с повышенной чувствительностью, на которую нужно проектировать наиболее важную часть изображения. Поэтому и взгляд лягушки неподвижен, она не следит взглядом за двигающимся предметом, как это делаем мы. С другой стороны, если лягушка качается, сидя на листе кувшинки, ее глаза совершают такие движения, которые компенсируют качание, так что изображение внешнего мира на сетчатке остается неподвижным. Информация от сетчатки передается по зрительному нерву к так называемому зрительному бугру мозга. Этим лягушка также отличается от человека в сторону простоты, так как у человека есть два канала передачи информации от сетчатки к мозгу.
Зрение играет большую роль в жизни лягушки: с его помощью она охотится и спасается от врагов. Исследование поведения лягушки показывает, что она отличает добычу от врага по размерам и состоянию движения. Очень интересно, что движение играет здесь решающую роль. Завидев маленький (размеров насекомого или червя) движущийся предмет, лягушка прыгает и схватывает его. Лягушку можно обмануть, раскачивая на ниточке маленький несъедобный предмет. Но на неподвижного червяка или насекомое лягушка не обращает ни малейшего внимания, и она может умереть с голоду среди обилия пищи, если эта пища неподвижна. Большие движущиеся предметы лягушка считает врагами и спасается от них бегством.
Сетчатка глаза лягушки, как и других позвоночных, имеет три слоя нервных клеток. Верхний (самый внешний) слой образуют светочувствительные рецепторы — палочки и колбочки. Затем идет слой ассоциативных нейронов нескольких типов. Одни из них (так называемые биполярные клетки) дают преимущественно вертикальные аксоны, по которым возбуждение передается в более глубокие слои. Другие (горизонтальные, или амакринные клетки) связывают нейроны, расположенные на одном уровне. Последний по глубине залегания — третий слой — образуют так называемые ганглиозные клетки. Их дендриты получают информацию от клеток второго слоя, а аксоны представляют собой длинные волокна, которые сплетаются в жгут — зрительный нерв, соединяющий сетчатку с мозгом. Эти аксоны ветвятся, входя в зрительный бугор мозга, и передают информацию дендритам мозговых нейронов.
Глаз лягушки имеет около миллиона рецепторов, около трех миллионов ассоциативных нейронов второго слоя и полмиллиона ганглиозных клеток. Такая структура сетчатки дает основание предположить, что анализ изображения начинается уже в глазу животного и изображение передается по зрительному нерву в терминах каких-то промежуточных понятий. Сетчатка как бы является вынесенной на периферию частью мозга. Это предположение подтверждается тем, что расположение на поверхности зрительного бугра точек входа нервных волокон (аксонов) совпадает с расположением соответствующих ганглиозных клеток на выходе сетчатки. И это несмотря на то, что на протяжении зрительного нерва волокна многократно переплетаются друг с другом и меняют свое положение на срезе нерва. Наконец, к тому же заключению приводят и данные эмбриологии о развитии сетчатки.
В описываемых опытах в зрительный нерв лягушки вводился тонкий платиновый электрод, что позволяло регистрировать возбуждение отдельных ганглиозных клеток. Лягушка помещалась в центр алюминиевой полусферы, имеющей (изнутри) матово-серый цвет. По внутренней поверхности полусферы могли перемещаться различные темные предметы — прямоугольники, диски и т. п., поддерживаемые с помощью магнита, расположенного с внешней стороны полусферы.
Результаты экспериментов мы можем суммировать следующим образом. Каждая ганглиозная клетка имеет определенное рецептивное поле, т. е. участок сетчатки (множество рецепторов), с которого она собирает информацию. Состояние рецепторов вне рецептивного поля никак не влияет на состояние ганглиозной клетки. Размеры рецептивных полей у клеток разного типа, если измерять их угловыми размерами соответствующей видимой области, варьируются от 2 до 15° в диаметре.
Ганглиозные клетки делятся на четыре типа в зависимости от того, какой процесс в своем рецептивном поле они регистрируют. Эти типы следующие:
Чрезвычайно интересно, как расположены окончания зрительных волокон в зрительном бугре мозга. Мы уже говорили, что в плане это расположение совпадает с расположением соответствующих ганглиозных клеток в сетчатке. Но, кроме того, оказывается, что окончания волокон каждого типа находятся в зрительном бугре на определенной глубине, так что в мозгу лягушки имеется четыре слоя нейронов, воспринимающих зрительную информацию, и каждый слой как бы получает оттиск сетчатки, но в определенном аспекте соответственно одному из четырех типов ганглиозных клеток. Эти слои и являются датчиками информации для высших отделов мозга.
Опыты, подобные описанным, довольно сложны, и по поводу их интерпретации иногда возникают споры. Детали описанной системы могут измениться или получить другое толкование. Тем не менее общий характер системы понятий первого уровня установлен, по-видимому, достаточно твердо. Мы видим переход от точечного описания к локальному, учитывающему непрерывную структуру изображения. Ганглиозные клетки служат распознавателями таких первичных понятий, как край, выпуклость, движение, отнесенных к определенной области видимого мира.
У человека понятия нижайшего уровня, относящиеся к зрительному восприятию, вероятно, мало отличаются от понятий лягушки. Во всяком случае, структура сетчатки у млекопитающих и человека такая же, как и у земноводных.
Некоторое представление о понятиях следующих уровней иерархии дает явление нарушения восприятия стабилизированного на сетчатке изображения. Это очень интересное явление. Оно состоит в следующем.
Когда человек смотрит на неподвижный объект, «фиксирует» его глазами, глазные яблоки не остаются абсолютно неподвижными, а созерцают небольшие непроизвольные движения. В результате изображение объекта на сетчатке находится в постоянном движении, складывающемся из медленного дрейфа и скачкообразных смещений, возвращающих изображение к точке максимальной чувствительности. Оно «топчется на месте» в окрестности этой точки.
Можно создать на сетчатке стабилизированное, не топчущееся на месте изображение. Для этого надо, очевидно, чтобы объект был жестко связан с глазным яблоком и двигался вместе с ним. Достигается это так (рис. 2.4). На глаз надевают контактную линзу, к которой прикреплен маленький стерженек. Стерженек несет миниатюрный оптический проектор4, в который можно вставлять диапозитивы размером в несколько миллиметров. Испытуемый видит изображение как удаленное в бесконечность. Так как проектор поворачивается вместе с глазом, изображение на сетчатке неподвижно.
При предъявлении испытуемому стабилизированного изображения он в течение первых нескольких секунд воспринимает его как при нормальном зрении, но затем начинаются нарушения. Изображение то исчезает, заменяясь серым или черным фоном, то появляется частями или целиком.
Рис. 2.4. Устройство для стабилизации изображения на сетчатке
Уже сам факт неправильного восприятия стабилизированного изображения весьма примечателен. С логической точки зрения нет никакой необходимости, чтобы изображение неподвижного объекта гуляло по сетчатке. Количество информации от этого не увеличивается, а обрабатывать ее становится труднее. И действительно, когда аналогичные задачи встают в области техники, например, при передаче изображения по телевизору или при вводе информации с экрана в вычислительную машину, то предпринимаются специальные усилия, чтобы стабилизировать изображение. А человеческий глаз не только приспособлен к прыгающему изображению, но и решительно отказывается принимать изображение, если оно неподвижно. Это свидетельствует о том, что понятия, связанные с движением, подобные, вероятно, тем, которые мы наблюдали у лягушки, глубоко укоренились где-то в нижних этажах иерархии, и если соответствующие классификаторы вывести из игры, то правильная обработка информации нарушится. С точки зрения конструктора сложного аппарата, подобного глазу (плюс обработка информации), такое устройство является странным. Конструктор, наверное, все нижние этажи занял бы статическими понятиями, а описание движения объектов уже проводил бы в терминах более высокого уровня. Но иерархия зрительных понятий возникла в процессе эволюции. Для наших далеких лягушкоподобных предков были чрезвычайно важны понятия, связанные с движением, и им некогда было ждать, пока у них разовьются сложные статические понятия. Поэтому примитивные динамические понятия возникли на самых ранних этапах развития нервной системы, а так как природа использует найденные ею блоки на следующих этапах строительства, эти понятия прочно закрепились в самом низу иерархии понятий. Чтобы они могли работать, глазному яблоку приходится совершать «броуновские» движения.
Рис. 2.5. Фрагментация стабилизированного изображения
Еще интереснее характер распада изображения на части (фрагментация). Простые фигуры, например, одиночный отрезок, исчезают и восстанавливаются целиком. Более сложные фигуры иногда также исчезают целиком, а иногда распадаются на части, которые исчезают и появляются независимо друг от друга (рис. 2.5). Фрагментация происходит не хаотично и не независимо от вида изображения, как бывает, например, когда рисунок на доске стирают тряпкой, а в соответствии с «истинной» структурой изображения. Слово «истинная» мы берем в кавычки потому, что на самом деле, конечно, фрагментация происходит в соответствии со структурой восприятия изображения системой глаз — мозг. Мы не знаем в точности, какова механика нарушения восприятия при стабилизации, мы знаем только сам факт, что стабилизация выводит из строя какой-то компонент системы восприятия. Но и отсюда можно сделать некоторые выводы. Представьте себе, что в архитектурном сооружении внезапно исчезли, растворившись в воздухе, несколько важных элементов конструкции. Здание развалится, но, вероятно, на части очень различных размеров. Здесь вы видите отдельные кирпичи и куски стекла, там — часть стены и крыши, а там сохранился целый угол дома. Примерно такое зрелище и являет собой восприятие стабилизированного изображения. Оно дает возможность представить характер понятий высшего уровня (или высших уровней), но не оценить их взаимные связи и зависимости. Надо отметить, что в формировании понятий высшего уровня у человека большую роль играет его личный жизненный опыт — обучение, если говорить языком кибернетики. (Это будет следующим этапом эволюции нервной системы, так что здесь мы несколько забегаем вперед. Но для исследования иерархии понятий не имеет большого значения, получена она по наследству или благоприобретена своим трудом.)
Приведем несколько выдержек из упомянутой выше работы.
Контурный человеческий профиль всегда исчезает и восстанавливается отдельными дискретно организованными элементами. Передняя часть лица, задняя сторона головы, комплекс линий вокруг глаз или вокруг уха исчезают и появляются вновь как целые элементы, в отдельности друг от друга или в различных комбинациях. В противоположность этому рисунок, состоящий из многих волнистых линий, расположенных неупорядоченно, при первом же предъявлении воспринимается как чрезвычайно активный объект. Отдельные завитки быстро исчезают и восстанавливаются... Эти изменения происходят так быстро, что испытуемые не могут дать точного отчета о них. После длительного рассматривания небольшие группы завитков начинают исчезать и восстанавливаться как единые элементы. Эти заново оформленные комбинации сохраняются в течение более долгих промежутков времени...
Важность линейной организации как фактора группировки подчеркивается фрагментацией стабилизированного изображения, состоящего из ряда квадратиков. Видимыми обычно остаются полный горизонтальный, вертикальный или диагональный ряды, которые затем также исчезают, и остается лишь отдельный квадратик во всем поле зрения. Иногда исчезают все одноименные стороны квадратиков... Если предъявляются беспорядочно разбросанные точки, то могут исчезнуть отдельные группы точек, а оставшиеся располагаются приблизительно вдоль одной линии... При рассматривании рисунка, состоящего из прямых линий, эти последние воспринимаются как независимые друг от друга, причем рисунок разбивается на части в местах пересечения. Линии исчезают и появляются вновь как единое целое либо поодиночке, либо вместе с другими; вместе часто появляются параллельные линии. При замене рисунка, состоящего из линий, затушеванной фигурой вместо линий независимыми элементами становятся углы. Исчезновение стабилизированного изображения начинается с центра, а резко очерченные углы исчезают по очереди. При восстановлении изображения оно появляется полностью или частично с резко очерченными углами.
Мы описали первую половину действия сложного рефлекса, которая состоит в анализе ситуации с помощью иерархии классификаторов. Бывают случаи, когда вторая — исполнительная — половина рефлекса чрезвычайно проста и сводится к возбуждению какой-то локальной группы эффекторов, например, эффекторов, активизирующих деятельность определенной железы. Именно в таких условиях поставлено большинство опытов И.П.Павлова, которые сыграли важную роль в исследовании высшей нервной деятельности животных и привели к созданию им широко известного учения о безусловных и условных рефлексах. Однако элементарные наблюдения над поведением животных в естественных условиях показывают, что оно не может быть сведено к совокупности рефлексов, которые никак не связаны между собой, а связаны только с состоянием внешней среды. Всякое сколь-нибудь сложное действие состоит из последовательности более простых действий, объединенных общей целью. Часто бывает, что отдельные компоненты в этой совокупности действий не только бесполезны, но и вредны животному, если они не сопровождаются другими компонентами. Например, чтобы прыгнуть, надо предварительно присесть, чтобы схватить добычу удобнее, надо на какое-то время ее выпустить. Две фазы действия — подготовительная и исполнительная, которые мы видим в этих примерах, — не могут явиться следствием независимых рефлексов, так как первое действие само по себе бессмысленно и, значит, такого рефлекса выработаться не могло.
Рис. 2.6. Схема регулирования
Понятие о рефлексе при описании поведения должно быть дополнено понятием о цели и о регулировании. Схема регулирования изображена на рис. 2.6. Действие, которое предпринимает система, зависит не только от ситуации самой по себе, но также и от цели, т. е. от той ситуации, которую система стремится достигнуть. Действие системы определяется в результате сравнения ситуации и цели и направлено к устранению несоответствия между ситуацией и целью. Через блок сравнения ситуация определяет действие. Через изменение среды действие оказывает обратное влияние на ситуацию. Эта петля обратной связи является характерной чертой схемы регулирования, отличающей ее от схемы рефлекса, где ситуация просто вызывает действие.
Как могла в процессе эволюции возникнуть система, устроенная по схеме регулирования? Мы видим, что возникновение иерархически устроенных классификаторов может быть объяснено как результат совместного действия двух основных факторов эволюции: редупликации биологических структур и нахождения полезных связей по методу проб и ошибок. Не приводит ли действие этих факторов и к появлению схемы регулирования?
Рис. 2.7. Редупликация рецепторов
Не имея возможности опереться на данные о том реальном эволюционном процессе, который миллионы лет назад породил сложную нервную систему, мы вынуждены удовлетворяться чисто гипотетическим комбинаторным построением, показывающим теоретическую возможность возникновения схемы регулирования. Будем систематически исследовать все возможности, к которым приводят редупликация и отбор. Естественно предположить, что в процессе редупликации сохраняются как связи внутри удвояемой подсистемы, так и связи ее с теми частями, которые не редуплицируются. И еще мы предположим, что между только возникшими подсистемами существует вследствие их близкого расположения связь, которую мы будем изображать штриховой линией и которая может либо укрепиться, либо исчезнуть. Начнем с самого начала, т. е. с того случая, когда мы видим всего одну нервную клетку, являющуюся одновременно и рецептором, и эффектором (рис. 2.7,а). Здесь всего одна возможность редупликации, которая приводит к появлению двух клеток (рис. 2.7,б). Если одна из них оказывается ближе к поверхности, а другая — к мышечным клеткам, то полезно разделение труда между ними. Так возникает схема рецептор — эффектор (рис. 2.7,в). Здесь уже две возможности редупликации. Удвоение рецептора дает схему г на рис. 2.7, которая после исчезновения штриховой связи преобразуется в схему д. Аналогичный процесс порождает схемы е, ж и т. д. Таким образом происходит разрастание нулевого уровня иерархии (рецепторов), о котором говорилось выше.
Рис. 2.8. Редупликация эффекторов
На рис. 2.8 показаны схемы, которые возникают из схемы 2.7,в путем редупликации эффектора. В схеме б возбуждение одного рецептора должно по двум каналам передаваться двум эффекторам. Однако известно, что электрическое сопротивление синапсов резко падает после того, как по ним первый раз проходит ток. Поэтому если возбуждение направится по одному каналу, то этот канал связи будет закреплен, а второй окажется шунтированным и может «отсохнуть» (схема в). Затем возбуждение может продолжить дорогу через штриховую связь (схема г), что знаменует зарождение первого уровня классификаторов.
На рис. 2.9 представлены возможные варианты развития трехнейронной схемы 2.8,г. Три группы схем соответствуют редупликации различных подсистем исходной системы. Редуплицируемая подсистема обведена кружком. Первая группа (a, б, в) объясняет разрастание нулевого уровня, вторая группа (г, д, е) — первого уровня иерархии классификаторов. В третьей группе (ж, з, и, к) мы видим схемы, возникающие при редупликации одного классификатора первого уровня без связанного с ним рецептора. Переход от схемы з к схеме и объясняется тем «отсыханием» шунтированного канала, которое мы описали выше. Схема к, появившаяся в конечном счете, существенно отличается от всех остальных схем, представлявших иерархии классификаторов. В этой схеме один из классификаторов «повисает в воздухе» — он не получает информации из внешнего мира. Может ли такая схема быть полезной животному? Да: ведь это и есть схема регулирования!
Рис. 2.9. Варианты развития трехнейронной схемы
Мы можем предположить такое, например, воплощение схемы 2.9,к. Рассмотрим некое гипотетическое животное, живущее в морской воде. Пусть R — рецептор, воспринимающий температуру окружающей среды. Вместе с ним регистрирует — путем изменения частоты импульсов возбуждения — температуру воды и классификатор A. Пусть большее или меньшее возбуждение эффектора E вызывает растяжение или сжатие оболочки животного, вследствие чего его объем изменяется, и оно либо поднимается к поверхности моря, либо опускается вглубь. И пусть для нашего животного полезнее всего какая-то определенная температура, скажем 16℃. Тогда нейрон Z (фиксатор цели) должен сохранять определенную частоту импульсов, равную той частоте, которую имеет нейрон A при температуре 16℃. Эффектор Е должен регистрировать разность возбуждений нейронов A и Z и соответственно с ее знаком поднимать животное к поверхности, где вода теплее, или погружать в более прохладные нижние слои воды. Такое приспособление премного способствовало бы благоденствию измышленного нами животного.
Редупликация различных подсистем нервной сети может породить множество различных групп классификаторов, «повисающих в воздухе». Среди них могут появиться дубликаты целых этажей иерархии, состояния которых в точности соответствуют состоянию тех «осведомленных» классификаторов, которые получают информацию от рецепторов. Соответствуют, но не совпадают. Это мы видим на примере нейронов A и Z на рис. 2.9,к. В сложных системах неосведомленные дубликаты осведомленных классификаторов могут хранить большое количество информации. Состояния этих дубликатов мы будем называть представлениями, отдавая себе ясный отчет, что тем самым мы даем определенную кибернетическую интерпретацию этому психологическому понятию. Очевидно, имеет место тесная связь между представлениями и ситуациями, которые ведь суть не что иное, как состояния аналогичных классификаторов, но получающих информацию от рецепторов. Цель представляет собой частный случай представления, а точнее тот случай, когда сравнение постоянного представления и меняющейся ситуации используется для выработки действия, сближающего их друг с другом. Описанное выше гипотетическое животное обожает температуру 16℃, и «светлый образ» этой блаженной ситуации, которая есть определенная частота импульсов нейрона A, живет в ее памяти в виде точно такой же частоты импульсов нейрона Z.
Это очень примитивное представление. Чем выше организована «осведомленная» часть нервной системы, тем сложнее и ее дубликаты (мы будем их называть фиксаторами представлений) и тем разнообразнее представления. Так как классификаторы могут принадлежать к разным уровням иерархии и ситуация может быть выражена в разных системах понятий, представления также могут различаться своим «понятийным языком», ибо они могут быть состояниями фиксаторов разных уровней. Далее, степень устойчивости состояний фиксаторов представлений также может быть весьма различной. Поэтому представления сильно отличаются по своей конкретности и стабильности. Они могут быть точными и конкретными, почти чувственно воспринимаемыми. Крайним случаем здесь является галлюцинация, которая субъективно воспринимается как реальность и на которую организм реагирует так же, как на соответствующую ситуацию. С другой стороны, представления могут быть очень приблизительными как из-за своей неустойчивости, так и из-за своей абстрактности. Последний случай часто встречается в художественном и научном творчестве, когда представления выступают как цель деятельности. Человек смутно чувствует, что ему надо, и пытается воплотить это в твердой предметной форме. У него долго ничего не получается, потому что его представления не обладают необходимой конкретностью. Однако в один прекрасный момент (и это действительно прекрасный момент!) он вдруг добивается своей цели и ясно осознает, что он сделал именно то, что хотел.
Путем редупликации может быть получено, в принципе, сколько угодно фиксаторов представлений. Но тут возникает вопрос: а сколько их нужно животному? Сколько нужно дубликатов «осведомленных» классификаторов? Один? Два? Десять?
Из общих соображений следует, что дубликатов нужно много. Ведь фиксаторы представления служат для организации опыта и поведения во времени. Фиксатор цели хранит ситуацию, которая должна, по идее, осуществиться в будущем. Другие фиксаторы могут хранить ситуации, которые реально были в прошлом. Временная организация опыта необходима животному, стремящемуся приспособиться к среде, в которой оно живет, ибо эта среда обнаруживает некоторые закономерности, т. е. корреляции между прошлыми и будущими ситуациями. Можно предсказать, что после какого-то начального увеличения числа рецепторов дальнейшее совершенствование нервной системы потребует создания фиксаторов представлений, причем создания их в большом числе. Ибо нет смысла продолжать наращивать число рецепторов и классификаторов и улучшать тем самым «мгновенные снимки» окружающей среды, если система не умеет обнаруживать корреляции между ними. Но чтобы обнаружить корреляции между «мгновенными снимками», надо их где-то хранить. Так и возникают фиксаторы представлений, иначе говоря память. Хранение цели в процессе регулирования — это простейший случай использования памяти.
В схеме регулирования на рис. 2.6 цель изображена как нечто единое, целое. Однако мы хорошо знаем, что бывают сложные цели, в процессе достижения которых система ставит пред собой промежуточные, «частичные», цели. Мы уже приводили примеры двухфазных движений: чтобы вспрыгнуть на стул, кошка сначала приседает, а потом подпрыгивает. В более сложных ситуациях цели образуют иерархию, состоящую из многих уровней. Предположим, вы ставите перед собой цель приехать из дома на работу. Это ваша «высшая» цель в данный момент. Припишем ей индекс (номер уровня) нуль. Чтобы приехать на работу, вам нужно выйти из дома, пройти к остановке автобуса, доехать до нужной остановки и т. д. Это цели с индексом минус единица. Чтобы выйти из дома, надо выйти из квартиры, спуститься в лифте и выйти из подъезда. Это цели с индексом минус два. Чтобы спуститься в лифте, надо открыть дверь, войти в лифт и т. д. — индекс минус три. Чтобы открыть дверь лифта, надо протянуть руку к дверной ручке, нажать на нее и потянуть к себе — индекс минус четыре. Эти цели можно уже, пожалуй, считать элементарными.
Цель вместе с указанием способа ее достижения, т. е. разложения на подчиненные цели, называют планом действия. Наш пример есть фактически описание плана приезда на работу. В цели самой по себе, которая в данном случае есть представление «я — на рабочем месте», никакой иерархической структуры нет. Основной логической единицей, образующей иерархию, является план, а цели образуют иерархию лишь постольку, поскольку они являются элементами плана.
Американские психологи Дж.Миллер, Е.Галантер и К.Прибрам в своей книге «Планы и структура поведения» принимают понятие плана в качестве основы описания поведения человека и животных. Они показывают особенность и плодотворность такого подхода. В отличие от классической рефлекторной дуги (без обратной связи) логическая единица описания поведения, используемая этими авторами, содержит петлю обратной связи (рис. 2.10). Эту единицу они называют схемой T-O-T-E, по начальным буквам английских слов test-operate-test-exit (проверка — операция — проверка — выход). Проверка здесь означает проверку соответствия ситуации и цели. В случае несоответствия производится операция, в случае соответствия план считается выполненным, и система идет на «выход». В качестве примера ни рис. 2.11 показан план забивания гвоздя в доску, представленный в виде единицы T-O-T-E.
Рис. 2.10. ЕдиницаT-O-T-E (test-operate-test-exit)
Рис. 2.11. Забивание гвоздя
Схема T-O-T-E на рис. 2.10 изображает то же самое явление регулирования, которое было изображено на рис. 2.6. Отличие между ними в способе изображения. Схема на рис. 2.6 — структурная, на рис. 2.10 — функциональная. Эти понятия надо пояснить. Заодно мы уточним понятие управления.
На структурной схеме кибернетической системы указывается, из каких подсистем состоит данная система. Часто указывается также, как направлены потоки информации между подсистемами. Тогда структурная схема превращается в граф. В математике называют графом систему точек (вершин графа), некоторые из которых соединены линиями (дугами). Граф называется ориентированным, если на каждой дуге указано определенное направление. Структурная схема с указанием потоков информации есть ориентированный граф, вершины которого изображают подсистемы, а дуги — потоки информации.
Такое описание кибернетической системы не является единственно возможным. Часто нас интересует не столько структура системы, сколько ее функционирование, действие. Еще чаще мы просто ничего не можем сказать толком о структуре, но кое-что можем сказать о функционировании. В таких случаях можно построить функциональную схему. Это тоже ориентированный граф, но вершины здесь изображают различные множества состояний системы, а дуги — возможные переходы между состояниями. Дуга соединяет две вершины в направлении от первой ко второй в том случае, если хотя бы из одного состояния, относящегося к первой вершине, возможен переход в какое-либо состояние, относящееся ко второй вершине. Множества состояний мы будем называть обобщенными состояниями. Следовательно, дуга на схеме указывает возможность перехода из одного обобщенного состояния в другое. Если структурная схема отражает главным образом пространственный аспект, то функциональная — главным образом временной. Формально в соответствии с данным выше определением функциональная схема вообще никак не отражает пространственного аспекта — разделения системы на подсистемы. Однако, как правило, разделение на подсистемы находит отражение в способе определения обобщенных состояний, т. е. разделения множества всех состояний системы на подмножества, «приписанные» к различным вершинам графа. Разберем это на примере системы, структурная схема которой представлена на рис. 2.12. Это схема управления.
Рис. 2.12. Структурная схема управления
Одна из подсистем, называемая управляющим устройством, получает информацию от «рабочих» подсистем A1, A2, A3, …, перерабатывает ее и посылает подсистемам A1, A2, A3, … приказы (управляющую информацию), вследствие чего эти подсистемы меняют свое состояние. Надо отметить, что, строго говоря, любая информация меняет состояние системы, которая ее получает. Информацию называют управляющей в том случае, когда она меняет некоторые выделенные параметры системы, описываемые как «основные», «внешние», «наблюдаемые» и т. п. Часто бывает, что управляющее устройство по своей информационной емкости и пропускной способности невелико и служит лишь для переключения информационных потоков, а реальная обработка данных и выработка приказов производятся одной из подсистем A1, A2, A3, … или в соответствии с хранящейся в ней информацией. Тогда говорят, что управление переходит в эту подсистему. Так, в частности, обстоит дело в вычислительной машине, где A1, A2, A3, … — это ячейки оперативной памяти. Одни из ячеек содержат пассивную информацию (например, числа), другие — приказы (команды). Когда управление находится в ячейке, содержащей команду, управляющее устройство выполняет эту команду. Затем оно передает управление в другую ячейку и т. д.
Рис. 2.13. Функциональная схема передачи управления
Для систем с передачей управления функциональную схему строят следующим образом. Каждой вершине графа сопоставляют одну из подсистем A, и множество всех состояний системы, при которых управление находится в данной подсистеме. Тогда дуги (стрелки) означают передачу управления от одной подсистемы к другой (рис. 2.13). На такой схеме даже при полной детерминированности каждого следующего состояния предыдущим могут быть разветвления благодаря тому, что каждая вершина соответствует обширному множеству состояний и передача управления может зависеть от состояния управляющего устройства или подсистемы, в которой находится управление. Функциональные схемы часто рисуют обобщенно, пропуская какие-то несущественные детали и шаги. Тогда может оказаться, что то, по какому пути в разветвлении перейдет управление, зависит от состояния нескольких различных подсистем. Условие, при котором осуществляется данный переход, обычно выписывают рядом со стрелкой. Схему на рис. 2.10 можно понимать в таком именно смысле. Тогда в ней подразумевается, что система имеет две подсистемы: блок проверки и блок выполнения операции, и управление переходит из одной в другую в соответствии со стрелками. У системы могут быть и другие подсистемы (в данном случае — среда), но они никогда не получают управления и поэтому не изображаются на схеме (точнее, те моменты, когда среда меняет состояние системы или меняет свое состояние под действием системы, включаются в процесс действия одного из блоков).
Можно отойти еще дальше от структурной схемы. Передача управления в некоторую подсистему означает ее активацию, т. е. выполнение того действия, для которого подсистема предназначена. Но мы можем и не знать, какая подсистема отвечает за данное наблюдаемое действие. Тогда вершины графа мы будем отождествлять с действиями как таковыми, а другие будут означать переход от одного действия к другому. Понятие «действие как таковое», если определять его строго, надо отождествлять с понятием «обобщенное состояние» («множество состояний»), и это возвращает нас к первому — самому абстрактному — определению функциональной схемы. В самом деле, когда мы говорим, что собака «бежит», «лает» или «вертит хвостом», то под каждое из этих определений подходит множество конкретных состояний собаки. Правда, здесь бросается в глаза одна несообразность: «состояние» есть нечто статическое, в то время как «действие» — нечто явно динамическое, скорее изменение состояния, чем само состояние. Если на мгновенной фотографии хвост собаки не выходит из плоскости симметрии, то еще неизвестно, вертит она им или он застыл в неподвижности. Это противоречие снимается тем замечанием, что в понятие состояния входят не только величины типа «положение», но и величины типа «скорость», «ускорение» и т. д. В частности, указание состояния собаки включает указание напряженности мышц ее хвоста и возбужденности всех нейронов, регулирующих состояние мышц.
Итак, формально, действие на функциональной схеме — это множество состояний. Но сказать, что данное действие есть какое-то множество, — это почти ничего не сказать. Надо уметь определить это множество. И если мы не знаем структуры системы и способа ее функционирования, то сделать это строго практически невозможно. Остается довольствоваться неполным, феноменологическим определением, основанным на внешне проявляемых следствиях внутренних состояний. Вот такими-то функциональными схемами с более или менее точно определенными действиями в вершинах графа и описывается поведение сложных, неизвестно как устроенных систем, подобных животным или человеку. Схемы на рис. 2.10 и 2.11 являются, конечно, именно такими схемами. Феноменологический подход к деятельности мозга осуществляется двумя науками: психологией и бихевиористикой (изучение поведения). Первая основана на наблюдениях субъективных (изнутри), вторая — объективных (извне). Они тесно связаны между собой, и часто их объединяют под общим названием психологии.
Рис. 2.14. Иерархический план забивания гвоздя
Так как операционный компонент единицы T-O-T-E может быть составным и требовать выполнения нескольких подчиненных планов, единицы T-O-T-E могут иметь иерархическую структуру. Миллер, Галантер и Прибрам приводят следующий пример. Если удар молотком по гвоздю представить как двухфазное действие, слагающееся из подъема и опускания молотка, то функциональная схема на рис. 2.11, изображающая план забивания гвоздя, перейдет в схему на рис. 2.14. Эта схема в свою очередь может входить в качестве элемента в операционный компонент схемы T-O-T-E более высокого уровня.
Мы видели, что элементарной функциональной схеме на рис. 2.10 соответствует элементарная структурная схема на рис. 2.6. Что происходит со структурной схемой, когда планы образуют иерархию? Точнее, наоборот: какие структурные схемы могут обеспечить выполнение иерархически построенного плана?
Можно предположить различные варианты таких схем. Например, можно представить, что блок сравнения всегда один и всегда пользуется одной и той же подсистемой, хранящей цель, но состояние этой последней (т. е. цели) меняется под действием других частей системы, обеспечивая вытекающую из плана смену целей. Напротив, можно представить, что пара — блок сравнения и цель — размножается многократно, и при выполнении иерархического плана управление переходит от одной пары к другой. Можно предположить комбинацию этих двух способов. И вообще можно придумать множество различно устроенных кибернетических устройств, осуществляющих одну и ту же иерархическую функциональную схему. Ясно только, что они будут иметь иерархическую структуру и что устройства такого типа могли возникнуть эволюционно путем редупликации подсистем и отбора полезных вариантов.
Каковы же структурные схемы, реально возникшие в процессе эволюции? Увы, пока мы этого достоверно не знаем. Поэтому-то нам и пришлось перейти к функциональным схемам. И это только первое из ограничений, которые мы будем вынуждены накладывать на стремление к точному кибернетическому описанию высшей нервной деятельности. Мы очень мало знаем сейчас о кибернетической структуре и работе мозга высших животных и, тем более, человека. Собственно говоря, мы почти ничего не знаем. Есть только отдельные факты и предположения. Поэтому в дальнейшем анализе нам придется опираться главным образом на феноменологию — данные бихевиористики и психологии, где дело обстоит несколько лучше. Что касается кибернетического аспекта, то мы перейдем на уровень чрезвычайно общих понятий. На этом уровне мы обнаружим определенные закономерности, столь общие, что они объясняют этапы развития как нервной системы, так и человеческой культуры и, в частности, науки. Тот относительно конкретный анализ первых этапов эволюции нервной системы, который позволило нам сделать нынешнее состояние знаний, послужит нам разбегом для последующего более абстрактного анализа. Конечно, нашей истинной целью является именно этот абстрактный анализ, но было бы приятнее, если бы, зная кибернетику мозга, мы могли совершить переход от конкретного к абстрактному более плавно и обоснованно.
Подводя итог описанию четвертого этапа развития, мы можем определить сложный рефлекс как такой процесс, когда возбуждение рецепторов, вызванное взаимодействием с внешней средой, передается по нервной сети, преобразуясь ею, и активизирует определенный план действий, который тут же начинает выполняться. В этой схеме поведения все обратные связи между организмом и средой осуществляются в процессе регулирования действий планом, а в целом взаимодействие между средой и организмом описывается классической формулой стимул — реакция. Только теперь реакция — это активизация того или иного плана.
1 Позже мы дадим несколько более общее определение понятия, а множество ситуаций назовем аристотелевским понятием. Сейчас мы опускаем прилагательное «аристотелевский» для краткости.
2
Согласно терминологии, принятой многими логиками, противопоставление
абстрактных понятий конкретным — это совсем не то же самое, что
противопоставление общих понятий единичным. В учебнике логики (Логика. М.:
Госполитиздат, 1956) читаем: «Понятие, посредством признаков которого предмет
мыслится как таковой и как данный предмет, называется конкретным. Понятие,
посредством признаков которого мыслится не данный предмет как таковой, а
некоторое свойство предмета или отношение предметов, называется абстрактным».
Из этого определения, которое трудно назвать шедевром ясности мысли, можно
все-таки заключить, что общие понятия, которые образуются не путем перечисления
единичных объектов, входящих в него, а путем указания ряда признаков,
объявляемых существенными, и отвлечения от остальных (несущественных)
признаков, можно также считать абстрактными. Мы будем рассматривать только
такие общие понятия и будем называть их также абстрактными. Например,
абстрактный треугольник — это любой треугольник, независимо от величины его
сторон и углов и его положения на экране, следовательно, это абстрактное
понятие. Такое употребление термина «абстрактный» имеет место в обиходе, а
также в математике. В то же время, согласно учебнику логики, «треугольник»,
«квадрат» и т. п. суть конкретные общие понятия, а вот «треугольность» и
«квадратность», которые им свойственны, это понятия абстрактные. По существу,
здесь в ранг логического возводится чисто грамматическое различие, ибо даже с
точки зрения сторонника последнего варианта терминологии обладание абстрактным
понятием равнозначно обладанию соответствующим общим понятием.
3 Pyc. пер. см. в сб.: Электроника и кибернетика в биологии и медицине. М.: Изд-во Иностр. Лит., 1963.
4 См.:Причард Р. Изображение на сетчатке и зрительное восприятие // Проблемы бионики. М.: Мир, 1965. Пер. с англ.: Pritchard R. Stabilized image on the retine // Sci. Amer. 1961. Vol. 204, N 6. P. 72-78.
Как уже было сказано, описание следующих этапов развития нервной системы мы будем проводить в плане более феноменологическом. Для этого нам надо подытожить результаты исследования механизма эволюции на ранних этапах в терминах общих кибернетических понятий. Начав думать в этом направлении, мы легко обнаружим одну общую черту в переходах от низшего этапа к высшему. А именно все эти переходы совершаются следующим образом. На каждом этапе биологическая система имеет подсистему, которая может быть названа высшим управляющим устройством и которая имеет наиболее позднее происхождение и наиболее высокую организацию. Переход на следующий этап происходит путем размножения этих подсистем (путем многократной редупликации) и интеграции их, т. е. объединения в одно целое с образованием (по методу проб и ошибок) системы управления, во главе которой стоит новая подсистема, которая теперь является высшим управляющим устройством нового этапа эволюции. Систему, состоящую из управляющей подсистемы Х и управляемых ею многих однородных подсистем A1, A2, A3,… мы назовем метасистемой по отношению к системам A1, A2, A3,… Переход с этапа на этап мы назовем, следовательно, метасистемным переходом (рис. 3.1).
Рис. 3.1. Метасистемный переход
Это понятие будет играть решающую роль в последующем изложении. Метасистемный переход создает высший уровень организации — метауровень по отношению к уровню организации интегрируемых подсистем. С точки зрения функциональной метасистемный переход состоит в том, что деятельность, являющаяся управляющей на низшем этапе, становится управляемой на высшем этапе и появляется качественно новый (высший) вид деятельности, заключающийся в управлении деятельностью. Редупликация и отбор приводят к созданию необходимых структур. Первый метасистемный переход, который мы усматриваем в истории животных, это возникновение движения. Интегрируемыми подсистемами являются части клетки, обеспечивающие обмен веществ и размножение. Положение этих частей в пространстве до поры до времени случайно, неуправляемо. Но вот появляются органы, соединяющие остальные части клетки и приводящие их в движение: клеточная мембрана, реснички, жгутики. Происходит метасистемный переход, который можно определить формулой
Управление положением = Движение.
На этом этапе движение неуправляемо, никак не коррелировано с движением внешней среды. Сделать его управляемым — следующая задача природы. Управлять движением — значит сделать его определенной функцией состояния среды. Так возникает раздражимость — изменение состояния каких-то участков клетки под действием внешних факторов и распространение этого изменения на другие участки, в частности обеспечивающие движение. Итак, формула метасистемного перехода от второго к третьему этапу такова:
Управление движением = Раздражимость.
Интеграция клетки с образованием многоклеточного организма также является переходом от системы к метасистеме. Однако этот переход касается исключительно структурного аспекта и неописуем в функциональных терминах. С точки зрения функциональной неважно в конце концов, происходят ли размножение и интеграция в какой-то части организма или организмы интегрируются целиком. Это, так сказать, вопрос технический. Раздражимость появляется уже у одноклеточных организмов, но полностью проявляет свои возможности после интеграции клеток.
Здесь необходимо указать на одну важную черту метасистемного перехода. Когда интегрируемые подсистемы объединяются в метасистему, то вследствие разделения функций между ними происходит их специализация, т. е. приспособление к определенной частной деятельности и утрата способности к другим видам деятельности. Специализация особенно отчетливо проявляется при интеграции целых организмов. Каждая интегрируемая подсистема содержит в этом случае много «лишнего» того, что было необходимо ей для самостоятельной жизни, но не нужно в сообществе, ибо соответствующие функции выполняются другими подсистемами. Так, в многоклеточном организме появляются специализированные мышечные и нервные клетки.
Вообще надо отметить, что интеграция подсистем отнюдь не является концом их эволюционирования. Нельзя представить дело таким образом, что системы A1, A2, A3, … размножаются в больших количествах, после чего «над ними» вдруг возникает управляющее устройство X. Напротив, зачатки системы управления образуются, когда число подсистем Ai невелико — всего несколько штук. Только при таком условии, как мы видели выше, может работать метод проб и ошибок. Уже после того, как наметилась управляющая подсистема X, происходит массовая редупликация подсистем Ai, в процессе которой совершенствуются как Ai, так и X. Возникновение структуры управления подсистемами Ai, не завершает, а вызывает бурный рост числа подсистем Ai, и предшествует ему, ибо при этом размножение Ai, становится нужным для организма. Носитель определенного уровня организации разрастается лишь после того, как начинает образовываться новый, более высокий уровень. Эту черту можно назвать законом разрастания предпоследнего уровня. Поэтому и при феноменологическом функциональном описании метасистемный переход проявляется не тотчас же вслед за закладкой нового уровня, а несколько позже, когда предпоследний уровень «войдет в силу». Метасистемный переход всегда затрагивает два уровня организации.
Продолжим наш обзор этапов эволюции. Применим принцип метасистемного перехода к уровню раздражимости. На этом уровне возбуждение каких-то участков одноклеточного организма или специализированной нервной клетки в многоклеточном организме происходит непосредственно внешней средой и это возбуждение непосредственно (один к одному) вызывает возбуждение мышечной активности. Что может означать управление раздражимостью? Очевидно, создание нервной сети, элементы которой, в частности эффекторы, возбуждаются не прямо внешней средой, а через посредство сложной управляющей системы. Это тот этап эволюции, который мы связали с понятием сложного рефлекса. Особенно отчетливо виден факт управления раздражимостью на этом этапе в том, что при наличии цели возбуждение эффекторов зависит не только от состояния внешней среды, но и от этой цели, т. е. от состояния каких-то внутренних нейронов сети. Итак, формула этого метасистемного перехода (от третьего к четвертому этапу):
Управление раздражимостью = Сложный рефлекс.
Что же дальше?
Сколь бы ни была совершенна нервная сеть, построенная по принципу сложного рефлекса, она обладает одним существенным недостатком: неизменностью функционирования во времени. Животное с такой нервной системой ничего не может извлечь из своего опыта, его реакции всегда будут одинаковыми, его действия всегда будут совершаться по одним и тем же планам. Чтобы животное могло обучаться, его нервная система должна содержать какие-то вариабельные компоненты, которые обеспечивали бы изменение связей между ситуациями и действиями. Эти компоненты, следовательно, будут осуществлять управление рефлексами. Хорошо известно, что животные обладают способностью к обучению и выработке новых рефлексов. По терминологии, введенной Павловым, врожденный рефлекс, заложенный в нервную систему природой, называется безусловным рефлексом, а рефлекс, выработанный под действием внешней среды, — условным рефлексом. Когда мы говорим о сложном рефлексе, мы имеем в виду, конечно, безусловный сложный рефлекс. Наличие компонентов, управляющих сложными рефлексами, проявляется в опытах по обучению животных как способность к образованию условных рефлексов.
Однако мы не можем отождествить понятие условного рефлекса с понятием управления рефлексом. Последнее понятие шире. Ведь наше понятие сложного рефлекса, взятое в контексте описания общих принципов эволюции нервной системы, означает по существу любую фиксированную связь между состояниями классификаторов, фиксаторов представлений и эффекторов. Следовательно, управление рефлексами надо понимать как создание под действием индивидуального опыта любых переменных связей между этими объектами. Такие связи называют ассоциациями представлений или просто ассоциациями. Термин «представление» понимается здесь в широком смысле — как состояние любых подсистем мозга, в частности классификаторов и эффекторов. Образование ассоциаций мы будем называть ассоциированием (терминология тяжеловатая, зато точная). Итак, пятый этап эволюции — этап ассоциаций. Формула метасистемного перехода на этом этапе:
Управление рефлексами = Ассоциирование.
Понятия рефлекса и ассоциации — не структурные, а функциональные понятия. Связь между стимулом S и реакцией R в рефлексе (рис. 3.2) — не передача информации от одной подсистемы к другой, а переход из одного обобщенного состояния в другое. Это разграничение необходимо, чтобы не смешивать рефлекс как определенную функциональную схему, описывающую поведение, с воплощением этой схемы, т. е. с кибернетическим устройством, обнаруживающим эту схему поведения.
Рис. 3.2. Функциональная схема безусловного рефлекса
Путаница легко может возникнуть, ибо простейшее воплощение рефлекторного поведения имеет структурную схему, совпадающую по внешности со схемой на рис. 3.2, только под S и R надо в ней понимать материальные подсистемы, фиксирующие стимул и реакцию. Такое совпадение не совсем случайно. Как мы уже говорили при определении функциональной схемы, разбиение множества всех состояний системы на подмножества, приписываемые вершинам графа, тесно связано с разбиением системы на подсистемы. В частности, с каждой подсистемой, которая может находиться в двух состояниях («да» и «нет»), можно связать множество всех состояний системы в целом, при которых эта система находится в определенном с