Книга: Биологически активные

Непосредственная связь с магией

<<< Назад
Вперед >>>

Непосредственная связь с магией

Не счесть всех постыдных поражений и глупейших конфузов, кошмарных провалов и опереточных таки ошибок, выпавших на долю тех мужественных и изобретательных людей, которые впервые взялись за внедрение методов теории распознавания образов в различных прикладных областях.

Социология, лингвистика, экономика, геология, ботаника – где только не пробовали они свои силы; как мы знаем, в фармакологии и токсикологии тоже. Их приход в каждую из этих областей встречался сначала с большим энтузиазмом, затем следовали первые результаты – и они решительно всех разочаровывали. ЭВМ, напичканная массой всяческой информации и снабженная программами, в которых реализовались мудреные алгоритмы, с трудом отличала, образно говоря, зайца от барашка (есть абхазская пословица: «Похож, как заяц на барашка») и уж полностью была бессильна в ситуациях менее очевидных, хотя все еще тривиальных с точки зрения специалистов. В шестидесятые годы, когда происходило становление теории распознавания образов, часто с эстрады звучала басня о некоем незадачливом руководящем Медведе, привыкшем подбирать кадры исключительно на основании анкеты:

...Рассмотрим данные, картина такова:

Ноги четыре, уха два,

Шерсть тона светлого, длинней всего на холке.

Имеет хвост, украшенный метелкой,

Способен оглушительно реветь...

«Так это ж лев!» – разинул рот медведь.

При ближайшем рассмотрении обладатель анкеты оказался ослом. В этой истории, как в капле воды, отражены неприятности, подстерегающие авторов распознающих программ; в частности, сразу бросается в глаза использование малоинформативных признаков: «ноги четыре» и в особенности «уха два».

За прошедшие с тех пор два с лишним десятилетия теория распознавания образов значительно шагнула вперед, и во многих сферах использование ее методов для решения различных прикладных задач стало повседневной практикой. К сожалению, этого нельзя пока сказать о задачах выявления связи структура – активность, хотя и на этом пути достигнут определенный прогресс.

Один из важнейших уроков истории развития методов теории распознавания образов заключается, по-видимому, в выводе, что нет надежд на получение универсальных, пригодных в равной степени для всех задач методов; каждый узкий класс задач требует создания строго ориентированных процедур, учитывающих специфику задачи. Даже при исследовании проблемы связи структура – активность наметилось несколько направлений, требующих развития различных подходов в зависимости от поставленных целей и круга изучаемых соединений; при этом именно в силу специфики задачи некоторые из них выходят за традиционные рамки методов теории распознавания образов.

Рассмотрим подробнее в качестве примера так называемый логико-структурный подход к изучению связи структура – активность, развиваемый упоминавшимся А.Б. Розенблитом и В.Е. Голендером.

Сами авторы объясняют отличие своего подхода от традиционных методов теории распознавания образов следующими словами: «При исследовании проблемы связи структура – активность методы распознавания образов представляются нам недостаточными потому, что основная их цель – найти решающее правило классификации объектов. Для нас же не только важно найти решающее правило, с помощью которого можно было отнести данное соединение к определенному виду (или нескольким видам) активности, но. не менее важно на основе обучающей последовательности выявить структурные признаки, руководствуясь которыми химик мог бы синтезировать новые соединения с наперед заданной активностью. Разумеется, важно иметь оценку достоверности признака».

Очевидно, при таком подходе сохраняется и необходимость создания специального языка для описания химической структуры соединений, и использование некоторой классификации типов их биологической активности с учетом того обстоятельства, что возможна принадлежность соединения к двум или нескольким классам сразу, то есть допускается наличие у него нескольких типов биологической активности. Наконец, необходима разработка соответствующим образом организованных банков данных.

Для демонстрации сути приема, лежащего в основе алгоритма отбора признаков, характерных для определенного типа биологической активности, авторы рассматривают простейший пример группы соединений, принадлежащих одному ряду и различающихся лишь характером заместителей в четырех положениях. Можно для определенности взять некоторое циклическое ядро или фрагмент алифатической цепочки с заместителями R1, R2, R3, R4. Например:


Эти заместители могут быть радикалами –NH2, –CH3, –C2H5, –C6H5, –H, –F, –Br, –NO2 и др. в различных комбинациях.

Все соединения разделены на две группы, обладающие определенным видом биологической активности и лишенные ее. Будем попарно сопоставлять представителей каждой группы, отмечая всякий раз совпадения и несовпадения характера заместителей в отдельных положениях. В результате выяснится, что, скажем, комбинации R1 = –H, R3 = –Br и R1 = –CH3, R2 = –NH2 наблюдаются только у активных соединений, комбинации R1 = –H1, R4 = –NO2 и R1 = –CH3, R2 = –C6H5 – только у неактивных. Помимо этого, есть и признаки, встречающиеся у представителей обеих групп. Можно подсчитать и частоту наблюдения различных совокупностей заместителей в двух группах и на этой основе получить простое решающее правило, приняв некоторое ее пороговое значение, превышение которого указывает на активность.

Обнаружив у анализируемого соединения признаки, характерные для группы активных веществ, а это могут быть, в принципе, любые сочетания пар, троек и т.д. заместителей, мы вправе предположить, что и оно будет обладать соответствующей активностью. Аналогично может быть сделано заключение о его неактивности. Возможны, разумеется, случаи, когда выраженные признаки, характерные для соединений первой или второй группы, отсутствуют; здесь придется воздержаться от предсказания.

Все действительно логично («логико-структурный подход»!) и как будто очень просто. Просто, однако, только в случае рассмотренного игрушечного примера. Для реализации этого подхода применительно к задачам, представляющим реальный интерес, потребовалось создание весьма сложных систем. Одну из таких систем авторы ее нарекли ОРАКУЛ (Оптимизированный Распознающий Алгоритм Конструирования Усовершенствованных Лекарств). Главе, в которой содержится ее описание, они предпослали в качестве эпиграфа утверждение авторитетнейшей Британской энциклопедии: «Все, относящееся к оракулам, непосредственно связано с магией».

<<< Назад
Вперед >>>

Генерация: 5.418. Запросов К БД/Cache: 3 / 1
Вверх Вниз