Книга: Биологически активные
Язык мой...
<<< Назад Тысячелетия проб и ошибок |
Вперед >>> Пример из детского сада |
Язык мой...
У некоторой части читателей, по-видимому, шевельнется сомнение: да полно, может ли эта самая наука о биологически активных веществах вообще называться наукой в современном понимании этого термина? Если единственный, по существу, способ обнаружить какое-то биологическое действие данного соединения – это его испытание на живых объектах, неважно, в конце концов, осуществленное случайно или в результате систематического перебора тестов.
Настоящая наука призвана выявлять общие закономерности; скажем, физик, лишь взглянув на формулу вновь синтезированного соединения, сможет что-то сказать – пусть в самых общих чертах – о его спектроскопических характеристиках, химик – о реакционной способности, растворимости и т.п. А если им дать возможность пообсчитать кое-что на ЭВМ, сообщат и заряды на атомах, и теплоту сгорания, и много чего еще. Потому что им известны фундаментальные законы, определяющие протекание реакций, взаимодействие вещества со светом, распределение электронной плотности в молекулах, причем чаще всего эти законы имеют вид четких математических формул.
А что же вы, уважаемые токсикологи, фармакологи и прочие? Где ваши фундаментальные законы?
Поиски всеобщих законов, связывающих структуру соединения с его биологической активностью, имеют почти столь же длительную историю, как и сама химическая наука. При желании попытки такого рода можно обнаружить и в трудах древних атомистов, и у средневековых алхимиков. Упомянуть последних здесь, пожалуй, особенно уместно. Не удалось им найти способ превращения неблагородных металлов в золото; как мы теперь знаем, это невозможно в принципе. (Опустим оговорки по поводу ядерных реакций.) Совершенно аналогично ныне есть все основания утверждать, что единые, универсальные законы, связывающие химическое строение вещества с его биологической активностью, вообще не существуют, так что дело здесь вовсе не в недостаточной настойчивости или умственной ограниченности алхимиков и всех последующих поколений адептов их тайного искусства, включая наших современников, священнодействующих в лабораториях, до отказа нашпигованных мудреной техникой, включая ЭВМ.
Впрочем, именно с приходом в лаборатории ЭВМ появились и кое-какие надежды. Не на отыскание, впрочем, тех универсальных законов, а на создание процедур, которые позволили бы сделать хотя бы предположительное суждение о проявлении того или иного вида биологической активности данным веществом – на основании только его структурной формулы.
Такие машинные процедуры чрезвычайно громоздки, их разработка – дело весьма и весьма трудоемкое, надежность предсказания в среднем не очень высокая, а порой вообще не выдерживает никакой критики. Наконец, в них полностью отсутствует столь ценимая теоретиками красота, лаконичная элегантность, присущая, например, выражениям типа E = mc2 или «квадрат гипотенузы равен сумме квадратов катетов».
Прежде всего перенос задачи на ЭВМ предполагает использование лишь вполне четких формулировок. Для этой цели разрабатываются специальные языковые средства. Чтобы иметь возможность принять вопрос:
«Какими проявлениями биологической активности обладает данное соединение?» – машина должна располагать информацией о том, какие виды биологической активности бывают вообще, и иметь возможность однозначно определить, о каком именно соединении идет речь. Обе проблемы не кажутся на первый взгляд непреодолимыми; так оно, конечно, и есть. Их решение, однако, наталкивается на массу мелких, но досадных трудностей. Пролистаем бегло весьма специальное (тираж 220 экземпляров) издание «Тезаурус информационно-поисковый по биологически активным соединениям», составленный Е.М. Михайловским, В.В. Авидоном и Р.К. Казаряном. Это, как пишут сами авторы, «терминологический словарь-справочник, в котором систематизированы лексические единицы дескрипторного информационно-поискового языка по биологической активности химических соединений и важнейшие парадигматические связи между терминами».
Поясняя это определение более пространно и с помощью менее специальных «лексических единиц», можно сказать, что речь идет о перечне и систематизации терминов, принятых в данной автоматизированной системе обработки данных, четком установлении связей между ними. Система разрабатывается для нужд фармакологических исследований. Сами авторы подчеркивают, что тезаурус «не представляет собой какой-либо новой классификации лекарственных средств». Тем не менее одно из его назначений – закрепление некой принятой в дальнейшем систематики биологических свойств химических соединений.
Рассматриваются три аспекта их действия. Так, по фармакологическому эффекту все препараты можно подразделить на 217 групп; алфавитный их перечень возглавляют «Агрегации тромбоцитов активаторы», замыкают – «эритропоэза стимуляторы», а между ними находим «антидепрессанты», «жажды стимуляторы», «противобактериальные», «снотворные» и т.д. Некоторые группы подразделяются на более мелкие, например, «противокашлевые» на «противокашлевые наркотические» и «противокашлевые ненаркотические»; все три входят в число упомянутых 217.
Другой способ классификации – по механизмам биологического действия: «аденилатциклазы активаторы», «гормонов антагонисты»... «серотонинподобные»... и так далее, вплоть до трудночитаемого «UDP-N-ацетилглюкозамингликопротеид N-ацетилглюкозами-нилтрансферазы ингибиторы»; всего 309 групп. Преобладают активаторы и ингибиторы различных ферментов.
Наконец, принята и классификация по месту действия (168 групп): «вестибулярный аппарат», «железы слюнные», «мозг спинной», «протопласт бактерий»... «ухо»... «яйца насекомых». С помощью такого словаря-систематики тем самым определено, какие виды биологической активности вообще существуют. Комбинируя термины, входящие в три описанных перечня, можно определять более узкие группы проявлений биологической активности. Например, сосудорасширяющие препараты – это те, которые принадлежат одновременно группе «спазмолитики» первого перечня и «гладкая мускулатура артерий» третьего перечня.
Очевидно, предполагается, что по мере накопления новых данных тезаурус будет систематически пополняться и видоизменяться.
При разработке языка для описания структуры химического соединения приходится сталкиваться с проблемами совсем иного рода.
Уж формулы как будто чуть ли не сами должны лезть в ЭВМ. Они-то, ЭВМ, в конце концов, и созданы для восприятия формул: один из наиболее популярных языков программирования – фортран образует свое название от английского FORmula TRANslation – «перевод формул».
К сожалению, речь идет вовсе не о структурных формулах, употребляемых в химии. То есть, конечно, можно в конце концов заставить ЭВМ работать и с такими формулами, но для этого понадобится создать соответствующий язык.
Таких языков было предложено несколько – в зависимости от особенностей задач, которые предстояло решать.
Какую информацию нужно ввести в машину для того, чтобы однозначно описать структуру какого-либо соединения? Пусть это будет, скажем, молекула этилового спирта.
Во-первых, должен быть дан перечень образующих ее атомов; пронумеруем их каким-нибудь образом. Например, номера (индексы) от 1 до 6 присвоим атомам водорода, 7 и 8 – углерода, 9 – кислорода:
Во-вторых, перечислим существующие в молекуле валентные связи; это можно сделать, указав пары индексов атомов, между которыми такие связи существуют: (1,7), (2,7), (3,7), (4,8), (5,8), (6,9), (7,8), (8,9). В рассмотренной молекуле этанола все связи одинарные; при необходимости можно, однако, привести отдельные наборы пар индексов, которые определяют положение одинарных, двойных, тройных связей.
Вот, казалось бы, и вся премудрость. Действительно, информация, представленная в такой форме, четко и однозначно описывает именно структуру молекулы этилового спирта. Беда, однако, в том, что такое описание может быть осуществлено очень многими способами. В самом деле, мы произвели нумерацию атомов в молекуле совершенно произвольным образом: сначала пронумеровали все атомы водорода, затем – углерода и кислорода. Но ведь ничто не мешает пронумеровать их в обратной последовательности, или по мере перемещения от одного конца молекулы к другому, или еще каким-нибудь образом. Каждый раз мы получим точное описание именно молекулы этанола; все такие описания будут совершенно эквивалентны.
Таким образом, каждая структурная формула может быть записана в ЭВМ многими, часто очень многими способами. Нетрудно даже было бы выписать пару формул с несколько устрашающим обилием факториалов, но не станем этого делать. Достаточно сказать, что для сравнительно немудреной и скромной по размерам молекулы этанола это число составит около четырех тысяч.
Если, таким образом, попытаться теперь составить словарь описанного нового языка – точнее, русско-«новоязычный» словарь, против русского термина «этанол» оказалось бы четыре тысячи синонимов, причем синонимов совершенно равнозначных, не различающихся никакими смысловыми оттенками в отличие от того, как это обычно бывает в «настоящих» языках.
Нечего и говорить о том, сколь неудобен в работе такой словарь; а ведь избранная нами в качестве примера молекула этанола – одна из простейших органических молекул; число же синонимов в принятом нами описании лавинообразно растет с увеличением размеров молекулы. Уже для знакомой нам пальмитиновой кислоты, тоже далеко не чемпиона по размерам и сложности строения среди интересующих нас соединений, выписать все синонимы просто нет технической возможности; для этого понадобилось бы гораздо больше бумаги, чем ее произведено за всю историю человечества.
По счастью, в составлении подобных словарей нет нужды, хотя отмеченная особенность рассмотренного языка описания химических структур создает немалые трудности при его использовании в процедурах прогнозирования биологической активности химических соединений по их формуле.
<<< Назад Тысячелетия проб и ошибок |
Вперед >>> Пример из детского сада |