<< Предыдущая

стр. 26
(из 45 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

проблем и возможные пути их решения.
Проблема надежности исходных данных. Актуальность этой проблемы обусловлена тем, что дефектность исходных данных никак не
может быть компенсирована ни сложностью, ни точностью последующих вычислительных процедур. Соответственно точность и
надежность получаемых результатов иллюзорны, если не известны
точность и надежность исходных данных. При межвидовых сопоставлениях можно выделить несколько групп признаков с точки
зрения их пригодности для подобного анализа. Некоторые признаки,
как, например, число хромосом или количество ДНК. содержащееся в
ядре одной клетки, идеально подходят для целей межвидовых
сопоставлений. Другие признаки, такие, как вес тела или мозга.
значительно варьируют среди особей одного вида. и их использование сопряжено с целым рядом проблем. Однако для этих
признаков можно определить типичные значения, оценить дисперсию
этих величин и использовать эту информацию в последующих исследованиях. В данном случае спасительным обстоятельством является
тот факт, что межвидовые различия по изучаемому признаку намного
превышают разброс величины этого признака среди особей одного
вида. Существуют, однако, такие признаки, разброс значений которых
настолько велик, что они менее всего пригодны для межвидовых
сопоставлений. Одним из таких признаков является продолжительность жизни.
Существует несколько способов оценки продолжительности жизни
для сравниваемых видов. Это может быть средняя продолжительность жизни организмов в естественных (диких) условиях либо
рекорды долголетия в тех же условиях. Аналогичные характеристики продолжительности жизни могут быть зарегистрированы в
лабораторных условиях, в зоопарке, у домашних, у сельскохозяйственных животных и, наконец, в случае человека, в условиях современной цивилизации. Ясно, что при таком разнообразии условий и
выбираемых характеристик продолжительности жизни (средняя,
мода, медиана, возраст, до которого доживает 10Х популяции,
рекорды долголетия) могут быть получены самые разные значения
"продолжительности жизни вида". В различных публикациях в
зависимости от задачи и вкусов исследователя используются разные
показатели продолжительности жизни, хотя нередко они имеют
похожее или одинаковое название. Очевидно, что поскольку речь
идет, по существу, о разных величинах, то результаты подобных
исследований практически несопоставимы.
Во многих случаях в попытке стандартизовать используемые
данные и избавиться от влияния внешних условий используют показатели максимальной продолжительности жизни. Однако такой способ не только не решает существующей проблемы, но и добавляет целый ряд новых проблем. Как уже отмечалось (см. раздел 4.1, табл. 7),
даже для такого хорошо изученного вида, как человек, при обилии
накопленных статистических данных оценки величины биологического предела продолжительности жизни колеблются от 60 до
146

200 лет. Даже одним и тем же исследователем в одной публикации
[Cutler, 1984a] используется десять разных значений продолжительности жизни человека в диапазоне от 86 до 115 лет. При такой
неточности исходных данных тем не менее ведутся острые
дискуссии, где в качестве решающего аргумента приводится факт
небольшого различия между двумя сравниваемыми коэффициентами
межвидовой корреляции [Sullivan, 1982; Cutler, 1983]. Ясно, однако, что
для решения подобных проблем необходимо обратить особое
внимание не столько на различия в результатах расчетов, сколько на
качество исходных данных.
Таким образом, использование рекордных величин продолжительности жизни отнюдь не решает проблемы надежности исходных
данных. Более того. использование рекордных значений прибавляет
еще две принципиальные проблемы. Первая связана с тем. что
рекорды долголетия зависят от объема наблюдений. Поэтому, как уже
отмечалось в данной книге, зарегистрированный рекорд продолжительности жизни человека (при наличии обширных и длительно
собираемых статистических данных) должен значительно превосходить аналогичный рекорд для вида с той же долговечностью, но
представленного десятком особей в зоопарке. Иначе говоря, данные
по рекордам продолжительности жизни несопоставимы еще и
потому, что они были получены при разном числе наблюдений и не
скорректированы на эти различия. Действительно, данные по
продолжительности жизни человека на многих корреляциях сильно
отклоняются в сторону больших значений [Sullivan, 1982]. Иногда на
основании этого факта делаются далеко идущие выводы [Cutler, 1983].
Однако не исключено, что подобные особенности данных скорее
всего являются артефактом, обусловленным разным объемом наблюдений.
Вторая проблема, связанная с рекордными значениями продолжительности жизни, состоит в несогласованности сопоставляемых
величин. Действительно, все остальные величины, используемые в
межвидовых сопоставлениях, соответствуют не рекордным, а именно
типичным значениям изучаемых признаков. Поэтому непонятно,
почему мы должны делать исключение для продолжительности
жизни и считать, что рекорды долголетия характеризуют
долговечность вида лучше, чем типичные значения этого признака
(среднее арифметическое, модальная или медианная продолжительность жизни и т.п.).
Переход от рекордных значений продолжительности жизни к
средним снимает две перечисленные выше проблемы, но не является
радикальным способом решения проблемы стандартизации сопоставляемых данных. Дело в том. что средние показатели продолжительности жизни даже в пределах одного вида сильно зависят от
условий жизни и генетических особенностей сравниваемых
популяций. Например, различия в продолжительности жизни мышей
различных генотипов, содержащихся в одинаковых, строго контролируемых условиях, различаются почти в два раза [Sacher, Duffy,
147

1979; Gelman et al., 1988], даже если сопоставляются особи одного
пола. Если сопоставить продолжительность жизни мышей долгоживущей линии C57BL/6J, живших в "стандартных" лабораторных
условиях, то окажется, что средняя продолжительность их жизни за
период с 1948 по 1971 г. увеличилась в 1,5—2 раза [Kunstyr, Leuenberger,
1975]. Следует отметить, что такие большие различия наблюдаются в
условиях частичной стандартизации условий жизни. В общем случае
значения средней продолжительности жизни особей одного и того
же вида могут варьировать в десятки раз в зависимости от условий
жизни и генотипа [Lints, 1985].
Можно предложить несколько путей решения проблемы стандартизации сопоставляемых величин. Первый состоит в прямой
стандартизации условий жизни сравниваемых видов. Этот прием
пригоден для близких видов, живущих в сходных экологических
условиях. Примером такой прямой стандартизации является
сравнительное изучение продолжительности жизни домовой мыши
(Mus musculus) и белоногого хомячка (Peromyscus leucopus) [Sacher, Hart,
1978]. Однако метод прямой стандартизации условий жизни, будучи
приемлемым при сопоставлении таких видов, как мышь и крыса,
становится затруднительным при сопоставлении, например, крысы и
цыпленка и совершенно невозможным при сопоставлении слона и
кита. Поэтому для целей широкомасштабных межвидовых сопоставлений необходимо искать другие, более общие способы стандартизации показателей продолжительности жизни.
Один из перспективных подходов к подобной стандартизации
состоит в том, чтобы сравнивать характеристики продолжительности
жизни видов, живущих не в одинаковых условиях (что не обеспечивает равенства для животных, адаптированных к различным
экологическим условиям), а в условиях, при которых одинакова
форма распределения по срокам жизни. Чтобы реализовать этот
принцип на практике, необходимо для каждого вида иметь
достаточно большой набор таблиц дожития, с тем чтобы выбрать из
них такие, которые совпадают между собой по форме кривой
распределения продолжительности жизни. В случае, если выявляется целая серия таких совпадающих по форме распределений,
предпочтение следует отдать более симметричному распределению с
минимальными различиями между средней, модальной и медианной
продолжительностью жизни. Преимущество такого распределения
состоит в том. что вопрос, какую же именно характеристику продолжительности жизни следует использовать (среднюю, моду или
медиану), в данном случае не имеет существенного значения. Однако,
поскольку данный подход является довольно сложным, следует
рассмотреть и более простые способы стандартизации значений
продолжительности жизни.
Один из таких способов стандартизации состоит в том, чтобы
некоторым образом усреднять значения средней продолжительности
жизни, полученные для разных популяций одного вида. Это может
148

быть усреднение путем расчета средней арифметической для
средних значений продолжительности жизни в различных популяциях. Это может быть расчет наиболее часто встречаемого (модального) значения средней продолжительности жизни, медианы или
моды (модальная средняя, модальная медиана, модальная мода).
Наконец, можно рассчитывать медианное значение от соответствующих популяционных характеристик продолжительности жизни (средней, моды и медианы). Нетрудно заметить, что если в качестве
характеристик центра распределения продолжительности жизни
использовать всего три показателя (среднее арифметическое, мода и
медиана), то усреднение этих величин с помощью тех же трех
показателей на межпопуляционном уровне приведет нас к девяти
возможным показателям, характеризующим продолжительность жизни видов. Хотя подобный подход может показаться примитивным, он
тем не менее представляется более разумным, чем существующая в
настоящее время практика использования произвольно выбранного
значения продолжительности жизни, имеющего красивое название
"экспертная оценка".
Наконец, радикальное решение проблемы надежности исходных
данных могло бы быть получено, если в расчетах использовать
значения видовой продолжительности жизни подобные тем, что
описаны в разделе 4.5. Однако универсальных методов оценки
видовой продолжительности жизни до сих не существует, а сами
значения видовой продолжительности жизни к настоящему времени
определены только для человека и плодовой мушки (Drosophila
melanogaster). Поэтому, строго говоря, проведение межвидовых сопоставлений является преждевременным, поскольку не решены
научные проблемы, необходимые для разработки данной темы.
Несмотря на обилие публикаций и полученных результатов, следует
признать, что все они носят сугубо предварительный характер. Для
того чтобы результаты подобных исследований можно было считать
достоверными, необходимы следующие условия.
1. Величина характерной продолжительности жизни особей данного вида должна быть одинаковой не только в работах одного и
того же автора, но и в публикациях всех исследователей, проводящих межвидовые сопоставления.
2. Подобное единство значений должно вытекать не из договоренности между исследователями, а из самой процедуры определения
величины видовой продолжительности жизни.
3. Используемые процедуры расчетов должны быть основаны на
информации о распределении продолжительности жизни особей
данного вида при варьирогании условий жизни и генотипа и
являться обобщением такой информации.
4. Получаемые значения видовой продолжительности жизни должны быть снабжены соответствующими оценками доверительных интервалов и показателями надежности полученных данных.
Следует признать, что ни одно из этих условий до сих пор не выполнено, а надежность используемых данных такова, что она не
149

позволяет получать надежные результаты. В то же время следует
отметить, что данная проблема не является практически невыполнимой. и выше уже приводились возможные пути ее решения. Их
реализация позволила бы поставить исследования межвидовых различий продолжительности жизни на строгую научную основу.
Проблема корректной обработки данных. Специфика анализа межвидовых различий обусловлена двумя обстоятельствами: неточностью и ненадежностью исходных данных, а также вариацией
огромного числа взаимозависимых признаков у разных видов. Как
уже отмечалось, точность используемых видовых показателей продолжительности жизни иллюзорна. Поэтому в настоящее время
можно с достаточной надежностью оценить лишь ранговое положение видов по долговечности их особей. Так, можно с уверенностью
говорить, что человек живет дольше собаки, собака живет дольше
морской свинки, морская свинка живет дольше крысы, а последняя
живет дольше мыши. Таким образом, надежным является лишь
ранговое положение или. попросу говоря, место, которое занимает
каждый вид в упорядоченном ряду значений продолжительности
жизни. Поэтому корректная обработка подобных данных должна
сводиться к расчету именно ранговых коэффициентов корреляции
Сгтирмена или Кендалла, а не традиционных коэффициентов корреляции Пирсона, используемых практически во всех современных
исследованиях. В результате такой практики ненадежность исходных
данных делает сомнительными и конечные результаты расчетов, в то
время как использование ранговых коэффициентов корреляции позволило бы получать более устойчивые результаты, менее зависимые
от конкретных числовых значений продолжительности жизни. Другим аргументом в пользу замены коэффициентов корреляции Пирсона
на ранговые коэффициенты корреляции является наличие выбросов в
анализируемых данных. Хорошо известно, что использование коэффициента корреляции Пирсона и оценка доверительных интервалов для
него оправданны лишь тогда, когда совместное распределение изучаемых признаков можно хотя бы приближенно считать двумерно
нормальным [Айвазян и др., 1985]. В случае же межвидовых сопоставлений это условие практически никогда не выполняется, и более
того. весьма типична ситуация, когда одна-две точки резко выпадают
из общего поля точек. Среди таких выпадающих точек чаще всего
бывает точка, относящаяся к человеку (см., например, рис. 25 в работе
[Cutler, 1984a]). Причины подобных выбросов мы уже обсуждали,
отмечая их возможную артефактную природу. В данном случае важно
другое: такие резко выпадающие точки при традиционном способе
обработки данных способны создать иллюзию сильной связи между
изучаемыми переменными, поскольку при этом получаются очень
высокие значения коэффициентов корреляции Пирсона. Между тем
хорошо известно, что высокие значения коэффициента корреляции в
данном случае ничего не доказывают, а подобный анализ данных
является типичным примером некорректного исследования [Айвазян
и др., 1985]. Нередко бывает достаточно исключить из рассмотрения
150

одну такую резко выпадающую точку, чтобы "обнаруженная" связь
между переменными полностью исчезла. Однако более корректно не
исключение данных из анализа, а использование ранговых коэффициентов корреляции, которые устойчивы по отношению к величине
отклонения выпадающих точек.
Другой недостаток современных методов анализа межвидовых
различий состоит в том, что такой анализ обычно ограничивается
только попарным сопоставлением переменных, т.е. расчетом парных
коэффициентов корреляции. Именно таким образом было проведено
большинство исследований, результаты которых отражены в табл.
12—14. Между тем специфика межвидовых различий такова, что
сравниваемые виды отличаются по огромному числу признаков,
которые к тому же достаточно тесно коррелируют друг с другом.
Поэтому связь между продолжительностью жизни и изучаемым
признаком может быть не прямой, а косвенной, т.е. обусловленной
влиянием выпавшей из анализа третьей переменной на оба изучаемых
признака. Поэтому для корректного исследования влияния изучаемого признака на продолжительность жизни необходимо рассчитывать не парные коэффициенты корреляции, а частные коэффициенты корреляции, в которых устранено влияние других признаков
на продолжительность жизни. Примером подобного исследования
является работа Гарвея и Заммуто [Harvey, Zammuto, 1985], в которой
показано, что существует сильная положительная связь между возрастом первой репродукции и продолжительностью жизни в диких
условиях (коэффициент корреляции составлял 0,976). Поскольку вес
тела также положительно коррелирует с продолжительностью жизни
и возрастом первой репродукции, был рассчитан частный коэффициент корреляции между продолжительностью жизни и возрастом
первой репродукции при устранении влияния веса тела. Этот коэффициент составил 0,892, что свидетельствует о том, что изучаемая связь
между двумя переменными существует и при исключении влияния
веса тела. К сожалению, в данном конкретном исследовании авторы
использовали традиционный коэффициент корреляции Пирсона, в то
время как частные коэффициенты корреляции можно рассчитывать и
с помощью рангового коэффициента корреляции Кендалла [Kendall,
1962].
Итак, для выяснения действительных связей между продолжительностью жизни и изучаемым признаком необходим расчет частного
коэффициента корреляции при устранении влияния всех остальных
признаков. Данный подход может быть реализован с помощью рангового коэффициента корреляции Кендалла. Другой подход к этой
проблеме состоит в расчете уравнения множественной регрессии,
включающей весь набор возможных признаков. Данный подход был
реализован в работах Сэчера [Sacher, 1959; 1977; 1978], хотя следует
отметить, что результаты подобных расчетов могут сильно зависеть
от конкретных числовых значений продолжительности жизни. Однако. как бы ни проводились подобные расчеты, мы неизбежно приходим к третьей проблеме анализа данных: расчет частных эффектов
151

изучаемого признака на продолжительность жизни при устранении
влияния всех остальных мешающих признаков требует измерения
значений огромного числа признаков. Однако огромное их число
может быть использовано в анализе лишь тогда, когда число исследуемых видов будет еще больше, поскольку число реализации должно
быть больше числа используемых переменных. В результате мы приходим к необходимости изучения большого числа видов, продолжительность жизни которых может оказаться близкой друг к другу
настолько, что проблема точного определения видовой продолжительности жизни опять выйдет на первый план.
Итак. корректный анализ межвидовых различий по продолжительности жизни возможен при выполнении следующих трех условий:
1. Переход от расчета традиционных коэффициентов корреляции
Пирсона к ранговым позволил бы получать результаты, устойчивые
относительно большой неопределенности показателей видовой продолжительности жизни и наличия резко отклоняющихся значений
переменных.
2. Переход от парных коэффициентов корреляции к частным коэффициентам ранговой корреляции Кендалла позволил бы учесть влияние каждого изучаемого признака на продолжительность жизни при
исключении влияния всех остальных признаков.
3. Расчет частного эффекта признака при устранении влияния всех
остальных мешающих переменных требует анализа большого числа
признаков и еще большего числа видов. Естественно, что с увеличением числа сравниваемых видов будет расти и число спорных ситуаций относительно рангового положения видов по величине их
продолжительности жизни. Таким образом, ограниченная надежность данных о видовой продолжительности жизни становится принципиальным ограничением, которое невозможно обойти путем совершенствования статистических методов.
Следует признать, что большинство исследований межвидовых
различий пока еще не удовлетворяют.перечисленным условиям. Поэтому результаты межвидовых сопоставлений носят сугубо предварительный характер. Вместе с тем. как было показано ранее, повысить
надежность и глубину анализа накопленных данных сравнительно
несложно, и можно надеяться, что это будет сделано в ближайшем
будущем. В то же время следует еще раз подчеркнуть, что без радикального повышения качества исходных данных возможности их
статистического анализа весьма ограниченны.
Проблема содержательной интерпретации результатов межвидовых сопоставлений продолжительности жизни. Хорошо известно,
что наличие коррелятивной связи между переменными вовсе не означает существования между ними причинно-следственной связи (обе
переменные могут определяться третьей, неизвестной нам переменной). Поэтому проблема содержательной интерпретации результатов
корреляционного анализа межвидовых различий по срокам жизни
является довольно сложной задачей. Проблема осложняется еще и
тем, что результаты межвидовых сопоставлений не всегда согла-
152

суются с результатами сопоставлений внутри одного вида. Например,
твердо установлено, что продолжительность жизни видов растет по
мере увеличения веса их тела (см. табл. 12). В то же время хорошо
известно, что большие значения веса тела не только не способствуют
большей продолжительности жизни людей, но являются даже
настолько важным фактором риска, что его нередко учитывают при

<< Предыдущая

стр. 26
(из 45 стр.)

ОГЛАВЛЕНИЕ

Следующая >>