Results not found

По вашему запросу ничего не найдено

Попробуйте отредактировать запрос и поискать снова

Офисная жизнь

Анализ динамики средовых влияний в близнецовых исследованиях

Article Thumbnail

Работа выполнена при поддержке РФФИ; гранты № 010680134 и № 990680161.

Для исследования динамики влияния среды на внутрипарное сходство близнецов используется математическая модель, представленная марковскими случайными процессами с дискретными состояниями и непрерывным временем. Модель учитывает генетические факторы и влияние индивидуальной среды. В качестве анализируемых характеристик используются гистограммы. Искомые величины оцениваются с помощью метода минимума χ2. Предлагаемый подход применялся для анализа лонгитюдных данных для монозиготных (МЗ) и дизиготных (ДЗ) близнецов. Показано, что одно и то же воздействие среды может привести к различным вкладам в конечные дисперсии психологической характеристики. Величины этих вкладов зависят от генетического фактора, представленного распределениями анализируемого параметра в момент рождения.

Ключевые слова: лонгитюдные данные, индивидуальные различия, марковские процессы, метод минимума χ2.

Для анализа причин изменчивости психологических характеристик используются различные процедуры — от классического корреляционного анализа до конфиматорного факторного анализа, популярного в последнее время среди западных исследователей. При решении последней задачи особенно эффективны методы линейного структурного моделирования, которые являются аналитическими аналогами метода анализа путей, используемого в генетике поведения. Данный подход позволяет работать с достаточно сложными конструкциями и, в частности, дает возможность анализировать лонгитюдные данные с помощью симплексмоделей [3], [7].

Однако этот путь имеет ряд существенных ограничений, среди которых можно отметить:

искусственность формальных определений общей и индивидуальной сред, воздействующих на испытуемых, что может приводить к посылкам, явно расходящимся с результатами наблюдений (например, к посылке о том, что одно и то же воздействие среды дает одинаковый эффект для испытуемых с различным генотипом);

неустойчивость результатов моделирования для малых выборок (незначительное изменение объема выборки может приводить к качественному изменению результатов);

сложность и искусственность интерпретации результатов моделирования в случае малого количества временных интервалов наблюдений.

Учитывая это, сохраняет актуальность задача поиска альтернативных моделей и методов анализа, свободных хотя бы от части указанных недостатков. Один из таких подходов [5], позволяющий исследовать динамику индивидуальных характеристик, рассматривается в этой статье.

Результаты наблюдения за близнецами в последовательные моменты времени

81

позволили вывести количественные оценки, с помощью которых можно выяснить, как фактор среды в течение заданного временнόго периода изменяет начальные индивидуальные различия, обусловленные генетическими факторами. Обсуждаются параметры, описывающие эффект воздействия обоих типов указанных факторов. Временная динамика накопления различий между близнецами и членами неродственных пар описывается с помощью пуассоновских потоков событий. В отличие от традиционного конфирматорного факторного анализа [4], [6], в качестве базовых анализируемых характеристик вместо ковариационных матриц используются гистограммы.

Предлагаемый подход может быть применен при анализе лонгитюдных данных.

МАТЕРИАЛЫ И МЕТОДЫ

Анализируемой величиной является абсолютное значение разности исследуемых параметров для членов одной и той же близнецовой пары. Допустимый диапазон значений этой величины делится на несколько интервалов. Каждый интервал рассматривается как отдельное состояние, в котором пара близнецов может находиться с некоторой вероятностью, переходя из одного состояния в другое по определенным правилам.

Для описания того, как вероятности нахождения в заданных состояниях изменяются со временем, применяются параметрические математические модели, описывающиеся марковскими случайными процессами с дискретными состояниями и непрерывным временем. (Такие модели часто используются в теории массового обслуживания.) Модель представляется ориентированным графом (см. пример на рис. 1), в котором вершины (обозначаются как прямоугольники) соответствуют состояниям, а дуги (обозначаются как стрелки) соответствуют переходам. Процесс накопления различий между близнецами рассматривается как случайное блуждание по графу из одного состояния в другое согласно направлениям дуг. Время полагается непрерывным. Переходы между состояниями мгновенны и происходят в случайные моменты времени. Они являются результатом воздействия среды. Математическое описание этих переходов характеризует влияние среды на близнецов. Важно отметить, что в данной модели учитывается только то влияние среды, которое различается для близнецов (так называемая индивидуальная среда).

В свою очередь, начальное распределение вероятностей состояний в момент рождения отражает генетические различия между близнецами. Параметры этого распределения описывают влияние генетического фактора. В результате воздействия среды начальное распределение вероятностей в течение времени наблюдения трансформируется в некоторое текущее распределение.

Предполагается, что для переходов между состояниями выполняются следующие два свойства пуассоновских потоков событий (так мы далее будем, согласно принятой терминологии, называть переходы):

ординарность (поток называется ординарным, если вероятность появления двух и более событий в течение малого интервала времени намного меньше, чем вероятность появления за это же время одного события);

независимость приращений (это свойство означает, что количества событий, попадающих в два непересекающихся интервала, не зависят друг от друга).

Можно показать [2], что в рассматриваемых потоках количество событий X, попадающих в любой временной интервал длины t, начинающийся в момент t, распределено согласно закону Пуассона:

Pt,τ (X=m) = ea(t,τ),

где Pt,τ (X=m) — вероятность появления m событий в течение рассматриваемого

82

интервала, a(t,t) — среднее количество событий, попадающих в интервал длины t, начинающийся в момент времени t. Далее будут рассматриваться только стационарные потоки (в которых a(t,t)=ht, h=const). Параметр h называется интенсивностью стационарного потока. Он равен среднему количеству событий в единицу времени. Средняя продолжительность времени между двумя смежными событиями в этом случае равна 1/h.

Указанные выше предположения о свойствах потоков событий обычны для прикладных задач, так как эти потоки (или потоки, близкие к ним по свойствам) часто встречаются на практике благодаря соответствующим предельным теоремам [2].

Система, показанная на рис. 1, используется для исследования процесса развития близнецов. Она представляет собой конечную цепь из n+1 состояний, в которой переходы из состояния xk (k¹0, k¹n) возможны только в предшествующее состояние xk1 или в следующее по порядку состояние xk+1. Из состояний x0 и xn доступны только переходы в состояния x1 и xn1, соответственно. Процессы, описываемые с помощью таких графов, называются «процессами гибели и размножения «, так как впервые они были применены в биологии для анализа динамики роста популяции.

Интенсивности потоков обозначены как lk и mk. Параметры lk показывают, как среда делает близнецов различными (дивергенция). Параметры mk показывают, как среда сближает близнецов (конвергенция).

Если обозначить полный диапазон допустимых значений разностей между исследуемыми параметрами близнецов как D, то состоянию x0 будет соответствовать интервал разностей от 0 до D/n+1, состоянию x1 — интервал от D/n+1 до 2D/n+1, и т.д. Динамика изменения во времени вероятностей нахождения в различных состояниях описывается следующей системой обыкновенных дифференциальных уравнений [2]:

= λ0p0(t) + μ1p1(t);

= (λk + μk) pk(t) + λk1pk1(t) + μk+1pk+1(t),

(k=1,2,Е, n1);

= μnpn(t) + λn1pn1(t);

где pk(t) есть вероятность нахождения в состоянии xk в момент времени t. Чтобы упростить задачу, интенсивности потоков далее полагаются не зависящими от индекса k: l0=l1=…=ln1=l и m1=m2=…=mn=m.

Для интегрирования указанной системы уравнений необходимо задать начальные условия:

p0(0), p1(0), pn(0)… pn(0); .

Нормализующее условие

.

выполняется в любой момент времени.

При использовании этой модели для анализа близнецовых данных момент времени t=0 рассматривается как момент рождения близнецов. Полагается, что для монозиготных близнецов p0(0)=1 и pk(0)=0 (k=1,…,n), так как между ними нет генетических различий, а воздействие среды в начальный момент времени еще не сказывается. Для дизиготных близнецов и неродственных пар полагается, что разности параметров в начальный момент времени описываются нормальным распределением с нулевым средним и некоторыми среднеквадратическими отклонениями sdz и sun, которые характеризуют влияние генетического фактора. Следующие равенства выполняются из-за симметрии распределения:

83

p0(0) =,

p1(0) =,…,

и так далее (s=sdz для дизиготных близнецов и s=sun для неродственных пар).

В указанных выше терминах определение влияния наследственности и среды сводится к вычислению среднеквадратических отклонений sdz и sun и интенсивностей l и m. В качестве оценки этих независимых параметров принимаются значения, обеспечивающие наилучшее соответствие между наблюдаемыми и ожидаемыми частотами попадания в каждое из состояний в заданные моменты времени.

Одни и те же независимые параметры подбираются к нескольким группам пар, а именно: к монозиготным близнецам, к дизиготным близнецам и к неродственным парам.

Ожидаемые вероятности состояний вычисляются путем интегрирования указанной системы дифференциальных уравнений. Ожидаемое количество попаданий в kе состояние в gй группе (g=1,2,…Е,G) равно pkgNg, где pkg — вероятность нахождения в соответствующем состоянии, Ng — количество наблюдений. Наблюдаемые количества попаданий Fkg определяются в результате измерений, сделанных в процессе лонгитюдных исследований. При выполнении ряда условий, следующая статистика описывается распределением c2:

.

Эта сумма рассматривается как мера соответствия в том смысле, что ее большие значения говорят о плохом согласовании ожидаемых и наблюдаемых значений, а малые значения — о том, что наблюдаемые и ожидаемые результаты близки между собой. Количество степеней свободы (равное Gnl, где l есть общее количество независимых параметров) служит в качестве эталона для сравнения, по которому можно судить о том, насколько велика полученная мера.

Данный подход, при котором в качестве искомых значений независимых параметров принимаются значения, минимизирующие приведенную выше статистику, называется методом минимума c2. Для рассматриваемого класса задач он обычно дает оценки, близкие к полученным методом наибольшего правдоподобия. При этом статистика минимизируется в заданных временных точках, для которых имеются результаты наблюдений.

Используемая процедура вычисления оцениваемых параметров состоит из двух этапов. На подготовительном этапе с помощью электронной таблицы типа Microsoftо Excel для указанной системы дифференциальных уравнений кодируется численная схема интегрирования, позволяющая вычислять вероятностные функции pk. Эти функции вычисляются с некоторым заданным временным шагом. Для вычисления решения с приемлемой точностью оказались достаточными методы РунгеКутта [1] (или их эквиваленты). На заключительном этапе запускается процедура численной нелинейной оптимизации, позволяющая получить искомые значения свободных параметров. Эти значения рассматриваются как характеристики влияния наследственности и среды, выявленные в результате наблюдений.

Предлагаемый подход был применен для анализа лонгитюдных данных моно и дизиготных близнецов. Далее он иллюстрируется на примере данных по IQ (WISC) из Московского близнецового лонгитюда1. Были использованы три группы пар разного возраста: монозиготные близнецы (6 лет, 47 пар; 14 лет,

84

37 пар), дизиготные близнецы (6 лет, 47 пар; 14 лет, 33 пары) и неродственные пары (6 лет, 41 пара; 14 лет, 45 пар). Сумма мер соответствия во временных точках 6 и 14 лет минимизировалась посредством выбора следующих свободных параметров:

интенсивностей потоков l06 и m06, которые полагались одними и теми же в диапазоне 06 лет;

интенсивностей потоков l614 и m614, которые полагались одними и теми же в диапазоне 614 лет;

среднеквадратических отклонений sdz и sun, характеризующих начальные распределения IQ в нулевой момент времени.

Время измерялось в годах. Модель была представлена цепью из 12 состояний, как показано на рис. 1. Допустимый интервал разностей IQ внутри пар (от 0 до 60 единиц) был разделен на 12 равных частей.

Рис. 1. Модель, используемая для описания динамики развития близнецов:

xi(i=0,1,…,n) — состояния, λi(i=0,1,…,n1) и μi(i=0,1,…,n) — интенсивности потоков

РЕЗУЛЬТАТЫ

Подбор модели к наблюдаемым данным характеризуется статистиками, представленными в табл. 1. Полученные результаты говорят об очень хорошем соответствии.

Таблица 1

Результаты подбора моделей по наблюдаемым распределениям общего IQ

Возраст, лет

Количество степеней свободы (d.f.)

c2

p

6

14

Всего

29

31

60

19,36

25,09

44,44

0,91

0,76

0,93

Табл. 2 показывает вычисленные оценки искомых параметров. Распределения ожидаемых вероятностей нахождения в том или ином состоянии в начальный момент времени (для дизиготных близнецов и неродственных пар) приведены на рис. 2. Наблюдаемые и ожидаемые вероятности состояний для 6 и 14летних пар представлены на рис. 3. В качестве иллюстрации оценки функций pk(t) для монозиготных близнецов в интервале от 0 до 6 лет показаны на рис. 4.

Чтобы выявить, как среднеквадратические отклонения разностей IQ изменяются во временнόй области, с помощью указанной выше процедуры оптимизации определялись нормальные распределения с нулевым средним, наиболее близкие к распределениям ожидаемых вероятностей в смысле критерия согласия c2. Сравнения оценок для 6 и 14летнего возраста представлены в табл. 3.

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Полученные результаты (см. табл. 3) показывают явную зависимость начальных распределений разностей IQ от степени родства: чем больше степень родства, тем меньше соответствующее среднеквадратическое отклонение (sun>sdz> smz=0). Этот факт не противоречит обычным представлениям о влиянии генетического фактора.

Начальное среднеквадратическое отклонение для дизиготных близнецов составляет

85

Таблица 2

Оценки свободных параметров модели

Вид влияния

Параметр

Значение

Влияние наследственности

Начальное среднеквадратическое отклонение для ДЗ близнецов

Начальное среднеквадратическое отклонение для неродственных пар

7,90

18,56

Влияние среды

Интенсивность дивергенции (06 лет)

Интенсивность конвергенции (06 лет)

Интенсивность дивергенции (614 лет)

Интенсивность конвергенции (614 лет)

0,128

0,206

0,194

0,176

Рис. 2. Распределение ожидаемых вероятностей состояний в начальный момент времени: а — ДЗ близнецы, б — неродственные пары

86

Рис. 3. Ожидаемые и наблюдаемые вероятности состояний как функции разности значений общего показателя интеллекта (GIQ) в паре:

по осям абсцисс — показатели интеллекта, по осям ординат — вероятности;

а — МЗ близнецы — 6 лет, б — МЗ близнецы — 14 лет, в — ДЗ близнецы — 6 лет,

г — ДЗ близнецы — 14 лет, д — неродственные пары — 6 лет,

е — неродственные пары — 14 лет;

— ожидаемые, — наблюдаемые

87

Рис. 4. Функции pk(t) для МЗ близнецов от 0 до 6 лет.

Интервалы состояний показаны в единицах IQ:

05; ······· 510; 1015; 1520

Таблица 3

Среднеквадратические отклонения нормально распределенных разностей общего IQ в различные моменты времени

Тип пар

Возраст, лет

Среднеквадратические отклонения в единицах IQ

МЗ близнецы

0

6

14

0

6,39

10,97

ДЗ близнецы

0

6

14

7,90

9,09

12,93

Неродственные пары

0

6

14

18,56

18,04

20,47

43 % этой величины для неродственных пар (в других исследованиях его значение находилось в диапазоне 4060 %). В дальнейших исследованиях представляет интерес выявление связи этого параметра и коэффициента корреляции близнецовой пары.

Как правило, воздействие среды приводит к «размыванию » начальных распределений: чем больше прошедший промежуток времени, тем больше текущее среднеквадратическое отклонение. Единственное исключение в случае шестилетних неродственных пар может быть объяснено статистическими ошибками, обусловленными ограниченностью выборки.

Оценки интенсивностей потоков событий (см. табл. 2) показывают, что до школы (до шестилетнего возраста) среда в большей мере способствует конвергенции IQ, чем дивергенции. В школе (после шестилетнего возраста) ситуация меняется на прямо противоположную. Можно также отметить, что после поступления в школу плотность дивергенции возрастает, в то время как плотность конвергенции убывает.

Чтобы выяснить, насколько могут изменяться оцениваемые независимые параметры при изменении длин интервалов состояний, по результатам расширенной выборки2 (119 монозиготных пар, 90 дизиготных пар) были выполнены две соответствующие оценки для

88

Таблица 4

Сравнение оценок независимых параметров для моделей с интервалами состояний длиной в 5 и 10 единиц (14летние пары)

Параметр

Состояние с интервалом в 5 единиц (модель 1)

Состояние с интервалом в 10 единиц (модель 2)

Процентное соотношение

Начальное с.к.о.* для ДЗ близнецов

Начальное с.к.о. для неродственных пар

Конечное с.к.о. для МЗ близнецов

Конечное с.к.о. для ДЗ близнецов

Конечное с.к.о. для неродственных пар

Интенсивность дивергенции

Интенсивность конвергенции

10,85

21,28

9,70

13,82

22,89

0,027

0,029

12,71

22,57

9,86

15,09

22,94

0,151

0,185

85

94

98

92

99,8

18

15

* с.к.о. — среднеквадратическое отклонение.

14летних близнецов. Их результаты, относящиеся к 5 и 10единичным интервалам, показаны в табл. 4. Можно видеть, что различие в начальных среднеквадратических отклонениях не превышает 615 %. Учитывая длину интервалов состояний, такое согласование результатов может рассматриваться как хорошее. Сравнение интенсивностей потоков явно указывает на то, что зависимость между размерами интервалов состояний и интенсивностями носит нелинейный характер.

Табл. 5 показывает, какую часть начальная дисперсия для различных типов пар составляет в конечной дисперсии. В рамках рассматриваемой модели эти данные позволяют сделать важный вывод: одно и то же воздействие среды (представленное интенсивностями потоков событий) может давать различные вклады в конечные дисперсии. Величины этих вкладов зависят от генетического фактора, представленного распределениями анализируемого параметра в момент рождения.

Таблица 5

Начальная дисперсия для различных типов пар, % от конечной

Тип пар

Начальная дисперсия, % от конечной

МЗ близнецы

ДЗ близнецы

Неродственные пары

0

37

82

В целом полученные результаты свидетельствуют о перспективности предложенного метода анализа динамики средовых влияний на психологические характеристики в ходе онтогенеза. Действительно, такие характеристики, как интенсивности потоков событий, существенно отличаются от величин, используемых при традиционном конфирматорном факторном анализе, и не могут быть вычислены с его помощью. Поэтому предлагаемый подход позволяет глубже исследовать проблему.

1. Бахвалов Н.С. Численные методы. М.: Наука, 1975. С. 447459.

2. Овчаров Л.А. Прикладные задачи теории массового обслуживания. М.: Машиностроение, 1969. С. 3134, 5366.

3. Boomsma D.I., Martin N.G., Molenaar P.C.M. Factor and simplex models for repeated measures: Application to two psychomotor measures of alcohol sensitivity in twins // Behav. Gen. 1989. N 19. P. 7996.

4. Joreskog K.G. Factor analysis by least squares and maximumlikelihood method // Enslein K., Ralston A., Wilf H.S. (eds). Statistical methods for digital computers. N.Y.: Wiley, 1977. P. 125 153.

89

5. Kuravsky L.S., Malykh S.B. On the application of queuing theory for analysis of twin data // Twin Research. 2000. N 3. P. 9298.

6. Martin N., Eaves L. The genetical analysis of covariance structures // Heredity. 1977. N 38. P. 7995.

7. Neale M.C., Cardon L.R. Methodology for genetic studies of twins and families. Dordrecht, the Netherlands: Kluwer Acad. Publ., 1992.

Поступила в редакцию 25.XII 2000 г.

1 Московский близнецовый лонгитюд проводится лабораторией возрастной психогенетики Психологического института РАО.

2 В нее вошли близнецы, впервые включенные в экспериментальную выборку в 14 лет.


Источник: hr-portal.ru