Генетическая лотерея - Страница 35
Если же говорить о ДНК тестах не с точки зрения технологии, а интерпретации генетических данных, то все зависит от компании и ее политики. Компании сами выбирают исследования, которые хотят использовать для интерпретации данных пользователя и выдачи ему каких-либо результатов.
Стоит отметить, что разные исследования имеют разную доказательность и статистическую ценность, поэтому не всегда огромное количество признаков в интерпретации той или иной компании говорит о том, что это хороший тест. Напротив, это может быть продукт использования всего, что доступно научному сообществу, без грамотного статистического подхода и фильтрации.
Также необходимо отметить, что ДНК-тесты, основанные на секвенировании и генотипировании на ДНК-микрочипах, не являются легальным инструментом установления родственных связей, как и не могут быть использованы для анализа некоторых заболеваний (например, спинальной мышечной атрофии). Эти тесты скрининговые, то есть не несут медицинской значимости и не могут быть использованы врачом при принятии клинически важных решений. При наличии узкого запроса и подозрении на наличие генетического заболевания необходимо использовать диагностические исследования в клинико-диагностических лабораториях при направлении лечащего врача.
Точны ли ДНК-тесты?
ДНК-тестирование за последнее десятилетие широко вошло в жизнь сотен миллионов людей в развитых странах. Компании, предоставляющие услуги генетического тестирования, предлагают множество разнообразных отчетов о наследственных заболеваниях, наследственных рисках, онкологических рисках, влиянию генетики на успешность лечения, различных физиологических особенностях и признаках, частично или полностью зависящих от генетической составляющей. Помимо банального интереса к фактам, которые можно узнать по результатам тестирования и за небольшие деньги, генетические тесты иногда помогают в буквальном смысле спасти жизнь человека, определив наличие, например, какой-либо мутации, связанной с развитием онкологических заболеваний, или с риском серьезных побочных эффектов при применении наркоза или лечения онкологического заболевания, тем самым помогая заранее предпринять действия по сохранению здоровья и снижению рисков.
Однако при всем этом иногда возникают ситуации ложноположительного определения каких-либо генетических мутаций, которые, согласно научным данным, приводят к развитию заболевания, скажем, еще в детском возрасте, в то время как тест сдал здоровый взрослый человек без клинических проявлений. Такие ситуации вызывают вопросы по поводу точности генетических тестов и степени доверия к ним. В этой главе мы попробуем раз и навсегда обозначить некоторые ключевые моменты, касающиеся качества генетического тестирования.
Начнем с одной из двух технологий, широко используемой некоторыми компаниями в продвинутых и недешевых тестах, – секвенированием следующего поколения (Next Generation Sequencing, NGS). Используемая технология производит многократное «чтение» фрагментов ДНК, где каждое прочтение (так называемый рид) имеет длину от 100 до 150 нуклеотидов («букв» ДНК). Подавляющая часть всех нуклеотидов в геноме оказывается прочитана много раз, а количество раз называется покрытием. Среднее покрытие по геному 30х говорит о том, что в среднем каждая «буква» генома была прочитана 30 раз.
На изображении ниже приведена иллюстрация того, как выглядят результаты секвенирования после выравнивания на референсный геном – определения участка генома, который был прочитан в каждом конкретном прочтении. Прочтения выглядят как серые горизонтальные полоски и в данном случае имеют длину 100 нуклеотидов. Количество таких прочтений, покрывающих каждый нуклеотид референсного генома (последовательность приведена в нижней части изображения) является покрытием. Например, позицию в геноме, обозначенную черным цветом, покрывает 44 прочтения (на экране видны не все 44), значит покрытие этой позиции – 44х.
Теперь еще раз обратим внимание на эту позицию – во всех прочтениях был обнаружен нуклеотид Т, что говорит о том, что в этом месте у человека есть замена референсного нуклеотида С на Т в гомозиготном состоянии (то есть генотип в этой позиции – Т/Т). Скорее всего, человек унаследовал вариант Т и от матери, и от отца. Сомнений здесь быть в целом не может. Однако посмотрим на другую позицию, выделенную темно-серым цветом. Из 42 прочтений, покрывающих эту позицию, 1 прочтение имеет нуклеотид А, в то время как другие имеют референсный нуклеотид G. С некоторой долей вероятности по этим данным можно предположить, что это ошибка секвенирования. Согласно исследованиям и спецификациям оборудования, например, компании Illumina, лидера в области лабораторного оборудования для генетических исследований, такие ошибки происходят с частотой 0,1–0,5 %, то есть на 1000 прочитанных нуклеотидов от 1 до 5 могут быть прочитаны неверно. Однако здесь нужно отметить, что многократное прочтение одного и того же участка в геноме многократно снижает вероятность определения неверного генотипа для этого локуса.
Наш пример ниже с неверно определенным нуклеотидом А в 1 из 42 ридов никак не повлияет на определение генотипа (G/G), так как биоинформатические программы, обрабатывающие такие данные, умеют находить и исключать такие ошибки секвенирования. Более того, каждый прочитанный нуклеотид в каждом прочтении имеет показатели качества, которые говорят о том, насколько система секвенирования была уверена в верности прочтения нуклеотида. Эти показатели также используется в биоинформатических программах, определяющих генотипы, еще больше снижая вероятность ошибок. В конце концов, алгоритмы финальной фильтрации данных вообще исключают участки с недостаточно хорошими показателями качества, позволяя быть максимально уверенными в конечном результате (рис. 13).
Рис. 13. Результаты секвенирования после выравнивания на референсный геном.
В секвенировании всегда нужно помнить о том, что на верность определения генотипа влияет огромное количество факторов, в том числе генетические контекст. Определить генетическую вариацию в генетически сложном регионе (например, длинной повторяющейся последовательности нескольких нуклеотидов) достаточно сложно, и вероятность ошибки для таких вариаций существенно выше. В целом нужно понимать, что такого рода генетические тесты являются скрининговыми, и в случае обнаружения каких-либо серьезных генетических изменений результат требует валидации методами так называемого золотого стандарта – ПЦР или секвенирование по Сэнгеру. Этим занимаются специализированные лаборатории, имеющие аккредитацию.
В случае обычных генетических тестов, выполняемых на ДНК микрочипах, ошибки составляют менее 1 процента всех прогенотипированных локусов, что подтверждается многочисленными исследованиями качества генотипирования различных чипов, в основном изготавливаемых компанией Illumina. Как и в случае с секвенированием, вероятность ошибки зависит от генетического контекста:
1. однонуклеотидные замены (например, A->G) имеют меньшую частоту ошибки, чем инсерции и делеции;
2. мультинуклеотидные замены (например, A->G,C) имеют вероятность ошибки выше, чем однонуклеотидные;
3. замены, располагающиеся в генетически сложных регионах, имеют более высокую вероятность ошибки, чем все остальные типы генетических вариаций.
В общем, можно сказать, что, как и в любом другом научном методе, вероятность ошибки никогда не бывает нулевой, но она минимизирована максимально в соответствии с доступными на данный момент технологиями лабораторного анализа и анализа данных. Все тесты являются скрининговыми, то есть позволяют дешево проанализировать огромное количество локусов генома. Найденные подозрительные и клинически значимые изменения нужно валидировать методами золотого стандарта, которые на порядки дороже в пересчете на один участок генома, однако позволяют установить истину.