Ген PS-1: позиционное клонирование
Расположение искомого гена в области 14q24.3 позволило определить несколько известных генов-кандидатов, локализованных ранее на длинном плече хромосомы 14. К наиболее вероятным были отнесены:
- ген катепсина G (лизосомная сывороточная протеаза),
- ген а-1-антихимотрипсина (ААСТ) (потенциальный ингибитор протеаз и один из компонентов амилоидных бляшек),
- ген с-/оу-ген, экспрессия которого в гиппокампе больных БА нарушена.
Эти гены были исключены при анализе генетического сцепления или путем прямого секвенирования данных генов, показавших отсутствие мутаций у больных БА [ Rogaev ea 1993 ]. Для поиска новых генов необходимо было последовательно решить следующие задачи:
1) максимально сузить потенциальную область хромосомы, содержащую FAD3- ген в области 14q24.3;
2) построить физическую карту (контиг), перекрывающую генетическую карту FAD3 локуса;
3) клонировать все экзоны потенциальных генов или кДНК, локализованные в области данного контига;
4) осуществить поиск функционально важных мутаций или мутаций, специфически ассоциированных с БА в клонированных генах.
Для того чтобы определить минимальную генетическую и физическую область локализации гена FAD3, мы исследовали сегрегацию более восемнадцати дополнительных STR-маркеров в 6 семьях FAD3, в которых было обнаружено сцепление. Наличие неполной сегрегации (рекомбинации) с какими-либо маркерами со стороны теломеры или, напротив, центромеры, позволяет сужать область потенциальной локализации FAD3, оставляя лишь участок с STR-маркерами, которые показывают полное сцепление с FAD. В результате такого сцепления минимальную генетическую область удалось сузить до -10 сМ между маркерами D14S53 и D14S258 ( рис. 2 ).
Для построения YAC-контига был получен набор YAC-клонов, соответствующих STR-маркерам из данной области (работа выполнена в сотрудничестве с коллегами из СЕРН'а, Париж). Перекрывание YAC-клонов и космид и построение детальной физической карты осуществляли различными традиционными методами, включая получение профилей А/м- фингерпринтов, определение последовательностей концевых фрагментов, а также локализацию кДНК клонов. Были разработаны также быстрые и эффективные методы перекрывания YAC-клонов и космид, например, с помощью "праймирования" ДНК-клонов со случайными или специфическими олигонуклеотидами при слабых условиях отжига с использованием PCR (неопубликованные данные). В дальнейшем на основе данных по прямой гибридизации in situ космидных проб, соответствующих крайним фланговым STR-маркерам, мы предположили, что физический размер минимальной контиги может быть около 5 Mb. Такой участок может содержать до 100 генов; клонирование и перебор всех генов из такой значительной области представлялся трудноразрешимой задачей. В то же время, дальнейшее сужение минимальной геномной контиги до размеров 1 Mb и 1 сМ представлялось нереальным в связи с недостаточной информативностью и ограниченностью числа семей с БА.
Для разрешения данной проблемы было решено использовать прямой анализ гаплотипов для маркеров в области FAD3 в семьях с БА. Такой анализ позволил установить, что существуют, по крайней мере, два кластера маркеров, с помощью которых показаны идентичные размеры аллелей у больных из разных семей с общим этническим происхождением (например, у евреев-ашкенази или у итальянцев). Можно было предположить, что ген FAD3 с наибольшей вероятностью находится в участке одного из таких кластеров (обозначены как А и В на рис. 2 ). Поэтому в дальнейших опытах по выделению экспрессирующихся последовательностей усилия были сконцентрированы, в первую очередь, на данных участках.
Можно было ожидать, что кодирующие участки ДНК занимают менее 10% области картированного сегмента в FADS-локусе. Выбор стратегии выявления кодирующих участков являлся, таким образом, критическим для успешного обнаружения всех генов в области А и В FADS-локуса. Хотя мы использовали несколько подходов, включая идентификацию CpG-островков, ассоциированных с 5'- участками генов, и "экзон-трэп-пинг", наиболее эффективным оказался метод прямой селекции кДНК.
При данном подходе пул кДНК, приготовленный на тотальной мРНК из клеток головного мозга человека, гибридизовали с геномной ДНК из РАОЗ- локуса (YAC-клоны или космиды), иммобилизованной на нейлоновом фильтре. Дополнительно использовали также и вариант метода с биотинилированием геномных клонов и магнитными бусами. Специфически гибридизующуюся кДНК амплифицировали с помощью PCR и клонировали. Затем каждый клон дополнительно гибридизовали с ДНК YAC-клонов из FAD3 контиги для проверки хромосомной локализации кДНК-последовательности. Таким образом было отобрано около 900 кДНК-клонов из участков А и В и несколько сотен из других районов РАОЗ-контига.
В дальнейшем эти клоны секвенировали и использовали для скрининга кДНК клонотек мозга и других тканей для получения максимально протяженных кДНК-последовательностей. В результате было идентифицировано не менее чем 25 генов из FADS-контига и определена их нуклеотидная последовательность. По меньшей мере 19 независимых протяженных кДНК- последовательностей (>1 kb длины) было выявлено в участках А или В. Лишь три из них представляли ранее известные гены - c-fos-ген, ген дигидролипоамидсукцинилтрансферазы и ген белок-связывающего трансформирующего фактора 2. Для дальнейшего поиска мутаций была использована РНК, выделенная из постмортального материала мозга или клеточных линий фибробластов больных БА.
Хотя на первом этапе было использовано несколько традиционных методов поиска и идентификации мутаций, наиболее успешным и надежным приемом их идентификации в транскриптах явилось прямое секвенирование продуктов RT-PCR и поиска нуклеотидных замен с помощью автоматического секвенатора и соответствующих компьютерных программ (ABI, FASTA). В конечном итоге, после исключения всех генов из участка А, в январе 1995 г. были получены первые убедительные данные, что кДНК- последовательность с лабораторным названием S182 содержит миссенс- мутации, встречающиеся только в родословных FAD3. Впоследствии были обнаружены миссенс-мутации и в ряде других родословных ( рис. 3 ).
Данный ген кодирует аминокислотную последовательность длиной 467 аминокислотных остатков или более короткие варианты - производные альтернативного сплайсинга. Позже гену S182 было дано название гена пресенилина-1 , подчеркивающее, что мутации в данном гене ответственны за ранние (предстарческие, или пресенильные) формы БА [ Sherrington ea 1995 , Rogaev ea 1995 ].