Genome Database (GDB)
Крупнейшей базой данных по структуре генома человека является GDB (Genome Data Base) , созданная и поддерживаемая в университете Дж. Гопкинса (Балтимор, США). Кроме известных последовательностей нуклеотидов генома человека в ней хранится вся получаемая информация о генетических маркерах, зондах и контигах, ассоциированных с генетическими заболеваниями. Проводятся работы по включению в базу данных результатов физического картирования генома. Поддерживается база данных по менделевскому наследованию у человека ( Online Mendelian Inheritance in Man Database ), которая представляет собой каталог наследуемых признаков и наследственных заболеваний человека.
К сентябрю 1994 г. Genome Database (GDB) включала 6691 STR- сайтов, и 3752 из них (56%) имели уровень гетерозиготности более 60%. Карты сцепления для индексных маркеров сконструированы в основном по результатам генотипирования 40 СЕРН-референтных семей.
Среднее расстояние между соседними маркерами варьирует от 2 сМ для хромосомы 21 до 5 сМ для самых крупных хромосом с очень небольшим числом участков в геноме с расстоянием между маркерами большим, чем 10 сМ. GDB содержит 672 гена, локализованных на картах сцепления индексных маркеров, из общего числа 3485 клонированных генов [ Gyapay G. et al., 1994 ].
Созданные достаточно подробные геномные карты сцепления молекулярных маркеров в масштабах 13,0, 5,0 и даже 2,9 сМ; автоматизация процесса генотипирования маркерных микросателлитных (STR) аллелей; большое число уже картированных структурных генов, анонимных ДНК-последовательностей значительно упрощают и ускоряют процесс генетического картирования. Если в 1992 г. в распоряжении исследователей были только 814 динуклеотидных полиморфных сайтов [ Weissenbach J. et al., 1992 ], то уже к маю 1994 г. их число возросло до 3300 [ Gyapay G. et al., 1994 ], а к концу года - до 5000 - 6000 [ Shmitt К., Goodfellow P.N., 1994 ].
Столь же быстрыми темпами нарастает число молекулярных маркеров и в геноме лабораторных мышей [ Service R.F., 1994 ]. По всей видимости, человек и лабораторная мышь будут первыми млекопитающими с полностью расшифрованными геномами.
Четыре другие базы данных хранят все известные последовательности нуклеотидов, включая последовательности нуклеотидов генома человека: GenBank и Genome Sequence Data Base (GSDB) в США, European Molecular Biology Laboratory (EMBL) Nucleotide Sequence Database в Великобритании, а также DNA Data Bank of Japan (DDBJ) . В этих базах данных в 1996 году хранилось около 200 м.п.о. последовательностей нуклеотидов, предоставленных как самими авторами, так и вводимых из статей, опубликованных в периодических изданиях.
В России Институтом молекулярной биологии РАН поддерживается аналогичная база данных по геному человека ( Hugene ). Основной международной базой данных по последовательностям аминокислот является Protein Identification Resource (Швейцария).