Диагностика наследственных опухолевых синдромов методом высокопроизводительного секвенирования. Опыт создания базы данных
Автор: Абрамов Иван Сергеевич, Лисица Татьяна Сергеевна, Строганова Анна Михайловна, Рябая Оксана Олеговна, Данишевич Анастасия Михайловна, Хахина Анастасия Олеговна, Закаморная Анастасия Ивановна, Мацвай Алина Дмитриевна, Шипулин Герман Александрович
Журнал: Клиническая практика @clinpractice
Рубрика: Оригинальные исследования
Статья в выпуске: 3 т.12, 2021 года.
Бесплатный доступ
Обоснование. Ежегодно в Российской Федерации регистрируются более 500 тыс. новых случаев злокачественных новообразований, из них более 50 тыс. обусловлено наследственными формами. Своевременная диагностика данных форм позволит выявлять онкологические заболевания на ранних стадиях и своевременно проводить лечебно-профилактические мероприятия. Цель исследования - профилактика и ранняя диагностика наследственных форм онкологических заболеваний путем создания базы данных и разработки программного обеспечения для анализа данных таргетного высокопроизводительного секвенирования. Методы. В исследование вошли 636 образцов ДНК, полученных от пациентов, у которых установлено онкологическое заболевание с высокой вероятностью наследственной природы или отягощенное семейным анамнезом. ДНК выделяли из лимфоцитов периферической крови. Подготовку библиотек ДНК осуществляли с использованием панели зондов KAPA Hyper (Roche). Панель включала в себя зонды для таргетного обогащения кодирующей части 44 генов. Высокопроизводительное секвенирование проводили на платформе MiSeq (Illumina). Результаты. Выявлено 65 патогенных/вероятно патогенных вариантов нуклеотидной последовательности у 96 пациентов в генах ATM, BLM, BRCA1, BRCA2, CHEK2, EPCAM, MEN1, MLH1, MSH2, MSH3, MSH6, MUTYH, PALB2, TP53. Выявлено также 2858 вариантов нуклеотидной последовательности с неизвестным клиническим значением. Заключение. Создана локальная база данных генетических вариантов, содержащая клинико-анамнестические данные. В настоящий момент в базу депонировано 4763 варианта нуклеотидной последовательности, из них 2522 - уникальные варианты, выявленные у 1 пациента.
Наследственные опухолевые синдромы, таргетное секвенирование, база данных
Короткий адрес: https://sciup.org/143177883
IDR: 143177883 | DOI: 10.17816/clinpract76383
Текст научной статьи Диагностика наследственных опухолевых синдромов методом высокопроизводительного секвенирования. Опыт создания базы данных
Submitted 22.07.2021 Revised 26.08.2021 Published 02.09.2021
патогенных мутаций в исландских, французских, канадских, африканских, американских, польских и латиноамериканских популяционных группах [2, 3]. Выявлены драйверные мутации при раке молочной железы (РМЖ) и раке яичников в крупных исследованиях популяций евреев-ашкенази, скандинавских народов (норвежцы, финны). Менее масштабные исследования проводили в Бразилии [4]. В странах Азиатского региона (Бангладеш, материковый Китай, Гонконг, Индонезия, Япония, Корея, Малайзия, Филиппины, Сингапур, Таиланд, Вьетнам и этнические азиаты Канады и США) выявляется 7–10% РМЖ в составе наследственных синдромов [5]. Группа ученых из США провела масштабное исследование мутаций, ответственных за развитие наследственных РМЖ, рака яичников, синдрома Линча. Проанализировано 25 генов с изучением семейных историй, включающих диа- гноз на момент исследования и анамнез заболеваний в прошлом. У 6,8% (17 000) обследованных лиц из 252 223 включенных в исследование была обнаружена по меньшей мере одна патогенная мутация [6]. В России также проводятся исследования популяционной частоты клинически значимых вариантов при онкологических заболеваниях [7]. Такая работа наглядно демонстрирует необходимость применения комплексного метода диагностики генетических нарушений, основанного не только на общепризнанных данных о популяционной частоте и устоявшихся описаниях наследственных синдромов, но и на анализе более широкой выборки генов у лиц группы риска с целью определения собственной популяционной частоты и создания национального реестра мутаций.
Цель исследования — профилактика и ранняя диагностика наследственных форм онкологи-

кт ГА
ческих заболеваний путем создания базы данных и разработки программного обеспечения для анализа данных таргетного высокопроизводительного секвенирования.
МЕТОДЫ
Клинико-анамнестическая характеристика образцов
Дизайн панели зондов для таргетного секвенирования кодирующих участков генов
Для создания таргетной панели нами были отобраны 44 гена (APC, ATM, AXIN2, BARD1, BLM, BMPR1A, BRCA1, BRCA2, BRIP1, CDH1, CDKN2A, CHEK2, DICER1, EPCAM, GALNT12, GREM1, MEN1, MLH1, MLH3, MSH2, MSH3, MSH6, MUTYH, NBN, NF1, NTHL1, PALB2, PMS2, POLD1, POLE, PTCH1, PTCH2, PTEN, RAD51C, RAD51D, RET, SMAD4, STK11, SUFU, TP53, TSC1, TSC2, VHL, WT1), ассоциирован- ных с развитием основных опухолевых синдромов. Далее с помощью онлайн-сервиса HyperDesign от компании Roche (США) был проведен биоинформа-тический дизайн панели ДНК-зондов, включающий кодирующие участки данных генов, сайты сплайсинга, 5’-UTR области.
Подготовка ДНК-библиотек и высокопроизводительное секвенирование
Выделение ДНК из лимфоцитов проводили с помощью набора QIAamp DNA Blood Mini Kit (Qiagen, Германия). Пробоподготовку библиотек осуществляли с помощью набора KAPA HyperPrep Kit (Roche) по стандартному протоколу. Гибридизацию с таргетной панелью проводили также по стандартному протоколу Hyper (Roche). В качестве секвени-рующей платформы была использована система MiSeq (Illumina, США), версия химии MiSeq Reagent Kit v2 500-cycles, позволяющая анализировать за один запуск до 96 библиотек.
Биоинформатическая обработка данных секвенирования
Генерация FastQ-файлов выполнялась с использованием программного обеспечения Illumina v2.4. Дальнейшая обработка данных проведена с использованием алгоритма, включающего выравнивание прочтений на референсную последовательность генома человека GRCh38 с помощью программного пакета BWA (burrows-wheeler-alignment), сортировку по координате, дедупликацию и повторное выравнивание с помощью сервиса Picard-tools, выявление вариантов нуклеотидной последовательности и фильтрацию вариантов по качеству с помощью GATK v4.1.8.1. Аннотацию выявленных вариантов по всем транскриптам для каждого гена из базы RefSeq, оценку популяционных частот с использованием выборки проектов Genome aggregation database (gnomAD), Exome Aggregation Consortium (ExAC), оценку влияния с применением ряда методов предсказания патогенности замен (SIFT, PolyPhen2-HDIV, PolyPhen2-HVAR), а также методов расчета эволюционной консервативности позиции (PhyloP, PhastCons) проводили при помощи программы OpenCravat. Классификация вариантов нуклеотидной последовательности проводилась на основании рекомендаций по интерпретации результатов высокопроизводительного секвенирования (NGS) American College of Medical Genetics and Genomics (ACMG) и сервиса Varsome.
Этическая экспертиза
Письменное информированное согласие было получено от всех пробандов, участвующих в исследовании. Все образцы были обезличены до получения исследовательской группой. В данном исследовании не используются идентифицируемые биологические образцы и не приводятся какие-либо конфиденциальные данные. Следовательно, согласно правилам этического комитета и национальным нормам, этот проект не требует этического одобрения.
РЕЗУЛЬТАТЫ
В результате анализа выявлено 65 патогенных вариантов нуклеотидной последовательности у 96 пациентов в генах ATM , BLM , BRCA1 , BRCA2 , CHEK2 , EPCAM , MEN1 , MLH1 , MSH2 , MSH3 , MSH6 , MUTYH , PALB2 , TP53 (табл. 1). Выявлено также 2858 вариантов нуклеотидной последовательности с неизвестным клиническим значением.
<линическая 2021 п эакти keu Том 12 №3
ОБСУЖДЕНИЕ
Наиболее часто встречались патогенные варианты в генах BRCA1 и BRCA2 — у 37 и 27 пациентов соответственно. Самый распространенный вариант c.5266dup, p.Gln1756ProfsTer в гене BRCA1, также известный как 5382insC, был выявлен у 17 пациентов с РМЖ, двусторонним РМЖ, раком яичников, что соответствует данным, полученным ранее другими исследовательскими группами [7]. В гене BRCA2 мажорных мутаций на основании полученных данных выделить не удается. Из всех выявленных патогенных вариантов в генах BRCA1 и BRCA2 лишь
Таблица 1 / Table 1
Патогенные варианты нуклеотидной последовательности / Pathogenic variants
Ген |
Координата |
кДНК |
Белок |
Кол-во |
ATM |
chr11:108312424G>T |
c.5932G>T |
p.Glu1978Ter |
2 |
ATM |
chr11:108235784delTTCT |
c.450_453del |
p.Ser151Ter |
1 |
ATM |
chr11:108335105T>C |
c.8147T>C |
p.Val2716Ala |
1 |
BLM |
chr15:90761015C>T |
c.1642C>T |
p.Gln548Ter |
2 |
BLM |
chr15:90763016C>T |
c.1933C>T |
p.Gln645Ter |
1 |
BRCA1 |
chr17:43057063insG |
c.5266dup |
p.Gln1756ProfsTer74 |
17 |
BRCA1 |
chr17:43091496delT |
c.4035del |
p.Glu1346LysfsTer20 |
3 |
BRCA1 |
chr17:43071225G>C |
c.4689C>G |
p.Tyr1563Ter |
2 |
BRCA1 |
chr17:43106487A>C |
c.181T>G |
p.Cys61Gly |
2 |
BRCA1 |
chr17:43045767G>A |
c.5503C>T |
p.Arg1835Ter |
1 |
BRCA1 |
chr17:43057078G>A |
c.5251C>T |
p.Arg1751Ter |
1 |
BRCA1 |
chr17:43067608C>G |
c.5074G>C |
p.Asp1692His |
1 |
BRCA1 |
chr17:43091772delAGAC |
c.3756_3759del |
p.Ser1253ArgfsTer10 |
1 |
BRCA1 |
chr17:43091827delTTTAC |
c.3700_3704del |
p.Val1234GlnfsTer8 |
1 |
BRCA1 |
chr17:43092280delAGCAT |
c.3247_3251del |
p.Met1083Ter |
1 |
BRCA1 |
chr17:43093570insT |
c.1961dup |
p.Tyr655ValfsTer18 |
1 |
BRCA1 |
chr17:43094021delG |
c.1510del |
p.Arg504ValfsTer28 |
1 |
BRCA1 |
chr17:43094023delTTTAA |
c.1504_1508del |
p.Leu502AlafsTer2 |
1 |
BRCA1 |
chr17:43094731G>C |
c.800C>G |
p.Ser267Ter |
1 |
BRCA1 |
chr17:43104242delA |
c.321del |
p.Phe107LeufsTer12 |
1 |
BRCA1 |
chr17:43115780C>G |
c.81-1G>C |
- |
1 |
BRCA1 |
chr17:43124028delCT |
c.68_69del |
p.Glu23ValfsTer17 |
1 |
BRCA2 |
chr13:32337161delAAAC |
c.2808_2811del |
p.Ala938ProfsTer21 |
2 |
BRCA2 |
chr13:32340757delTAACT |
c.6405_6409del |
p.Asn2135LysfsTer3 |
2 |
BRCA2 |
chr13:32362596A>T |
c.7879A>T |
p.Ile2627Phe |
2 |
BRCA2 |
chr13:32380136delA |
c.9253del |
p.Thr3085GlnfsTer19 |
2 |
BRCA2 |
chr13:32316528G>A |
c.67+1G>A |
- |
1 |
BRCA2 |
chr13:32326104delT |
c.429del |
p.Val144LeufsTer8 |
1 |
BRCA2 |
chr13:32326143insT |
c.468dup |
p.Lys157Ter |
1 |
BRCA2 |
chr13:32330933delT |
c.700del |
p.Ser234ProfsTer7 |
1 |
BRCA2 |
chr13:32332779delAAAG |
c.1310_1313del |
p.Lys437IlefsTer22 |
1 |

Таблица 1 Окончание / End of Table 1
Ген |
Координата |
кДНК |
Белок |
Кол-во |
BRCA2 |
chr13:32336624delA |
c.2272del |
p.Ser758ValfsTer14 |
1 |
BRCA2 |
chr13:32337006delCAGA |
c.2653_2656del |
p.Asp885MetfsTer9 |
1 |
BRCA2 |
chr13:32337522delAAAA |
c.3167_3170del |
p.Gln1056ArgfsTer3 |
1 |
BRCA2 |
chr13:32339548delTC |
c.5197_5198del |
p.Ser1733ArgfsTer9 |
1 |
BRCA2 |
chr13:32339593insT |
c.5238dup |
p.Asn1747Ter |
1 |
BRCA2 |
chr13:32339641delT |
c.5286T>G |
p.Tyr1762Ter |
1 |
BRCA2 |
chr13:32340073delCT |
c.5722_5723del |
p.Leu1908ArgfsTer2 |
1 |
BRCA2 |
chr13:32340301delT |
c.5946del |
p.Ser1982ArgfsTer22 |
1 |
BRCA2 |
chr13:32340824C>T |
c.6469C>T |
p.Gln2157Ter |
1 |
BRCA2 |
chr13:32340848delT |
c.6494del |
p.Leu2165TrpfsTer3 |
1 |
BRCA2 |
chr13:32357845G>A |
c.7721G>A |
p.Trp2574Ter |
1 |
BRCA2 |
chr13:32370955G>A |
c.8488-1G>A |
- |
1 |
BRCA2 |
chr13:32371044delAA |
c.8578_8579del |
p.Lys2860GlufsTer8 |
1 |
BRCA2 |
chr13:32380147T>C |
c.9256+2T>C |
- |
1 |
CHEK2 |
chr22:28725242C>T |
c.444+1G>A |
- |
2 |
CHEK2 |
chr22:28725254G>A |
c.433C>T |
p.Arg145Trp |
2 |
CHEK2 |
chr22:28695134insT |
c.1368dup |
p.Glu457ArgfsTer33 |
1 |
EPCAM |
chr2:47375237G>A |
c.429G>A |
p.Trp143Ter |
1 |
MEN1 |
chr11:64810109T>C |
c.1A>G |
p. Met1Val |
1 |
MLH1 |
chr3:37047632delGAA |
c.1852_1854del |
p.Lys618del |
2 |
MLH1 |
chr3:37042331G>A |
c.1731G>A |
p.Ser577Ser |
1 |
MSH2 |
chr2:47414411delT |
c.939del |
p.Gln314ArgfsTer17 |
1 |
MSH3 |
chr5:80813614G>T |
c.2686G>T |
p.Gly896Ter |
1 |
MSH6 |
chr2:47799403insGT |
c.1421_1422dup |
p.Gln475CysfsTer7 |
1 |
MUTYH |
chr1:45331556C>T |
c.1103G>A |
p.Gly368Asp |
6 |
MUTYH |
chr1:45332310C>T |
c.705G>A |
p.Trp235Ter |
1 |
MUTYH |
chr1:45332780G>A |
c.475C>T |
p.Gln159Ter |
1 |
PALB2 |
chr16:23637886delACAA |
c.172_175del |
p.Gln60ArgfsTer7 |
2 |
PALB2 |
chr16:23636036delTC |
c.509_510del |
p.Arg170IlefsTer14 |
1 |
TP53 |
chr17:7674220C>T |
c.743G>A |
p.Arg248Gln |
1 |
TP53 |
chr17:7674872T>C |
c.659A>G |
p.Tyr220Cys |
1 |
TP53 |
chr17:7675124T>C |
c.488A>G |
p.Tyr163Cys |
1 |
TP53 |
chr17:7675139C>T |
c.473G>A |
p.Arg158His |
1 |
TP53 |
chr17:7673821G>A |
c.799C>T |
p.Arg267Trp |
1 |
<линическая 2021 п эакти keu Том 12 №3
-
4 входят в стандартные панели распространенных тест-систем в России.
У нескольких пациентов выявлено также сочетание двух патогенных вариантов: у пациентки с РМЖ выявлены мутации c.321del, p.Phe107LeufsTer в гене BRCA1 и c.1933C>T, p.Gln645Ter в гене BLM ; у пациентки с диагнозом первично-множественных злокачественных новообразований (рак щитовидной железы, РМЖ, рак маточной трубы) выявлены мутации c.5503C>T, p.Arg1835Ter в гене BRCA1 и c.172_175del, p.Gln60ArgfsTer в гене PALB2 ; у пациентки с диагнозом первично-множественных злокачественных новообразований (рак эндометрия, РМЖ) выявлены мутации c.1421_1422dup, p.Gln475CysfsTer в гене MSH6 и c.7879A>T, p.Ile2627Phe в гене BRCA2 . У 9 пациентов выявлено сочетание мутации в генах BRCA1 , BRCA2 , MLH1 , MSH3 , EPCAM с вариантом c.470T>C, p.Ile157Thr в гене CHEK2 . У пациентов с диагнозом РМЖ и РМЖ в сочетании с лейомиосаркомой были выявлены патогенные варианты в гене TP53 . Все вышеперечисленное подчеркивает актуальность исследования кодирующей последовательности данных генов, в том числе при проведении предварительной ПЦР-диа-гностики.
ЗАКЛЮЧЕНИЕ
Создана локальная база данных генетических вариантов, и соответствующих им клинико-анамнестических данных. По мере дополнения базы данных новыми данными секвенирования будет проводиться дальнейшая статистическая и клиническая характеристика выявленных генетических вариантов. В перспективе накопленные данные могут быть использованы как для анализа эпидемиологии онкологических заболеваний, так и разработки тест-систем, актуальных для российской популяции.
ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ
Вклад авторов. Строганова А.М., Рябая О.О., Данишевич А.М. — сбор образцов и клинико-анамнестическая характеристика; Хахина А.О., Зака-морная А.И. — экспериментальная часть работы; Абрамов И.С., Лисица Т.С., Мацвай А.Д., Шипулин Г.А. — планирование и контроль экспериментов, обработка данных, написание и рецензирование статьи. Авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией).
Author contribution. Stroganova A.M., Rya-baya O.O., Danishevich A.M. — collection of samples and anamnestic characteristics; Khakhina A.O., Zaka-mornaya A.I. — the experimental part; Abramov I.S., Lisitsa T.S., Matsvai A.D., Shipulin G.A. — planning and control of experiments, data processing, writing and reviewing the article. The authors made a substantial contribution to the conception of the work, acquisition, analysis, interpretation of data for the work, drafting and revising the work, final approval of the version to be published and agreeing to be accountable for all aspects of the work.
Источник финансирования. Исследование выполнено в рамках государственного задания № 388-00102-20-01/388-00154-21-00.
Funding source.
The study was done with a support of the state assignment № 388-00102-20-01/ 388-00154-21-00
Список литературы Диагностика наследственных опухолевых синдромов методом высокопроизводительного секвенирования. Опыт создания базы данных
- Имянитов Е.Н. Общие представления о наследственных опухолевых синдромах // Практическая онкология. 2014. Т. 15, № 3. С. 101-106.
- Biller LH, Syngal S, Yurgelun MB. Recent advances in Lynch syndrome. Fam Cancer. 2019;18(2):211-219. DOI: 10.1007/s10689-018-00117-1
- Haraldsdottir S, Rafnar F, Frankel WL, et al. Comprehensive population-wide analysis of Lynch syndrome in Iceland reveals founder mutations in MSH6 and PMS2. Nat Commun. 2017;8(1):14755. DOI: 10.1038/ncomms14755
- Felix GE, Abe-Sandes C, Machado-Lopes TM, et al. Germline mutations in BRCA1, BRCA2, CHEK2 and TP53 in patients at high-risk for HBOC: characterizing a Northeast Brazilian Population. Hum Genome Var. 2014;1:14012. DOI: 10.1038/hgv.2014.12
- Kwong A, Shin VY, Ho JC, et al. Comprehensive spectrum of BRCA1 and BRCA2 deleterious mutations in breast cancer in Asian countries. J Med Genet. 2016;53(1):15-23. DOI: 10.1136/jmedgenet-2015-103132
- Rosenthal ET, Bernhisel R, Brown K, et al. Clinical testing with a panel of 25 genes associated with increased cancer risk results in a significant increase in clinically significant findings across a broad range of cancer histories. Cancer Genet. 2017; 218-219:58-68. DOI: 10.1016/j.cancergen.2017.09.003
- Никитин А.Г., Бровкина О.И., Ходырев Д.С., и др. Опыт создания публичной базы данных мутаций oncoBRCA: биоинформационные проблемы и решения // Клиническая практика. 2020. Т. 11, № 1. С. 21-29. DOI: 10.17816/clinpract25860