乳腺癌风险基因:对超过113000名女性进行关联分析

作者:DDM
2021-12-16

编译:陈彦丽

【摘要】目的 乳腺癌易感基因的遗传检测被广泛应用,但是目前的研究证据不足以证明某些基因与乳腺癌相关,潜在的风险评估不精确,并缺乏可靠的亚型特异性风险评估。方法 我们设计了一个包含34个潜在易感基因的基因组合,对60,466名女性乳腺癌患者和53,461名对照组个体的样本进行测序。在对这些基因的蛋白截短变体和罕见错义变体的单独分析中,通过统计总体乳腺癌和乳腺癌亚型的比值比(Odds ratios,OR),根据突变区域和致病性分类评估错义变体的相关性。结果 5个基因(ATM、BRCA1、BRCA2、CHEK2和PALB2)的蛋白截短变体与总体乳腺癌风险相关,P值均小于0.0001;其他4个基因(BARD1、RAD51C、RAD51D和TP53)的蛋白截短变体与总体乳腺癌风险相关,P值均小于0.05;另外19个基因的蛋白截短变体,总体乳腺癌OR的95%置信区间上限小于2.0;对于ATM和CHEK2的蛋白截短变体,雌激素受体(ER)阳性乳腺癌的OR高于ER阴性乳腺癌,而对于BARD1、BRCA1、BRCA2、PALB2、RAD51C和RAD51D的蛋白截短变体,ER阴性乳腺癌的OR高于ER阳性乳腺癌,ATM、CHEK2和TP53中的罕见错义变体与总体乳腺癌风险相关,P值小于0.001;BRCA1、BRCA2和TP53的致病性错义变体与总体乳腺癌风险相关,且风险与蛋白截短变体近似。结论 本研究结果定义了对乳腺癌风险预测具有临床应用意义的基因,并提供了与蛋白截短变异相关的肿瘤风险评估的证据,为乳腺癌的遗传咨询提供指导。

乳腺癌风险基因与肿瘤易感性相关的基因检测是临床医疗实践的一部分,目前主要应用于有明显肿瘤家族史的患者,且纳入的基因数量有限。随着低成本测序技术的出现,可以应用包含更多基因的测序panel进行检测,然而一些测序panel包含的基因与肿瘤的相关性仍不明确,且缺乏潜在的风险评估证据。

为了进一步确定与乳腺癌风险相关的基因组合,我们设计了一个由34个已知或疑似乳腺癌易感基因组成的panel,其中包括商业化panel包含的基因。应用这个panel,我们对参加乳腺癌协会联盟(BCAC)研究的60,466名女性乳腺癌患者和53,461名对照组个体进行了胚系DNA测序。利用这些数据,我们评估了与这些基因变异相关的总体乳腺癌和乳腺癌亚型的风险。

一、对象与方法

1. 研究对象:我们纳入了44项BCAC研究中的女性乳腺癌患者和对照组个体的样本作为研究对象。所有研究均获得相关伦理审查委员会的批准。30项基于人群的研究,没有根据家族史选择患者或对照组个体;其余14项为针对有乳腺癌家族史的患者进行的家族性研究。经过质控筛选,本研究共纳入53,461名对照组个体和60,466名女性乳腺癌患者,其中侵袭性乳腺癌54,624例(90.3%)、原位乳腺癌4187例(6.9%)和侵袭性不明的乳腺癌1655例(2.7%)。其中48,826名乳腺癌患者和50,703名对照组个体来自基于人群的研究。

2. 序列分析:我们分析了34个已知或疑似乳腺癌易感基因,其中包括商业化panel提供的基因。

3. 统计分析:首先进行了负荷检验,通过logistic回归评估与某一特定类别的变体相关的乳腺癌OR和95%CI。两个主要类别为蛋白截短变体和罕见错义变体(即群体频率小于0.001的变体)。根据突变区域和致病性分类来评估错义变体的相关性。根据肿瘤亚型、年龄和血统(欧洲vs亚洲)进行分析。

我们分别对基于人群的研究和家族性研究进行了分析。纳入家族性研究,可提高检测相关性的能力,但会导致有偏差的风险评估。因此,我们从基于人群的研究中计算风险评估、95%CI和P值,但也尽量对所有研究进行关联分析。对于每个基因的蛋白截短变体,关联的证据也用Bayesian错误发现概率表示。将特定年龄的估计OR与2016年英国人口发病率相结合,计算绝对风险。

二、研究结果

(一)蛋白截短变体

1. 总体乳腺癌风险:5个基因(ATM、BRCA1、BRCA2、CHEK2和PALB2)的蛋白截短变体与总体乳腺癌的风险显著相关(P<0.0001)(表1、图1、图2),这些基因的OR范围为2.10-10.57。CHEK2的c.1100delC变体约占该基因蛋白截短变体的80%,这一变体的效应值(OR,2.66;95%CI,2.27-3.11;P=1.1x10-33[在所有的研究中,P=5.3x10-53])与CHEK2的所有其他蛋白截短变体的效应值(OR值,2.13;95%CI,1.60-2.84;P=3.0×10-7[在所有的研究中,P=7.4x10-10])无差别(P=0.19)。其他7个基因的蛋白截短变体与总体乳腺癌相关: BARD1(OR,2.09;95%CI,1.35-3.23;P=0.00098[在所有研究中,P=0.00011]), RAD51C(OR,1.93;95%CI,1.20-3.11;P=0.0070[在所有研究中,P=0.00026]), RAD51D(OR,1.80;95%CI,1.11-2.93;P=0.018[在所有研究中,P=0.0018]),PTEN(OR,2.25;95%CI,0.85-6.00;P=0.10[在所有研究中,P=0.0040]),NF1(OR,1.76;95%CI,0.96-3.21;P=0.068[在所有研究中,P=0.011]),TP53(OR,3.06;95%CI,0.63-14.91;P=0.17[在所有研究中,P=0.015]),和MSH6(OR,1.96;95%CI,1.15-3.33;P=0.013 [在所有研究中,P=0.021])(表1)。其中4个基因(BARD1、RAD51C、RAD51D和TP53)的Bayesian错误发现概率均小于0.05(表1)。

16.png

对于以上与总体乳腺癌相关的12个基因,蛋白截短变体的效应值在欧洲女性和亚洲女性之间没有显著差异。在以人群为基础的研究中,其余22个基因,除3个(AKT1、MSH2和STK11)外,其他基因OR的95%CI的上限都小于2.0。

2. 乳腺癌亚型风险:在12个与总体乳腺癌风险相关的基因中,有2个与ER阳性乳腺癌更相关:ATM(ER阳性乳腺癌的OR,2.33[95%CI,1.87-2.91],ER阴性乳腺癌的OR,1.01[95%CI,0.64-1.59];P=0.00055),CHEK2(ER阳性乳腺癌的OR,2.67[95%CI,2.30-3.11],ER阴性乳腺癌的OR,1.64[95%CI,1.25-2.16];P=3.6×10-5)(图2)。CHEK2也与ER阴性且非三阴性乳腺癌相关(OR值,2.53;95%CI,1.75-3.67),但与三阴性乳腺癌不相关(OR值,1.06;95%CI,0.63-1.76)。

女性乳腺癌患者和对照组个体中携带34个基因的蛋白截短变体的比例见图1,这些基因是按照总体乳腺癌的估计OR升高的顺序排列的。与之相反的是,对于BARD1、BRCA1、BRCA2、PALB2、RAD51C和RAD51D,ER阴性乳腺癌的OR高于ER阳性乳腺癌(所有基因的P值均小于0.05)。其中3个基因与三阴性乳腺癌的相关性强于ER阴性且非三阴性乳腺癌:BARD1(P=0.044),BRCA1(P=9.6×10-17)和BRCA2(P=7.8×10-5)。另有一些证据表明FANCM与ER阴性乳腺癌相关(在所有研究中,P=0.0050),FANCC与三阴性乳腺癌相关(在所有研究中,P=0.0021)。对于BRCA1、BRCA2和PALB2,侵袭性乳腺癌的OR高于原位乳腺癌。而对于ATM和CHEK2,侵袭性乳腺癌和原位乳腺癌的OR相近。

17.png


3. 年龄影响和绝对风险:在基于人群的研究中,6个基因(BRCA1、BRCA2、CHEK2、PALB2、PTEN和TP53)的OR随着年龄的增加而显著降低(所有基因的P值均小于0.01)。将特定年龄的估计OR与英国人口发病率相结合,计算绝对风险(图3)。对于BRCA1、BRCA2和PALB2蛋白截短变体的携带者,80岁时的估计绝对风险超过高风险阈值30%。对于ATM、BARD1、CHEK2、RAD51C和RAD51D蛋白截短变体的携带者,80岁时的估计绝对风险为17-30%,为中度风险。

18.png

(二)罕见的错义变体

在6个基因的罕见错义变体与总体乳腺癌相关:CHEK2(OR,1.42;95%CI,1.28-1.58;P=2.5×10-11[在所有研究中,P=2.9×10-18]),ATM(OR,1.06;95%CI,1.00-1.13;P=0.051[在所有研究中,P=0.0010]),TP53(OR,1.10;95%CI,0.91-1.31;P=0.32[在所有研究中,P=0.00080]),BRCA1(OR,1.11;95%CI,1.02-1.20;P=0.010[在所有研究中,P=0.027]),CDH1(OR,1.10;95%CI,0.98-1.23;P=0.096[在所有研究中,P=0.042])和RECQL(OR,1.12;95%CI,1.00-1.26;P=0.047[在所有研究中,P=0.036])(表2)。在这6个基因中,2个与ER阳性乳腺癌更相关(CHEK2 [P=9.1×10-5]和CDH1[P=0.012]),1个与ER阴性乳腺癌更相关(BRCA1[P=0.01])。BRCA1(P=0.0026)、CHEK2(P=0.00022)和TP53(P=0.00023)的OR随着年龄的增加而降低。

19.png

在34个基因的蛋白截短变体相关的总体乳腺癌的OR和95%CI见图2A,ER阳性乳腺癌的OR和95%CI(图2 B),ER阴性乳腺癌的OR和95%CI(图2 C),这些基因是按照总体乳腺癌的估计OR降低的顺序排列的。对于BRCA1的错义变体,总体乳腺癌的风险根据突变区域的不同而不同(P=3.0×10-6);位于RING结构域(P=1.0×10-6)和BRCT1结构域(P=0.00020)的变体的乳腺癌风险增加。对于CHEK2中的错义变体,OR没有根据突变位置而变化(P=0.52),结构域内变体的相关风险(P=4.2×10-9)与结构域外变体的相关风险相似(P=0.001)。对于ATM,与FRAP-ATM-TRRAP(FAT)结构域(在所有研究中,P=0.00019)和蛋白激酶结构域(在所有研究中,P=0.00092)内的变体相关的风险增加。没有证据表明BRCA2(P=0.27)或PALB2(P=0.48)特定区域内的错义变体与风险相关。

我们专门检测了BRCA1、BRCA2和TP53的罕见的错义变体,根据临床指南将这些变体归类为致病变体。有明确的证据表明,每个基因的致病变体与总体乳腺癌相关,BRCA1(OR,16.11[95%CI,5.83-44.50]),BRCA2(OR,5.68 [95%CI,2.62-12.29])和TP53(OR,2.91[95%CI,1.71-4.98]),但是与每个基因的其他错义变体不相关,BRCA1(OR,1.06[95%CI,0.98-1.15]),BRCA2(OR,0.97[95%CI,0.92-1.02])和TP53(OR,0.94 [95%CI,0.77-1.14])。(见表2)。

三、讨论与分析

在这项大型研究中,我们纳入60,466名患者和53,461名对照组个体,评估假定的乳腺癌易感基因的编码变异,使风险估计的计算结果更精确。我们发现9个基因的蛋白截短变体与乳腺癌风险(Bayesian错误发现概率,P<0.05)相关,其中5个基因(ATM、BRCA1、BRCA2、CHEK2和PALB2)的P值小于0.0001,另外4个基因(BARD1、RAD51C、RAD51D和TP53)的P值小于0.05。我们发现,对大多数基因的蛋白截短变体,OR因乳腺癌亚型而异。ATM和CHEK2的蛋白截短变体与ER阳性乳腺癌更相关,这一发现与早期研究结果一致,而BARD1、BRCA1、BRCA2、PALB2、RAD51C和RAD51D的蛋白截短变体与ER阴性乳腺癌更相关。panel中的其他25个基因的Bayesian错误发现概率均大于0.10。值得注意的是,有19个基因的OR的95%CI的上限小于2.0(2.0代表了“致病性,中度风险等位基因”的建议阈值);因此,我们得出结论,这些基因并不能预测乳腺癌的风险。我们证实,根据临床指南被归类为致病性的BRCA1、BRCA2和TP53的错义变体与临床风险显著相关。我们还发现,CHEK2的罕见的错义变体,以及ATM特定结构域内的变体,为中等风险。

我们的结果与Lee等人使用临床基因组资源(ClinGen)临床效度框架进行的分析结果基本一致。该分析确定了与乳腺癌风险相关的10个基因,我们的研究证实其中7个基因具有与乳腺癌风险相关的变体;其他3个基因(CDH1、PTEN和STK11)的有害变体非常罕见,并可诱发特定的肿瘤综合征。在该分析中,有18个基因被认为与乳腺癌风险有中度、有限或有争议的证据,我们证实其中 2个基因(RAD51C和RAD51D)的蛋白截短变体与乳腺癌风险相关;另外13个基因的OR的95%CI上限小于2.0(因此根据我们的研究,未归类为中度或高风险),其他3个基因(MSH2、MSH6、NF1)无法归类。乳腺癌风险与RAD51C和RAD51D变体之间的关联具有一致性,因为这两个基因的功能是相互关联的,它们与ER阴性乳腺癌更相关,且都与卵巢癌相关。

罕见变体的关联分析容易产生偏倚。纳入家族性研究,可以提高检测相关性的能力,但会导致估计的OR的向上偏倚。与以人群为基础的研究相比,在家族性研究中,与乳腺癌相关的所有基因的蛋白截短变体和ATM, CHEK2和TP53的错义变体的预期效应值更大。其中一些基因中的蛋白截短变体也与其他类型的肿瘤有关。此外,在肿瘤遗传学诊所检测肿瘤易感基因可能会导致预期效应值向下偏倚,因为已发现的携带者可能被排除在外。在家族性研究中,我们观察到乳腺癌患者中BRCA1和BRCA2的蛋白截短变体携带者减少。因此,我们认为基于人群的研究评估是最可靠的。

关于罕见的错义变体,与乳腺癌风险增加相关最明显的是CHEK2。对于CHEK2的罕见的错义变体(总体上),OR约为1.4,且与突变区域无关,这表明有很大比例的CHEK2错义变体会导致风险(尽管低于“致病性,中度风险等位基因”的阈值)。我们发现,在ATM、BRCA1、CDH1和TP53中,罕见的错义变体(总体上)与风险相关,所有基因的OR约为1.1(P<0.05)。此外,我们还发现,BRCA1、BRCA2和TP53的致病性错义变体与风险相关;这些致病性错义变体的OR(总体上)与蛋白截短变体的OR接近。对于ATM,特定结构域内的变体与风险相关,与之前的观察结果一致。

除了BRCA2和TP53的估计值低于以往家族性研究报道的风险外,其他风险基因的蛋白截短变体的绝对风险估计值与先前的基本一致。然而,本研究对TP53的评估仅基于7个携带者的数据,且95%CI的范围较宽。较低的估计值可能反映了TP53蛋白截短变体携带者的显著早期死亡率;另一种可能是,早期的家族性研究高估了其风险。由于年龄相关的克隆造血作用可能导致血液中未被识别的体细胞突变,TP53的分析进一步复杂化。与以往的研究相比,BRCA2的估计值低于BRCA1的估计值可能反映了本研究的纳入者年龄更大,与BRCA1携带者相比,基因修饰剂对BRCA2携带者风险的影响可能更大。

在欧洲女性中,约6.8%的患者和2.0%的对照组个体存在与乳腺癌风险相关的蛋白截短变体;此外,2.2%的患者和1.4%的对照组个体存在CHEK2的错义变体。亚洲女性的蛋白截短变体的发生率(4.4%的患者和1.3%的对照组个体)低于欧洲女性的发生率,这是由于CHEK2 c.1100delC变体在亚洲女性中的频率较低。

绝对风险评估将BRCA1、BRCA2和PALB2的蛋白截短变体归类为高风险,将ATM、BARD1、CHEK2、RAD51C和RAD51D的蛋白截短变体归类为中风险。根据国家指南,这些结果可以指导筛查以及进行降低风险的手术或药物预防。然而,由于除了家族史外,乳腺癌风险还受其他遗传和生活方式因素的影响,因此需要将这些信息也纳入风险模型,以做出适当的评估。

尽管这项研究规模庞大,但仍有基因(如FANCM、MSH6和NF1)与乳腺癌风险的相关性不明确,即使是与风险明确相关的基因,风险评估的95%CI也很宽。结合系谱数据或与其他研究综合分析可以提高这些评估的精度。最终,这些结果将有助于指导临床报告多基因panel的检测结果,并为接受乳腺癌易感基因筛查的女性提供遗传咨询。


本文译自:N Engl J Med 2021; 384:428-39.(The new England journal of medicine. DOI: 10.1056/NEJMoa1913948)