戊型肝炎病毒基因型3系统发育 动力学和进化史的新理解

作者:Infection, Genetics and Evolution
2021-12-16

1.简介


戊型肝炎病毒(HEV)是急性戊型肝炎的发病原因;从非洲到亚洲的许多国家,这种感染被认为是一种地方病。HEV主要通过粪口途径传播,已经被作为大型水传播流行病以及在发展中国家HEV形成小规模爆发的流行病进行报告。有报告显示大约有20亿人—全球人口的三分之一生活在HEV病区,存在感染风险。但是,在过去10年间,在不太可能存在感染获得途径的一些高收入国家,HEV零星发作的数量正在逐步增加。此外,逐渐增多的证据表明HEV是一种家猪和野猪感染的动物传染病,而这两种动物也是人感染的主要宿主。全球HEV感染被认为是零星病例传播而不是大规模爆发传播。


根据对基因组序列和/或存在ORF1和ORF2的可变局部HEV基因组区域的完整分析,人感染HEV序列被分为4个主要的公认基因型(1-4)。非洲、亚洲和拉丁美洲检测出基因型1和2(HEV-1和HEV-2),这两种类型与当地大规模HEV地方病和HEV爆发最为有关。相反,HEV-3和HEV-4为动物传染病毒株,主要与非地方性病区的高收入国家自生HEV感染有关。HEV-3为世界性分布,是拉丁美洲地区流行性最为普遍的HEV分枝,但是仅亚洲和欧洲中部地区报告了HEV-4病例。


人和猪种群HEV-3的进化和人口统计学历史信息少之又少。在全球和地方层面上,已经进行了许多侧重于这一问题的研究。在全球层面上,已经报告的研究认为直到20世纪HEV-3感染仍然相当稳定,接着在1940年—1965年间感染数量显著上升,达到了平台期,之后在近些年感染数量又快速减少。上个世纪中,猪肉的消费和生猪养殖的发展一直是HEV-3感染人群增加最有可能的诱发因素;但是HEV-3人群人数减少的可能原因仍然未知。我们的研究表明日本HEV-3人群显著减少的原因节能是保健监护的发展避免了猪类特异性疾病的发生或者由于序列分析非随机采样相关假象所致。


但是在地区层面上,目前还没有关于南美洲HEV-3起源和遗传多样性的信息,作为目前执行的唯一研究,目前的研究限制在玻利维亚南部的当地社区中。


最近我们已经报告了完整的乌拉圭毒株数据集的系统发育分析,涉及的全部样品似乎与欧洲HEV毒株关系非常紧密,但和南美洲其他地区的毒株显著不同。在这里,我们让研究更进一步,来更好地了解这一发展中地区HEV复杂的分子流行病学和系统发育动力学。


这一工作有两个目标。第一个目标是通过分析全部现有与方法论标准匹配的序列,描绘全球主要HEV-3的世系来获得全球,尤其是南美洲流行的HEV-3毒株地起源证据。第二个目标是推测全球HEV-3人口统计史来检验先前描述的全休全球人群减少现象是否与非随机交配群体人群流行病学连续序列的采样有关。为了达到这些目标我们使用了最大似然率和贝叶斯定理联合框架分析22年间(1993—2015)独立于世界其他全地区的97 HEV-3 ORF2序列。


2.材料和方法


2.1 序列数据集

研究包括基因库内截止到2016年4月采样日期和位置已知的全部HEV-3 ORF2 序列。这使得最终的97 HEV-3 ORF2 序列最终数据集来此15个不同的国家,采样日期涵盖从1993年—2015年22个年头。使用MAFFT V6.902程序对齐核苷酸序列,最终对齐了756核苷酸长度(nt5294-6050,在US1参考毒株内)。


2.2 流行必学连续序列二次抽样

为了将病毒种群分化(利用属于相同HEV-3爆发的紧密相关序列)和病毒种群规模减少的关系纳入考量,我们通过移除单一爆发内的紧密相关序列生成一些子集。为了到到这一目的,使用CD-HIT程序处理后具有相似性的序列被分组,每个群落仅选择了一个序列。使用CD-HIT分组的群落具有100%、0.99%和0.98%的鉴别水平。


2.3 系谱树重建

为了研究系统发育关系,使用PhyML3.0程序在ModelGenerator v0.851确定的GTR+I+Г4核苷酸置换模型下建立最大似然树。使用SPR 分枝交换算法执行启发式树形检索,使用近似似然率(aLRT)SH-like检验计算分枝支持。


2.4 联合分析

在BEAST v1.8.0软件包内使用贝叶斯定理马尔科夫链蒙特卡尔理论(MCMC)统计学框架,联合评估进化速率(μ,核苷酸置换/点/年,subs./点/年),最近共祖年龄(Tmrca,年),祖先地理运动,以及人口类型。在完整的数据集内执行联合分析,全部子集来自不同鉴别水平的二次抽样。在GTR+I+Г4核苷酸置换模型和自由不相关对数正态分布分子钟模型下,按照先验联合树的定义,使用称为贝叶斯定理天际线描记的分段常数倍变化过程执行分析。基于先前研究的评估报告,对时钟频率(1.0-3.6x10-3,初始值1.5x10-3,subs./点/年)使用先验概率。使用可逆和不可逆扩散置换模型以及贝叶斯定理随机研究变量选择(BSSVS)程序推测系统发育史迁徙事件。使用(log)来自路径抽样法和踏石抽样法的边缘相似性估计评估模型拟合性。使用跨平台SPREAD应用总结通过BSSVS方法获得的迁徙事件和显著非零率。对2亿世代执行MCMC采样,排除每次运行最初的10%后,使用TRACER v1.5程序计算有效样品量评估参数的收敛性。在95%最高概率密度(HPD)内反映参数评估的不确定度。使用具有10%老化速率的TreeAnnotator v1.8 从树的后验分布中推测最大分枝可信性(MCC)树,并会用Figtree v1.4使之直观化。通过时间和时间世系数量表达感染有效数量,并使用R统计软件包生成图示。


3. 结果


3.1 系统发育分析

97 HEV-3 ORF2部分序列系统发育重建检查表明这一基因型的全球多样性可以分为2个高支持率(aLRT=1)的主要分枝(I和II),这两个分枝包含不同比率的亚洲、欧洲、非洲和南美洲毒株(图1)。分枝I包含我们的研究序列的82%,并综合3种高支持率(aLRTIC≥0.85)的进化亚枝(IA—IC)。进化亚枝IA是唯一几乎仅由日本分离种(95%)构成的分枝,采样年份介于1998年—2006年。这一进化亚枝也包括2008年分离的1个中国序列和2003年分离的1个加拿大序列。进化亚枝IB包含1个由亚洲、欧洲和北美洲序列组成的集合,采样时间介于1993年和2015年之间。反之,进化亚枝IC包含2010-2011年间取自乌拉圭的毒株和取自2006-2011年间的欧洲隔离种的序列以及2006年的1个蒙古序列。先前我们的小组报告的乌拉圭毒株作为与2011年分离的西班牙人毒株紧密相关(aLR≥0.71)的高支持率(aLRT=1)单源分枝分离(收录号KU513501)。另一方面,分枝II包括1998—2011年间采样的欧洲和亚洲(日本、泰国、新加坡和蒙古)等量隔离种。

戊型肝炎-1.jpg

图1. 基因型3HEV隔离系统发育统发育重构。基于ORF2内部分756-nt使用最大似然(ML)树执行分析。仅表明aLRT≥0.8的感兴趣节点(黑色完整环)。画出分枝长度来测量底部的条框表明每个点核苷酸置换。


3.2 HEV-3的时间尺度和系统发育动力学重构

为了描绘HEV-3的时空分布模式,在无相关对数正态分子钟模型下应用具有BSSVS程序的可逆和不可逆不连续扩散模型,使用部分ORF2区域执行联合分析。这些竞争模型(log)边缘似然的贝叶斯因数值的比较支持了HEV-3 ORF2数据集包含的谱系地理信号与可逆和不可逆不连续扩散模型拟合。


在不可逆模型下,HEV-3毒株的进化率估计在1.1x10-3 subs./点/年(95%HPD:1.0—1.3x10-3 subs./点/年),树根处的中值TMRCA追溯到1698(95%HPD:1595-1779),分枝I为1824(95%HPD:1703-1897),分枝II为1871(95%HPD:1782-1930)。在这些进化亚枝中,最早是IC在1876年出现分枝(95%HPD:1808-1932),然而IA和IB在20世纪早期出现(95%HPD:分别为1858-1947和1865-1956)(图2)。中值变异系数为0.21(95%HPD:5.2x10-2—0.3)排除了零值并证明了自由分子钟的用途。


HEV-3数根最有可能的位置是西班牙,后验状态概率[PSP]为0.35。西班牙还最有可能是2种主要分枝(分枝1[PSP]=0.41,分枝II[PSP]=0.39)以及1种进化亚枝IC([PSP]=0.42)的发源地。相反,进化亚枝IA和IB最有可能的发源地分别是日本([PSP]=0.80)和德国([PSP=0.4])。


反之在南美洲,乌拉圭世系的进化亚枝IC有可能源于西班牙(PSP=0.57)共祖非常近,可以追溯到2007年(95%HPD:2001-2009)。


考虑完整的数据集,执行显著非零率的后续贝叶斯因数检验,支持了31个流行病学世系。


3.3 HEV-3的种群动态推论

在时间顺序的感染有效数量的推论中,出于评估其对种群分化潜在影响的目的,我们移除0.98%-100%不同鉴别水平的密切相关序列从最初的1个数据集中生成了3个不同的序列子集。鉴别为97 HEV-3的生成群落(种一个选择的参考序列处)的数量范围是55-83。因此完整的数据集和4个不重复的子集使用BSP提交系统发育动力学分析。完整数据集和不同子集的系统发育动力学分析结果显示世界范围内的HEV-3感染有效数量在200年内保持稳定,并在20世纪早期发生了显著的膨胀,随后就是20世纪中后期的平台期(图3a)。在所有数据集LTT的累积数量平台到来前,从20世纪中期开始观测的有效数量趋于稳定(图3b),这支持了最近观测到的传染病扩散趋于平衡不是因为伪造推断方法的观点。对完整数据集的分析表明HEV-3有效群体大小在21世纪初期出现快速下降(图3a),这与流行病学连续LTT的数量的显著增加一致(图3b)。但是子集的分析表明HEV-3的有效群体大小在20世纪的最初10年终保持稳定(图3a),去除流行病学连续序列时,在最近的一段时期也没有发生LTT数量显著增加的现象。

戊型肝炎-2.jpg

图2. 97HEV-3 ORF2序列的时间尺度贝叶斯马尔可夫链蒙特卡尔理论树。选择了非对称不可逆谱系地理模型(见正文)。使用无相关对数正态自由始终重构该树。在选择的节点中,数量平均那一节点的Tmrca值。图中纵贯底线的数量是用年表示的计算出来的基因型3祖Tmrca时间尺度。在关键节点后验可能性≥0.8才会被标出(黑色完整环)。按图例(顶部左侧)所示根据这些派生节点的最有可能的位置状态对把分枝标为不同颜色。分枝长度以时间单位(年)描绘。在自由分子钟假设的情况下该树自动具根。AT,澳大利亚;CA加拿大;CN,中国;DE;德国;ES,西班牙;FR,法国;GB,英国;HU,匈牙利;JP,日本;KR,韩国;MN,蒙古;SG,新加坡;TH,泰国;US,美国;UY,乌拉圭。


戊型肝炎-4.jpg

图3. HEV-3的种群动态分析。a)最初数据集和子集获得的贝叶斯天际线描记(BSP;Ne的中值估计),聚集100%—0.98%不同的鉴别水平,以0.005%为移动步长。深灰表示原始数据集95%最高后验可能性的限制。b)累积世系(Y轴),时间(X轴)按照顶部左侧图例,(LTT)原始数据集以及每个不同鉴别水平子集的标绘。


4. 讨论


在这次研究工作中我们研究并叙述了全球主要HEV-3世系,旨在确定南美洲报告的HEV-3毒株的遗传学和地理学起源。另一个目的是推断HEV-3的人口统计学历史提供有助于综合世界范围内病毒复杂计划人群动态的新证据。


此次研究中的最大似然和贝叶斯分析明确支持了世界范围内HEV-3毒株分为2大主要世系分枝I和分枝II的观点,分枝I可以被细分为3个进化亚枝(IA—IC)。2个分枝都在亚洲、欧洲和南美洲传播,但是分枝I仅在非洲和北美检出。HEV-3毒株的隔离类型已经通过其他基因组区域分析观测到,尤其是HEV起源和分布有明确的证据,这些请见下文。这些内容应该被记录下来,但是,分析中观测到的隔离不能反映HEV-3的分类分入了亚型,现存的争论就是源于这些不一致。不仅如此,每个亚型参考序列存在混杂内容(由于缺乏采样时间和地点)可能干扰系统发育重构中亚型的合理区分。


此次研究中,我们比较了可逆和不可逆不连续扩散模型(log)边缘似然评分的贝叶斯因数值。数据支持了包含在数据集中的谱系地理信号与2个竞争模型拟合的观点。因此,不可逆模型的报告结果假设允许系统发育内位置间的非对称转变能提供病毒流行病空间动力学更加逼真的描述。


HEV-3总体时空分布模式成为了一些有趣结果的证据。HEV-3似乎起源于欧洲,最有可能就是西班牙。大约在1700年,从西班牙开始,多重分散事件发生在亚洲、美洲和非洲。Zehender等人也观测到了这一现象。因此,追溯到19世纪,最早的迁徙事件是从欧洲到亚洲,起源于进化亚枝IA的祖先(主要由亚洲毒株组成),IB的迁徙则发生在20世纪。巧合的是21世纪初的前10年日本开始与欧洲进行自由生猪和生猪衍生产品的自由贸易,日本日本国内的猪肉消费增加伴随着后续HEV感染的增加。另一方面,重构也表明进化亚枝IB的1个迁徙事件和3起分枝II从欧洲引入亚洲的事件就发生在最近。而且,欧洲和日本的HEV可能发生了遗传交换,尽管规模小,但是双向性明显。HEV进化亚枝IB从亚洲返回欧洲大约发生在20世纪中期,接着世系多次从欧洲迁徙进入美国。HEV-3推测的散布模式显著与Zehender等人提出的模式相反,Zehender之前断定HEV-3直接从亚洲传入了美国。但是这一观点可能是加拿大毒株出现的原因,事实上,加拿大毒株可能源于韩国和日本。2项研究分析采样方式不同,选择的基因组区域不同能解释这些相矛盾的结果。不仅如此,2项研究的数据集几乎相同,都排除了全部的南美洲隔离种。我们的谱系地理分析乌拉圭存在单一HEV引入途径,这个国家具有南美洲最多的HEV感染病例。进化亚枝IC可能在20世纪早期从欧洲引入了南美洲。事实上,南美洲南部的锥形区域是19世纪末—20世纪40年代西班牙、法国、意大利和德国移民人潮前往的最终目的地,移民人数在第一次世界大战时达到顶峰。这一迁徙施加可能加速了进化亚枝IC进入该区域的步伐。此外,乌拉圭单源组的西班牙毒株祖先是人源的观点毫无价值。另一方面,和上述观点一致,野猪因人为狩猎运动在1908年被引入乌拉圭才是这一进化亚枝进入乌拉圭的原因。全部标本属于欧洲世系并快速在巴西和阿根廷传播。和这些数据一致,我们最近检测了乌拉圭第一种HEV家猪毒株,它似乎是人隔离种群落的先祖。这一新检测的隔离种已经初步使用ORF2小区域描述,因此不包括在此次研究中。尽管进化亚枝IC世系似乎在20世纪开始在南美洲流行,但是乌拉圭进化亚枝单源群的Tmrca显示这一世系最近的起源是在2000年代晚期。但是这也可能是HEV-3进化亚枝在乌拉圭流行的时间较长的原因,但仍然由于流行率非常低、较高的误诊率和/或无症状感染的原因不能被检测出来。实际上一项几年前进行的研究显示概率很低,但可以检测乌拉圭普通人群抗HEV抗体血清阳性率。


其他南美洲国家的隔离种,从已经检测出HEV的国家显示出不同的种族图谱,这些图谱应该被进一步描绘并在多个双向分布事件中分析。这是巴西发生HEV感染的一个原因,巴西是日本海外人口较大的聚居地之一。玻利维亚存在许多前西班牙地方种群和社区。不幸的是,乌拉圭毒株是这个区域唯一符合报告入选标准的毒株。


最后,进化枝II可能在欧洲国家间存在多个散布事件,也可能散布到蒙古、新加坡和日本。


这里显示的结果试图重构HEV-3的种群动态并与先前的报告对照。一些结论可能是对重构进行详细分析的推论。首先,HEV的有效种群大小在上世纪四五十年代的前200年中一直保持稳定,但在该年代之后开始膨胀。这一人口统计学变化与工业化国家猪肉的生产和消费、生猪养殖的全球化以及20世纪前半期商业交流的发展紧密相关,这些活动大大增加了HEV暴露的风险。这一模式与先前观测到的HEV-3种群扩展过程完全一致。这一种群事件后的许多年,所有之前的研究以及现在的研究都报告在过去的20年中HEV全球感染规模剧烈减小。作者将这一次HEV感染规模显著减小的事件与HEV传染中断联系起来。1997年第一次猪HEV毒株分离之后,HEV感染鉴别为动物传染病。


出人意料的是,HEV-3的感染种群的缩减效应并未在HEV-4上出现,HEV-4也被认为是动物传染病。最近的研究揭示BSP可能因种群结构和采样策略似是而非的生物学组合下显示虚假的感染种群下降信号,去除流行病学连续序列可以减少这一偏差。因此,按照这个方法并去除主要来自日本和亚洲其他地区的隔离种,我们得到了明显相反的结果:我们证明最近HEV-3种群显著减小,这种减小仅在使用完整数据集时能够观测到,但是逐渐去除非常紧密相关的序列时,这种减小现象就会消失。实际上,包含相似度极高(≥99%)流行病学连续序列会干扰联合模型的随机交配群体假设,减少联合次数,造成联合模型将这种效果解释为最近大多数时期有效种群大小都发生了减少。造成这种结果的另一个解释是减少与采样病毒的多样性减少有关,这并不意味着一些世系消失并停止传播。因此,HEV-3的有效种群大小从上世纪五十年代开始很可能仍然保持稳定,虽然如此,没有证据表明有效种群最近出现了减少。基于子集的LTT描记分析结果支持了这一假设,分析显示随着时间的推移累积世系数量仍然稳定,研究期间没有观测到新的世系。因此LTT描记提供了新的关键要素和更容易理解的信息,从历史观点出发使我们对HEV的种群动态有了更好的和更恰当的了解。


此次研究首次试图在贝叶斯定理联合框架内对HEV-3在南美州的系统发育动力学和进化史进行描述,南美洲是一个发展中地区,具有高HEV感染负荷和复杂的病毒流行病学。


此外,此次研究对HEV的全球种群动态提出了新的理解,这一理解与先前该领域研究取得的观点相反,提出了我们还远未完全了解HEV-3历史的观点。


特别要提出的是,将不连续谱系地理分析纳入研究非常重要,提出了先祖位置可能性只能用采样地点评估的关键限制,不适用与无感染报告地区或序列数据不足的地区。


需要进一步的研究验证这些假设并执行更加详细的分析。因此,完全重构世界范围内HEV的历史仍然任重道远。此次特殊的区域性研究模式限于南美洲,但是对于全球不同的区域,这些研究可以作为HEV系统发育动力学和分子流行病学综合研究的基础。





(本文摘自Infection, Genetics and Evolution,版权归其所有,仅供内部参考)

编译:张凯

审校:王小茜