第一章流感病毒重配及其挖掘方法研究进展
目前却没有专门提供流感病毒大规模序列比对数据的数据库,为加快流感病毒序列相关数据的快速收集与处理工作,因此构建一个专门针对流感病毒序列比对数据的数据库将变得十分有意义。另外,流感病毒基因组是分节段的,不同毒株之间的重配现象比较频繁,同时流感病毒重配往往伴随着重大的流感疫情(Cox et al. 2000; Horimoto et al.200动。因此,对甲型流感病毒基因组不同片段之间重配规律的深入探讨,有助十人类进一步了解甲型流感病毒重配机制,为预测流感大流行暴发提供一定理论基础,同时为研制有效的流感疫苗提供一定的理论支持。
1. 1流感病毒简介
1.1.1流感病毒的分类与命名
流感病毒属十正勃液病毒科,是一类带囊膜、基因组分节段的单股负链RNA病毒。依据核蛋白(Nucleocapsid protein, NP)和基质蛋白(Matrix protein, MP)抗原特性的差异,流感病毒可细分为甲(CA)、乙(B)和丙(C) 3型,fU依据表面抗原血球凝集素(Hemagglutinin, HA)和神经氨酸酶(Neuraminidase, NA)的不同,甲型流感病毒可进一步细分为多种业型,其中HA包含16个业型:Hl-H16, NA包含9个业型:Nl-N9o如甲型H1N1流感病毒表示其HA与NA分别为Hl型和Nl型,甲型H3N2则表示其HA与NA分别为H3型和N2型。(de Jong et al. 2007)
根据世界卫生组织(WHO) 1980年通过的流感病毒毒株命名法修正案,流感病毒毒株的命名结构主要分为6部分:型别/宿主/分离地区/毒株序号/分离年份(HnNn),其中第一部分定义流感病毒属十甲(A)、乙(B)和丙(C) 3型中的哪一型,第二部分定义毒株的宿主,第二部分定义样本采集地信息,第四部分为毒株序号(用十区分同一条件下采集的多个毒株),第五部分定义样本采集时间,第六部分定义毒株的业型信息。但对十人类流感病毒,宿主信息被省略了,另外由十乙型和丙型流感病毒没有定义业型,因此省略业型信息。例如毒株A/Swine/Spain/54008/2004 (H3N2)表示其核蛋白为A(甲)型,2004年在西班牙分离的以猪为宿主的H3N2业型流感病毒毒株,其毒株序号为540080
1.1.2流感病毒基因组及其病毒颗粒结构
流感病毒具有分段的基因组结构,其中甲型流感病毒基因组含有8个RNA节段
CvRNA,依据片段大小分别标记为:1 CPB2, 2 CPBW , 3 CPA), CHAS, 5 CNP, 6 CNA, 7 CMP)及8 CNS;乙型流感病毒基因组也包含8个RNA节段,依据片段大小分别标记为:1 PBW , 2 PB2, 3 PA, HA, 5 NP, 6 NA, 7 AMP)及8 CNS;丙型流感病毒基因组只含有7个RNA节段,缺少编码NA的片段,依据片段大小分别标记为:1 PB2, 2 PBW , 3 P3, HE, 5 NP, 6 AMP)及'l CNS。其中甲型流感病毒基因组编码11个蛋白质:PB2, PBl, PBl-F2, PA, HA, NP, NA, Ml, M2, NSl及NS2;乙型流感病毒基因组编码11个蛋白质:PB2, PBl, PA, HA, NP, NA, NB, Ml,BM2, NSl及NS2;丙型流感病毒基因组编码9个蛋白质:PB2, PBl, P3, HE, NP, Ml,CM2、NSl及NS2。(Sahini et al. 2010;Scull et al. 2010)
在电子显微镜下,甲型与乙型流感病毒的病毒颗粒几乎是不可分的。它们一般为球状和丝状,球状颗粒的直径一般可达到100nm, IfU丝状颗粒的长度则可达到300nm。甲型流感病毒颗粒由外膜和包裹十其中的核衣壳组成。外膜的主要成份是脂质,其内表面为一层基质蛋白(M1),其外表面的脂质双分子层有血球凝集素(Hemagglutinin, HA)和神经氨酸酶(Neuraminidase, NA)两种表面抗原(含量比大约为4:1),另外还有少数的离子通道蛋白(M2。在基质蛋白Ml内部包含着核输出蛋白(nuclear export protein,NEP也称为NS2)和核糖核酸蛋白(ribonucleoprotein, RNP)复合物,RNP复合物由vRNA、核蛋白(nucleoprotein, NP)及依赖RNA的RNA聚合酶(包含PBl, PB2及PA二个业基)。
第三章 H3N2 亚型流感病毒重配........ 28-36
3.1 材料........ 28-29
3.1.1 实验数据........ 28
3.1.2 相关工具与软件........ 28-29
3.2 方法........ 29-33
3.2.1 数据采集........ 29-30
3.2.2 系统发育树构建及........ 30
3.2.3 重配频率估计........ 30-33
3.3 结果........ 33-34
3.3.1 重配频数与 NJ 树差异........ 33-34
3.3.2 H3N2 流感病毒无重........ 34
3.4 讨论........ 34-35
3.4.1 H3N2 流感病毒无重配........ 34
3.4.2 H3N2 流感病毒具有........ 34-35
3.4.3 NJ 构树法具有较高........ 35
3.5 小结........ 35-36
第四章 两种重配群划分........ 36-45
4.1 材料........ 36
4.1.1 相关工具与........ 36
4.2 方法........ 36-41
4.2.1 相关标记介绍........ 36-37
4.2.2 重配群聚类介绍 ........ 37-39
4.2.3 重配群随机划........ 39-41
4.3 结果........ 41-42
4.3.1 重配群聚类分析........ 41
4.3.2 重配群随机划分........ 41-42
4.4 讨论........ 42-44
结论
本文采用邻接思想构建了流感病毒多重序列比对数据库,成功将多重序列比对问题转变为序列检索问题。同时,利用多重序列比对数据库自动更新模块来进行数据库维护和数据同步。
重配频率与系统发育树Robinson-Foulds对称差异距离间存在较强的线性关系,通过回归预测分析推测H3N2业型流感病毒在整个进化过程中可能不存在重配偏好性。另外,我们推测H3N2业型流感病毒可能具有较高水平的重配频率(平均每年至少5次)。
提出了重配群和重配群划分模型,将复杂的重配分析问题抽象为简单的重配群划分问题。并结合聚类与群体结构划分思想得到了两种重配群划分方法:重配群聚类分析与重配群随机划分分析。
参考文献
1.Arunachalam R, Paulkumar K, Annadurai G. 2012. Phylogenetic analysis of pandemic influenza A/H1N1 virus. Biologia, 67(1):14-31.
2.Bao Y, Bolotov P, Dernovoy D, Kiryutin B, Tatusova T. 2007. FLAN: a web server for influenza virus genome annotation. NucleicAcids Research, 35(suppl 2):W280-W284.
3.Bao Y M, Bolotov P, Dernovoy D, Kiryutin B, Zaslavsky L, Tatusova T, Ostell J, Lipman D. 2008. The influenza virus resource at the national center for biotechnology information. Journal of Virology, 82(2):596-601.
4.Bao Y M, Federhen S, Leip e D, Pham V, Resenchuk S, Rozanov M, Tatusov R, Tatusova T. 2004. National Center for Biotechnology Information Viral Genomes Project. Journal of Virology, 78(14):7291-7298.
5.Bam I G, Komadina N, Hurt A, Shaw R, Dumant C, Iannello P, Tomasov C, Sjogren H, Hampson A W. 2003. Reassortants in recent human influenza A and B isolates from South East Asia and Oceania. Virus Research, 98(1):35-44.
6.Becker E, Cotillard A, Meyer V, Madaoui H, Guerois R. 2007. HMM-Kalign: a tool for generating sub-optimal HMM alignments. Bioihformatics, 23(22):3095一3097.