本文是一篇临床医学论文,在本研究中,将HCC作为我们研究的对象,采用生物生物信息学相关方法,以GEO数据库中的三个数据集为基础,筛选出三组在HCC中表达上调的DEGs,利用在线韦恩图软件对三组DEGs取交集操作,交集得到187个DEGs。
第1章 引言
1.1 肝癌概述
肝癌在世界常见癌症中排名第六,其造成的死亡数在所有癌症原因死亡的人数中排第三[1]。据统计,肝癌是我国的第二大癌症及癌症死亡原因[2],严重危害着我国国民的身体健康。我国多半病人由慢性肝炎、肝硬化后发展成肝癌。2012 年全世界统计约有 782,000 例肝癌患者,其中 83%是在世界欠发达地区确诊[3]。造成HCC的主要危险因素主要有乙肝病毒(hepatitis B virus,HBV)感染或丙型肝炎病毒(hepatitis C virus,HCV)感染、食用被曲霉毒素污染的食物、大量饮酒、肥胖、吸烟和以及2 型糖尿病 [1,4,5]。
在HBV感染的患者中,病毒的载量以及长期的感染均与HCC的发病率密切相关。在一些欧美国家中,丙型肝炎病毒感染和过量饮酒是主要的危险因素。丙型肝炎病毒是一种正义单链RNA病毒,具有大约9,600个核苷酸碱基。RNA 基因组开始在宿主细胞中进行翻译和转录。HCV 感染诱导细胞基因启动子区域基因组甲基化水平的改变,从而转录影响蛋白质表达。这些蛋白质失调通过各种信号通路直接或间接促进肿瘤生长。信号相关基因和致癌基因的去甲基化也是HCV感染导致肝癌发生的重要原因。组蛋白修饰的异常调节也与肝细胞癌发生有关[6]。
.........................
1.2 生物信息学概述
20世纪60年代初,与计算机相结合的方法开始在蛋白质序列分析中得到应用。整个 20 世纪 70 年代和 80 年代,分子生物学和计算机科学的平行进步为日益复杂的研究铺平了道路。到了20世纪90年代至21世纪初,测序技术有了重大进步,造成了技术和成本的降低,加上互联网的应用,数据出现指数级增长。“大数据”时代开始到来,带来了新的机遇以及数据挖掘和管理方面的挑战,需要更多的计算机科学专业知识进入该领域。越来越多的生物信息学工具开始出现,并进入大学课堂。
目前生物信息学主要涉及研究、开发或应用计算工具和方法来获取、存储、可视化和解释医学或生物学数据。作为一门新兴的综合学科,它将生物学与数学、计算机学等学科进行了有效结合从而对生物信息进行筛选、处理、分析和解释。通过对多种公开数据库的研究诞生了许多重要成果[18]。根据研究目的可将生物信息学分为三种级别。第一级与生物数据库的使用和改进有关,整理提交高通量实验结果的产生的数据。这对于使科学界可以访问和更新现有信息非常重要。接下来是对这些存储数据的使用,这带来了生物信息学的第二级任务:开发工具和资源。这个级别需要计算机科学的高级知识,需要应用不同语言编写的工具。这些工具提高了人们对生物学的理解,将不可行的人类大数据分析变为可行。第三个级别与生物学紧密结合,即应用这些工具来解释生物学推理的结果。
................................
第2章 材料与方法
2.1 研究资料
2.1.1 肿瘤数据
2.1.1.1 GEO数据库检索分析
GEO 数据库(Gene Expression Omnibus)是由美国国立生物技术信息中心所创立的高通量基因表达数据库,整合全世界内研究人员上传的芯片以及二代测序等数据[21]。GEO2R 是 GEO 数据库配套的分析工具,通过使用Bioconductor 中的 limma R 包及 GEO query 对表达谱芯片数据进行在线基因差异分析。基因差异分析即筛选处理组与对照组,呈现差异表达的基因(DEGs)。用于确定基因在肿瘤与正常组织中的表达差异[22]。
2.1.1.2 基因本体论(GO)
基因本体论(Gene Ontology,GO)是由基因本体联合会所建立的数据库。该数据库将基因的功能分成了三部分即细胞组分(cellular component, CC)、分子功能(molecular function, MF)、生物过程(biological process, BP)。分别解释了基因产物可能行使的分子功能,所处的细胞环境,以及所参与的生物学过程。利用GO数据库,我们就可以了解目标基因层面功能。
2.1.1.3 京都基因与基因组百科全书
京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)是由日本京都大学化学研究所 Minoru Kanehisa 发起建立,是一个与通路相关的、用于系统分析基因的功能、链接基因组信息和功能信息的数据库。GO 分析一般用来寻找 DEGs 引起的功能改变,KEGG 分析则寻找通路上的影响[23]。
...........................
2.2 研究方法
2.2.1 研究方法概述
我们通过GEO数据库获取HCC相关基因表达测序,分析出具有差异表达的基因,利用STRING数据库建立蛋白-蛋白互作网络分析,结果在Cytoscape软件中行可视化分析并筛选出Hub gene。并对Hub gene进行了GO分析以及KEGG通路富集分析。用GEPIA数据库获得生存分析结果。最终采用qRT-PCR对Hub gene表达进行验证。在HPA数据库中获取Hub gene免疫组化结果。
2.2.2 数据集下载与筛选
在NCBI的GEO Datasets中通过关键字“HCC”筛选出众多数据集,选择 “Series”以及“Homo sapiens”选项。挑选出GES60502、GSE101685、GSE112790三个数据集,包含HCC及配对癌旁组织。使用GEO2R在线分析软件对三个数据集进行分析,将每个数据集分为肿瘤组和对应的癌旁组得到三组DEGs,结果绘制火山图。导出结果,并利用EXCEL表格手动对三组DEGs进行肿瘤表达的上调筛选:去除资料缺失项以及重复项,设定adj.P.Val<0.05,且LogFC>1。筛选得到三组上调DEGs。使用在线韦恩图软件对三组DEGs取交集并绘制图片,导出数据。
临床医学论文怎么写
.............................
第3章 结果........................ 14
3.1 在线数据集分析结果 ............................... 14
3.2 筛选表达上调基因结果.......................... 14
3.3 构建蛋白质互作网络结果 ............................. 15
第4章 讨论................................ 22
第5章 结论............................................ 26
第4章 讨论
肝细胞癌是原发性肝癌中最主要的病理类型,由于其早期无明显不适症状,延误了最佳就诊时机,待到就诊时已发展为晚期肿瘤,其预后很差,给我国国民造成极大损失。我国乙型肝炎病例较多,且大多数居民未形成体检意识,很大比例的乙型肝炎患者逐步发展为肝硬化、肝细胞癌患者。HCC治疗方法有肿瘤切除、肝移植术、介入栓塞术、消融技术以及靶向药物治疗等。对于符合手术指征,能够耐受手术的患者首选手术切除法,早期筛查及诊断对于患者预后显得尤为重要。目前常用于筛查及预测预后的肿瘤标志物有甲胎蛋白(AFP)、异常凝血酶原(PIVKA-II)、热休克蛋白 70(HSP70)、人血管生成素 2(ANG-2)、血管内皮生长因子(VEGF)等,这些标志物在面对小肝癌时灵敏度和特异性较低,不能很好地发挥预测作用。因此寻求新的肝细胞癌标志物迫在眉睫,帮助人们准确、早期地诊断并评估预后。随着近年来生物信息学及相关学科的高速发展,肿瘤相关基因不断被发现,这极大的帮助了人们探索肿瘤标志物。
在本研究中,将HCC作为我们研究的对象,采用生物生物信息学相关方法,以GEO数据库中的三个数据集为基础,筛选出三组在HCC中表达上调的DEGs,利用在线韦恩图软件对三组DEGs取交集操作,交集得到187个DEGs。对这些DEGs进行进一步分析:导入STRING在线数据库对其进行筛选,用Cytoscape软件分析筛选结果,在软件中安装CytoHubba插件,并筛选出Hub基因。将Hub基因导入DAVID数据库,在数据库中进行基因本体论功能分析和京都基因与基因组百科全书通路分析。GO功能分析结果显示Hub基因生物过程主要参与有丝分裂细胞周期,有丝分裂细胞周期的G2/M转换等。细胞周期由多个位点进行调控,当某些位点失调时,细胞周期加快,细胞大量增殖,形成肿瘤。细胞组分方面主要与细胞核,纺锤体,微管等细胞器有关。有丝分裂是细胞增殖的必要过程,纺锤体、微管等是细胞有丝分裂相关的细胞器。分子功能方面主要与蛋白激酶结合、微管结合、ATP结合相关。KEGG通路显示参与孕激素介导的卵母细胞成熟、细胞周期、卵母细胞减数分裂等信号通路,与细胞成熟及分裂息息相关。
临床医学论文参考
................................
第5章 结论
1. 异常的有丝分裂及异常细胞周期在HCC发生发展中起重要作用。
2. AURKA、DLGAP5、NCAPG、CCNB1、KIF11的高表达对HCC预后起不良作用。
3. AURKA、DLGAP5、NCAPG、CCNB1、KIF11可能是HCC治疗的潜在靶点。
参考文献(略)