首页期刊导航|生物信息学
期刊信息/Journal information
生物信息学
哈尔滨工业大学
生物信息学

哈尔滨工业大学

徐德昌

季刊

1672-5565

itgene@sohu.com

0451-86283129

150090

哈尔滨市南岗区黄河路73号

生物信息学/Journal China Journal of BioinformaticsCSCDCSTPCD
查看更多>>本刊是由哈尔滨工业大学主办的生物信息及相关领域的国内外公开发行的学术刊物,报道我国生物信息技术研究开发的重要成果和国内外生物信息技术及其产业化最新进展。
正式出版
收录年代

    基于NGS的染色质测序在肿瘤研究中的应用

    蒲鹏李国强刘法涛刘颖斌...
    79-92页
    查看更多>>摘要:染色质是真核生物细胞核内由核酸和蛋白质组成的复合结构,有着精密且复杂的三维结构。染色质除基本的DNA序列外,内部还存在着不同化学修饰,DNA-蛋白质相互作用,DNA-DNA相互作用和DNA-RNA相互作用,以上这些若发生改变都可能在肿瘤发生发展过程中起到至关重要的作用。通过不同的染色质测序方法,可以解析出这些改变,并进一步加深研究者对肿瘤形成机制的理解,最终应用于肿瘤的治疗。本文对常见的染色质测序技术部分原理和应用进行综述。

    NGS染色质肿瘤

    DLGCN:基于图卷积网络的药物-lncRNA关联预测

    朱济村周旭侯斐曹新玉...
    93-100页
    查看更多>>摘要:为实现高通量识别新的药物-长链非编码RNA(Long non-coding RNA,lncRNA)关联,本文提出了一种基于图卷积网络模型来识别潜在药物-lncRNA关联的方法DLGCN(Drug-LncRNA graph convolution network)。首先,基于药物的结构信息和ln-cRNA的序列信息分别构建了药物-药物和lncRNA-lncRNA相似性网络,并整合实验证实的药物-lncRNA关联构建了药物-ln-cRNA异质性网络。然后,将注意力机制和图卷积运算应用于该网络中,学习药物和lncRNA的低维特征,基于整合的低维特征预测新的药物-lncRNA关联。通过效能评估,DLGCN的受试者工作特性曲线下面积(Area under receiver operating character-istic,AUROC)达到0。843 1,优于经典的机器学习方法和常见的深度学习方法。此外,DLGCN预测到姜黄素能够调控lncRNA MALAT1 的表达,已被最近的研究证实。DLGCN能够有效预测药物-lncRNA关联,为肿瘤治疗新靶点的识别和抗癌药物的筛选提供了重要参考。

    肿瘤药物lncRNA图卷积网络深度学习

    基于联邦深度学习的皮肤病智能诊断研究

    段聪颖陈思光
    101-108页
    查看更多>>摘要:近年来,基于人工智能的皮肤病智能诊断已经成为智慧医疗领域的热门课题。然而由于单一机构的数据有限,局部训练的神经网络难以满足医疗诊断服务的性能需求,从分散机构中收集数据的集中式学习又存在隐私泄漏的风险。基于上述挑战,本文提出一种基于联邦深度学习的皮肤病智能诊断算法。具体地,对比主流的集中式学习,为了在整合多方数据时防止隐私泄漏,本文引入了联邦学习。各客户端将本地模型发送到中心服务器进行聚合,中心服务器再将聚合得到的全局模型同步到各客户端,实现神经网络模型的训练。进一步,为了解决联邦学习中数据异构性的问题,本文在交叉熵损失的基础上增加了修正项,通过修正项限制本地模型和全局模型间的差异,增加模型对异构数据的关注度,从而减小数据异构对诊断结果的影响。实验结果表明,本文所提的皮肤病智能诊断算法与现有相关方案相比,诊断准确度提高了 3%~4%,达到75。9%。

    皮肤病智能诊断联邦学习隐私保护损失函数

    结节性甲状腺肿circRNA-miRNA-mRNA调控网络的构建

    张雪雪王旭杰徐钰莹王宗雪...
    109-115页
    查看更多>>摘要:基于生物信息分析筛选结节性甲状腺肿中差异表达的环状RNA(circRNA),并揭示circRNA-miRNA-mRNA调控网络在结节性甲状腺肿中的作用。从GEO数据库中检索结节性甲状腺肿组织基因芯片数据,利用R软件筛选出差异表达的cir-cRNA。联合多个生物信息数据库预测差异表达circRNA下游的miRNA及mRNA,并对靶mRNA进行GO及KEGG富集分析。利用STRING在线数据库及Cytoscape软件筛选核心基因。确定了 2 个circRNA,42 个miRNA及 546 个mRNA。GO及KEGG富集分析表明靶mRNA主要涉及细胞生长及基因表达调控过程。基于Cytoscape软件筛选出了 14 个核心基因(SP1、IGF1R、RPS6KB1、SMAD2、SMAD3、SMAD4、VEGFA、CCND1、CDK2、HSPA4、HIF1A、CREB1,NR3C1 和 STAT5A)。最终基于 2 个circRNA、11 个miRNA和 14 个核心mRNA构建了circRNA-miRNA-mRNA调控网络。结节性甲状腺肿组织中异常表达的cir-cRNA及相关的circRNA-miRNA-mRNA调控网络可能成为结节性甲状腺肿诊断与治疗的新靶点。

    结节性甲状腺肿环状RNA竞争性内源RNAGEO数据库

    基于图自编码器和协同训练预测miRNA与疾病的关联

    刘立伟刘晓兰谭者斌
    116-123页
    查看更多>>摘要:近年来,越来越多的生物学实验研究表明,microRNA(miRNA)在人类复杂疾病的发展中发挥着重要作用。因此,预测miRNA与疾病之间的关联有助于疾病的准确诊断和有效治疗。由于传统的生物学实验是一种昂贵且耗时的方式,于是许多基于生物学数据的计算模型被提出来预测miRNA与疾病的关联。本研究提出了一种端到端的深度学习模型来预测miR-NA-疾病关联关系,称为MDAGAC。首先,通过整合疾病语义相似性,miRNA功能相似性和高斯相互作用谱核相似性,构建miRNA和疾病的相似性图。然后,通过图自编码器和协同训练来改善标签传播的效果。该模型分别在miRNA图和疾病图上建立了两个图自编码器,并对这两个图自编码器进行了协同训练。miRNA图和疾病图上的图自编码器能够通过初始关联矩阵重构得分矩阵,这相当于在图上传播标签。miRNA-疾病关联的预测概率可以从得分矩阵得到。基于五折交叉验证的实验结果表明,MDAGAC方法可靠有效,优于现有的几种预测miRNA-疾病关联的方法。

    microRNA疾病关联预测协同训练图自编码器端到端

    抑郁症易感基因和抗抑郁药物靶点相关神经细胞类型及相互作用网络分析

    赵弘毅丁伟健冯飞翔宋文正...
    124-133页
    查看更多>>摘要:基于抑郁症的全基因组关联分析研究(GWAS),对于获得的单核苷酸多态性位点(SNP)使用Haploreg软件进行基因注释,得到SNP注释的102 个易感基因。。使用MAGMA软件对GWAS的汇总统计数据做基因水平的分析,获得了270 个校正之后显著的基因,两者合并共得到 320 个抑郁症易感基因。通过药物数据库Drugbank获取 133 个抗抑郁药物靶点基因。使用EWCE包对抑郁症易感基因和抗抑郁药物靶点在三套脑组织单细胞测序数据中,分别进行神经细胞类型富集分析。结果发现大脑皮质的GABA神经元(抑制性神经元)和谷氨酸能神经元(兴奋性神经元)是抑郁症易感基因和抗抑郁药物靶点共同的神经元。这两种类型的神经细胞可能是抗抑郁药物与抑郁症易感基因相互作用的神经细胞,另外少突胶质前体细胞可能是抑郁症特有的易感神经细胞。使用Network Calculator软件构建网络并进行进行网络拓扑学参数分析。结果表明抑郁症易感基因与抗抑郁药物靶点组成了一个具有显著的相互连接的网络。本研究从单细胞层面揭示抑郁症的遗传机制,在网络层面为寻找新的抗抑郁药物靶点提供了一定的启示。

    单细胞测序抑郁症易感基因抗抑郁药物靶点,神经细胞相互作用网络

    组蛋白修饰对胚胎干细胞分化过程的调控机制

    苏文霞吕晓桂张强
    134-139页
    查看更多>>摘要:选用人类胚胎干细胞系和由人类胚胎干细胞系分化来的神经干细胞系为研究对象,分析组蛋白修饰对胚胎干细胞分化过程的调控作用。得到了两种细胞系差异表达基因转录起始位点侧翼区域内八种组蛋白修饰的分布模式,以及组蛋白修饰功能簇。研究表明在两类细胞系中,八种组蛋白修饰谱分布模式一致,且呈现两种分布类型;H3K27ac,H3K4me3 和H3K9ac组成的功能簇是保守的;H3K27me3,H3K36me3 和H3K79me1 组成的功能簇以及H3K9me3 和H3K27me3 组成的功能簇在胚胎干细胞向神经干细胞分化的过程中消失。结果揭示了组蛋白修饰对胚胎干细胞系向神经干细胞系分化过程的部分调控机制,为该分化过程分子调控机制的研究提供部分重要的理论基础。

    胚胎干细胞神经干细胞分化组蛋白修饰

    基于支持向量机预测C2H2型锌指蛋白

    刘哲李凤敏
    140-147页
    查看更多>>摘要:转录作为遗传信息传递的第一步,会受到多种转录因子的调控。转录因子(Transcription Factors,TF),是指能够在基因上游的特异核苷酸位点结合从而影响转录过程的蛋白质因子,锌指蛋白是数量最多的一类转录因子。由于锌指基序大多是不相同的,所以它们很可能结合不同的位点,行使多样化的调控功能。C2H2 型锌指蛋白是数量最多的一类锌指蛋白,本文构建C2H2 型锌指蛋白数据集,提取了氨基酸单肽组分信息、平均化学位移、氨基酸二肽组分信息三类特征信息,利用支持向量机算法对锌指蛋白进行预测,在Jackknife检验下最高预测成功率为 87。86%。之后对氨基酸二肽组分信息特征参数进行不同方式的降维处理,降维后最高预测成功率为 90。21%。最后对三类特征信息进行融合,融合特征后最高预测成功率为92。55%。对锌指蛋白进行预测,有助于更加深入地了解锌指蛋白的结构、功能和调控机理。

    转录因子锌指蛋白特征信息预测

    浆液性卵巢癌铁死亡关键基因的筛选及生物信息学分析

    余娟林青青秦燕秦爽...
    148-158页
    查看更多>>摘要:利用生物信息学方法筛选浆液性卵巢癌相关铁死亡关键基因,并预测其生物学功能。从GEO数据库中获得有关浆液性卵巢癌的数据集GSE54388 和GSE12470,采用R语言中的"Limma"包分析挑选浆液性卵巢癌上皮组织与正常卵巢上皮组织中差异表达基因,绘制火山图、热图。利用Venn软件在线工具绘制GSE54388,GSE12470,FerrDb三个数据集韦恩图。对相关基因进行功能富集分析、蛋白互作分析、生存分析,对关键基因绘制ROC曲线进行诊断分析。采用GEPIA2 数据库对筛选基因进行验证,并进行免疫浸润分析。结果发现:从GSE54388 中筛选出2458个差异基因,其中上调1309 个,下调1149 个。从GSE12470 中筛选出3534个差异基因,其中上调 1 837 个,下调1 697 个。与铁死亡基因数据集取交集,共得到 16 个差异基因,蛋白互作网络筛选出 7 个基因构建的关键模块,绘制生存曲线发现浆液性卵巢癌患者中 5 个基因与患者总生存率不良相关,其中NRAS,PSAT1,CDKN2A,GDF15 这 4 个基因高表达,CAV1 低表达。ROC曲线显示这 5 个基因中CAV1,NRAS,PSAT1 的AUC诊断曲线面积大于0。95,有较高的诊断价值。GEPIA2 数据库验证发现5 个基因的表达情况与预测相符,仅NRAS基因表达在浆液性卵巢癌患者Ⅱ期、Ⅲ期、Ⅳ期有显著差异(P<0。05)。免疫浸润分析发现CDKN2A表达与aDC细胞浸润水平呈正相关(P<0。05,spearman相关系数0。353);CAV1 表达与Mast细胞浸润正向关(P<0。05,spearman相关系数0。327);NRAS与T help-er细胞浸呈正向关(P<0。05,spearman相关系数 0。362)。通过生物信息学方法筛选出与浆液性卵巢癌铁死亡相关的 5 个基因CAV1,NRAS,PSAT1,CDKN2A,GDF15,可能在浆液性卵巢癌的发生发展中起重要作用,有望成为该病诊断、治疗和预后的潜在分子生物标志物。

    浆液性卵巢癌铁死亡关键基因生物信息学