西北工业大学尚学群教授团队在《生物信息学》等期刊上发表基于神经网络进行miRNA-疾病关联识别等三篇学术研究成果

作者:王晓昱

日前,西北工业大学计算机学院数据挖掘与生物信息实验室(Data Mining and Bioinformatics Lab of NWPU)团队在生物信息学研究方法取得重大学术进展。

由尚学群教授团队中的彭佳杰副教授、惠薇薇、李倩倩等人研究的一种基于学习框架的使用神经网络进行miRNA-疾病关联识别研究在Bioinformatics期刊(SCI 1区)发表。

microRNA(miRNA)是一种非编码RNA,在许多生物过程中起着重要作用。大量研究表明,miRNA与人类疾病有关,表明miRNA可能是各种疾病的潜在生物标志物。因此,揭示miRNA与疾病/表型之间的关系非常重要。团队提出了一种新的基于学习的框架,MDA-CNN,用于miRNA-疾病关联鉴定。该模型首先基于包括疾病相似性网络,miRNA相似性网络和蛋白质-蛋白质相互作用网络的三层网络捕获疾病和miRNA之间的相互作用特征。然后,它使用自动编码器自动识别每对miRNA和疾病的基本特征组合。最后,将简化的特征表示作为输入,它使用卷积神经网络来预测最终的标签。评估结果表明,所提出的框架在miRNA-疾病关联预测和miRNA-表型关联预测这两项任务上都大大超过了一些最先进的方法。

由尚学群教授团队中的彭佳杰副教授、卢俊雅同学等人发表的识别长时间表型实验中的新兴现象在Bioinformatics期刊发表。

表型分析能力,准确度和通量的快速提高极大地增加了表型数据的数量和多样性。我们开发了一种新算法,用于识别大规模时间植物表型分析实验中出现的现象。新兴现象被定义为在相对短的时间内表现出连贯表型模式的一组基因型。新兴现象是高度短暂和多样化的,并且在环境条件和发展方面依赖于复杂的方式。我们提出了一种新兴的现象识别工具,叫做Temporal Emerging Phenomenon Finder(TEP-Finder)。使用大规模纵向表型数据作为输入,TEP-Finder首先将复杂的表型模式编码为动态表型网络。然后,使用基于最大团的方法从动态表型网络识别不同时间尺度的新兴现象。同时,组成了一个新兴现象的有向无环网络来模拟新兴现象之间的关系。将TEP-Finder与两种最先进的算法进行比较的实验表明,TEP-Finder发现的新兴现象更具功能性,强大且具有生物学意义。

由尚学群教授团队中彭佳杰副教授、王晓昱发表的使用基于基因本体的深度神经网络增强单细胞测序数据中聚类效果的文章被BMC Bioinformatics期刊(SCI 2 区)接受。

单细胞RNA测序(scRNA-seq)用于测定大量细胞的各个转录组。单细胞水平的基因表达为更好地理解细胞功能和生物医学领域的新发现提供了机会。为了确保基于单细胞的基因表达数据被恰当地解释,开发新的计算方法是至关重要的。在本文中,我们尝试重新构建基于基因本体论(GO)的神经网络,用于降低scRNA-seq数据的维数。通过将GO与无监督和监督模型相结合,提出了两种新方法,分别命名为GOAE(Gene Ontology AutoEncoder)和GONN(Gene Ontology Neural Network)。评估结果表明,所提出的模型优于一些最先进的降维方法。此外,与GO合并,我们提供了解释基于神经网络的模型背后的潜在生物机制的机会。

恭喜尚学群教授团队在生物信息学领域取得巨大成果。西北工业大学计算机学院数据挖掘与生物信息实验室在尚学群教授的带领下专注于数据挖掘和机器学习,开发用于分析组学数据和教育大数据的高性能算法。这些生物学数据包括但不限于DNA甲基化,RNA-seq,蛋白质-蛋白质相互作用,基因表达谱,细胞途径,基因-疾病关联等。我们的目标是提高我们对细胞过程,分子机制,进化和 使用计算机方法在分子水平上进行遗传疾病。教育数据挖掘旨在发现教育中的潜在行为模式,从而提高教育质量。教研室诚挚的欢迎各位同学加入!