生物信息学是新兴学科,广泛应用于生物医学基础研究与临床实践中。当前社会急需生物信息专业人才。本课程主要讲授生物信息学在不同生物医学研究方向上的应用,主要包括以下几块内容:
介绍抗原表位的常用预测软件,抗原空间表位的预测算法设计,工具使用。抗原表位突变与免疫保护的计算方法。以传染病抗原为例,介绍抗原突变与免疫逃逸的计算技术。免疫分子相互作用界面特异识别的结构解析。
测定基因表达水平与变化是生物医学研究必不可少的。讲解基因芯片与RNA-seq两种测定转录组的技术、原理、数据质控分析、基因表达水平计算、与基础研究中的应用,及二者的比较。介绍基于RNA-seq数据miRNA的表达计算与新miRNA的预测。讲解如何正确选择与设定RNA-seq方案,及单端与双端测序的区别与应用。
介绍高通量测序在基因诊断与精准医疗中的应用。
机器学习理论与方法不仅是人工智能领域的核心研究问题,而且已成为近年来数据科学以及计算机科学与技术领域与其他学科交叉中最活跃的研究分支之一。该技术是一门理论与应用并重的技术科学,以概率统计分析技术、数学、定量学习理论和计算机信息处理技术为基础,研究客观模式及数据的机器分类,聚类,回归等算法及其实现。同时,机器学习在生物信息学研究中具有广泛的应用前景,是生物数据处理和分析的主要支撑技术之一。本课程将以下两个教学目标进行有机的结合:一是掌握典型的机器学习算法并根据实际应用改进现有方法,发展新的机器学习方法;二是将机器学习算法应用于生物数据及生物问题的解决和处理上,进行案例分享。
1)单细胞转录组数据分析,细胞类型鉴定及工具,细胞相互作用分析;2)拟时分析和发育路径推断,单细胞前沿技术与实际应用,空间转录组数据分析。
5. 单细胞RNA测序在免疫细胞发育与肿瘤免疫中的应用
肿瘤细胞异质性是研究肿瘤中难以绕过的问题。近几年单细胞技术的出现很好地解决了该问题。这里主要讲授单细胞RNA测序技术,及其在免疫细胞发育与肿瘤免疫研究中的应用。内容包括:单细胞RNA测序的研究进展介绍,ILC细胞发育的研究背景介绍,单细胞cDNA文库的制备,单细胞RNA测序结果的生物学意义分析。肿瘤免疫与免疫疗法的研究进展介绍,肿瘤浸润淋巴细胞(TIL)的异质性问题,肿瘤细胞的异质性问题与肿瘤干细胞,单细胞RNA测序揭示肿瘤的异质性问题。
ChIP-seq数据特征及分析方法,包括三部分内容:1)介绍基于ChIP的技术(包括ChIP-chip、ChIP-seq、ChIP-exo等)的原理,2)介绍对ChIP-seq数据进行质量控制的各种指标及各自的原理;3)介绍对ChIP-seq数据进行分析的基本思路和方法。
DNA甲基化数据特征及分析方法,包括三部分内容:1)介绍DNA甲基化的典型作用、甲基化和去甲基化的机制、DNA甲基化的物种特异性等,2)介绍基于抗体富集、酶切、碱基转换等高通量绘制DNA甲基化的方法原理及数据特点,3)介绍高通量绘制DNA羟甲基化等其他修饰的方法基本原理。
扩增子测序数据的特点及基本分析流程;扩增子测序数据分析的主流工具,比如QIIME和PICRUSt等;α多样性和β多样性分析;OTU的概念以及序列聚类分析常用算法;物种注释分析和常用的物种注释数据库;序列比对和系统发育树构建;功能预测;扩增子测序数据的应用范围。
宏全基因组测序数据的特点及基本分析流程;基因组拼装原理和常用的算法;基因预测的原理和算法;宏全基因组数据分析的主流工具,比如MetaPhlAn2和HUMAnN等;宏全基因组测序数据的预处理和评估;物种组成计算和功能注释工具使用;宏全基因组测序序列拼装技术和评估;基于组装结果进行基因预测技术;利用序列比对注释基因及基因丰度统计;熟悉常用的功能注释数据库;宏全基因组测序数据的应用范围。
分子系统学是生物信息技术的重要应用领域,近年来取得了巨大成果,初步构建了地球生命单一起源的演化框架,建立了一整套完整理论和复杂算法。课程内容主要讲授分子系统学的基本理论和技术上可操作的具体方法。初步了解系统发育树的构建原理和方法,学习相关软件的原理和操作方法,以及如何绘制系统树。
介绍生物信息学网络资源,生物信息学主要数据库的组织方式和实际应用,常用分子生物学数据的检索和信息提取,常用数据分析、预测工具的使用。
基于组学数据的非编码RNA的识别与功能分析,主要包括整合高通量的多组学数据进行新型非编码RNA、及其癌症中的异常非编码RNA识别及其功能研究;非编码RNA翻译潜能研究;非编码RNA在细胞中的调控角色及调控网络研究。