科学需要复制。许多克隆或同基因模式生物的发展就是证明。但研究人员不愿意将这些传统的动物模型系统用于进化或生态学研究中的某些问题,因为担心相关性或近亲繁殖。在很大程度上被忽视的是,有大量的脊椎动物物种在自然界中克隆繁殖。本研究重点介绍使用这些自然进化的表型复杂动物如何突破传统实验设计的界限,并有助于回答生态学和进化领域的基本问题。
Part.1专题目录专题一机器学习微生物组学专题二专题三机器学习生物医学专题四深度学习基因组学专题五机器学习代谢组学Part.专题一机器学习微生物组学课表第一天1.微生物学基础知识回顾2.机器学习基本概念介绍a.什么是机器学习b.监督学习、无监督学习c.常用机器学习模型介绍3.混淆矩阵4.ROC曲线第二天R语言简介与实操1.R语言概述2.Rstudio软件与R包安装3.R语言语法及数据类型4.条件语句和循环Linux实操1.Linux操作系统2.Linux操作系统的安装与设置3.网络配置与服务进程管理4.Linux的远程登录管理5.常用的Linux命令6.在Linux下获取基因数据第三天微生物组常用分析方法1.微生物丰度分析2.转录组丰度分析3.进化树分析4.降维分析第四天1.疾病预测应用:利用机器学习基于微生物组学数据预测疾病状态2.肠道菌群研究:机器学习研究饮食对肠道微生物的影响第五天机器学习模型训练和分析1.加载数据及数据归一化2.构建训练模型3.模型参数优化4.模型错误率曲线绘制5.混淆矩阵计算6.重要特征筛选7.模型验证,ROC曲线绘制利用模型进行预测利用机器学习基于微生物组学数据预测宿主表型1.加载数据2.数据归一化3.OUT特征处理4.机器学习模型构建5.绘制ROC曲线,比较不同机器学习模型模型性能评估利用机器学习基于临床特征和肠道菌群预测疾病风险1.加载数据2.机器学习模型构建3.交叉验证4.模型性能评估上下滑动查看更多内容Part.专题二第一天2.单基因遗传病数据库(实操)4.TALEN5.Zincfinger6.Baseeditor7.Primeeditor第二天1.如何选择正确Cas9蛋白类型2.gRNA设计和软件(实操)3.sgRNA修饰4.手动设计PegRNA的八个要点(实操)5.七种PegRNA辅助设计软件第三天1.AAV递送(组织靶向)2.脂质体递送3.核糖白递送4.高分子递送5.Virallikeparticles递送6.外泌体递送7.无机纳米粒递送8.电转9.超声10.显微注射第四天1.动物模型2.质粒3.分子克隆基础4.AAV设计(实操)7.如何提高Primeediting效率第五天2.临床试验3.主要公司、科学家和专利4.副作用和退市的产品5.FDA政策6.CRISPR在诊断中的应用7.CRISPRlibrary8.CRISPR与单细胞测序9.CRISPR与表观遗传学10.CIRPSR在植物学中的应用11.设计课题与评价(实操)上下滑动查看更多内容Part.专题三机器学习在生物医学中应用专题第一天机器学习及相关概念介绍机器学习基本概念介绍常用机器学习模型介绍主成分分析一致性聚类分析ROC曲线及时间依赖的ROC曲线生存分析及生存曲线预后模型介绍R语言入门R语言概述R软件及R包安装R语言语法及数据类型条件语句循环函数常用的机器学习相关的R包介绍第二天利用机器学习方法筛选疾病相关的生物标志物机器学习+生存分析预测患病风险机器学习+生存分析预测患者预后常用生物医学公共数据库介绍TCGA数据库介绍合并TCGA表达谱数据GEO数据库介绍GEO数据库检索第三天差异表达分析主成分分析机器学习模型构建特征筛选及重要性评估模型评估及ROC曲线绘制构建nomogram模型,绘制列线图矫准曲线绘制决策曲线绘制一致性聚类分析GSEA分析第四天差异表达分析主成分分析火山图,热图绘制GO和KEGG富集分析及可视化生存分析,生存曲线绘制一致性聚类分析训练集,测试集拆分单因素,多因素cox分析Lasso回归分析风险评估模型构建riskscore计算Nomogram模型构建,绘制列线图时间依赖ROC曲线绘制矫准曲线,决策曲线绘制第五天ceRNA网格构建miRNA,lncRNA,circRNA介绍miRNA,lncRNA,circRNA相关数据库及工具介绍实操部分差异mRNA,lncRNA,miRNA分析火山图,热图,聚类图,柱状图差异表达基因GO,KEGG富集分析,气泡图,柱状图,KEGG通路图展示生存分析,生存曲线绘制mRNA,lncRNA表达相关性分析,相关性散点图mRNA,lncRNA,miRNA网络构建cytoscape展示ceRNA网络,hub基因筛选上下滑动查看更多内容结果展示:主成分分析差异表达分析热图差异表达分析火山图GO和KEGG富集分析Part:专题四深度学习在基因组学中的应用第一天理论部分深度学习算法介绍1.有监督学习的神经网络算法1.1全连接深度神经网络DNN在基因组学中的应用举例1.2卷积神经网络N在基因组学中的应用举例1.3循环神经网络RNN在基因组学中的应用举例1.4图卷积神经网络G在基因组学中的应用举例2.无监督的神经网络算法2.1自动编码器AE在基因组学中的应用举例2.2生成对抗网络GAN在基因组学中的应用举例实操内容1.Linux操作系统1.1常用的Linux命令1.4查看探索基因组区域2.Python语言基础2.1.Python包安装和环境搭建2.2.常见的数据结构和数据类型第二天理论部分基因组学基础1.基因组数据库2.表观基因组3.转录基因组4.蛋白质组5.功能基因组实操内容基因组常用深度学习框架1.安装并介绍深度学习工具包tensorflow,keras,pytorch2.在工具包中识别深度学习模型要素2.1.数据表示2.2.张量运算2.3.神经网络中的“层”2.4.由层构成的模型2.5.损失函数与优化器2.6.数据集分割2.7.过拟合与欠拟合3.基因组数据处理3.1安装并使用keras_dna处理各种基因序列数据如BED、GFF、GTF、BIGWIG、BEDGRAPH、WIG等3.2使用keras_dna设计深度学习模型3.3使用keras_dna分割训练集、测试集3.4使用keras_dna选取特定染色体的基因序列等第三天理论部分卷积神经网络N在基因调控预测中的应用1.Chip-Seq中识别基序特征G4,如DeepG42.Chip-Seq中预测DNA甲基化,DeepSEA3.Chip-Seq中预测转录调控因子结合,DeepSEA实操内容复现卷积神经网络N识别基序特征DeepG4、非编码基因突变DeepSEA复现DeepG4从Chip-Seq中识别G4特征1.安装selene_sdk,复现DeepSEA从Chip-Seq中预测DNA甲基化,非编码基因突变第四天理论部分深度学习在识别拷贝数变异DeepV1.SNP微阵列中预测拷贝数变异V,DeepV2.RNA-Seq中预测premiRNA,dnnMiRPre实操内容1.复现DeepV利用SNP微阵列联合图像分析识别拷贝数变异2.复现循环神经网络RNN工具dnnMiRPre,从RNA-Seq中预测premiRNA第五天理论部分深度学习在识别及疾病表型及生物标志物上的应用1.从基因表达数据中识别乳腺癌分型的深度学习工具DeepType实操内容1.复现DeepType,从METABRIC乳腺癌数据中区分乳腺癌亚型第六天理论部分深度学习在预测药物反应机制上的应用实操内容1.预处理药物分子结构信息2.计算药物相似性上下滑动查看更多内容上下滑动查看更多Part.专题五机器学习代谢组学课表第一天A1代谢物及代谢组学的发展与应用代谢生理功能;代谢疾病;非靶向与靶向代谢组学;空间代谢组学与质谱成像;代谢流与机制研究;代谢组学与药物和生物标志物。
A2代谢组学实验流程简介A3色谱、质谱硬件原理色谱分析原理;色谱的气相、液相和固相;色谱仪和色谱柱的选择;质谱分析原理及动画演示;正、负离子电离模式;色谱质谱联用技术;LC-MS的液相系统A4代谢通路及代谢数据库几种经典代谢通路简介;能量代谢通路;三大常见代谢物库:HMDB、METLIN和KEGG;代谢组学原始数据库:MetabolomicsWorkbench和Metabolights.
第二天B1代谢物样本处理与抽提组织、血液和体液样本的提取流程与注意事项;用A抽提代谢物的流程与注意事项;样本及代谢物的运输与保存问题;B2LC-MS数据质控与搜库LC-MS实验过程中QC样本的设置方法;LC-MS上机过程的数据质控监测和分析;XCMS软件数据转换与提峰;B3R软件基础R和Rstudio的安装;Rstudio的界面配置;R的基本数据结构和语法;函数调用和debug;B4ggplot2安装并使用ggplot2ggplot2的画图哲学;ggplot2的配色系统;ggplot2画组合图和火山图;第三天机器学习C1无监督式机器学习在代谢组学数据处理中的应用大数据处理中的降维;PCA分析作图;三种常见的聚类分析:K-means、层次分析与SOM热图和hcluster图的R语言实现;C2一组代谢组学数据的降维与聚类分析的R演练(1)数据解析;(2)演练与操作;C3有监督式机器学习在代谢组学数据处理中的应用数据用PCA降维处理后仍然无法找到差异怎么办?
PLS-DA找出最可能影响差异的代谢物;VIPscore和coef的意义及选择;分类算法:支持向量机,随机森林C4一组代谢组学数据的分类算法实现的R演练(1)数据解读;(2)演练与操作;第四天D1代谢组学数据清洗与R语言进阶代谢组学中的t、fold-change和响应值;数据清洗流程;R语言tidyverseR语则表达式;代谢组学数据过滤;代谢组学数据Scaling原理与R实现;代谢组学数据的Normalization;代谢组学数据清洗演练;D2在线代谢组分析网页Metaboanalyst操作用R将数据清洗成网页需要的格式;独立组、配对组和多组的数据格式问题;Metaboanalyst的pipeline和注意事项;Metaboanalyst的结果查看和导出;全流程演练与操作第五天E1机器学习与代谢组学顶刊解读;学员实操。
上下滑动查看更多内容Part.2讲师介绍机器学习微生物组学主讲老师来自生物科技公司核心高管,曾在麻省理工学院、加州大学旧金山分校等机构工作,过去5年科研工作发表于Cell,PNAS等杂志全国各大高校、企业、科研院所从事人工智能、生命科学、代谢工程、有机合成、天然产物、药物、生物信息学、植物学,动物学、化学化工,医学、基因组学、农业科学、植物学、动物学,临床医学、食品科学与工程、肿瘤免疫与靶向治疗、全基因组泛癌分析、人黏连蛋白折叠基因组机、病毒检测、功能基因组、遗传图谱、基因挖掘变异、代谢组学、蛋白质组学、转录组学、生物医学、癌症、核酸、毒物学等研究科研人员及爱好者