本流程适用于环境微生物组(土壤、水体、空气)、人体肠道菌群、临床感染病原体检测、农业根际微生物及工业发酵菌群等领域的宏基因组测序数据分析。可支撑科研机构、医院检验科、疾控中心及生物技术公司开展大规模样本的微生物群落结构解析、功能基因挖掘与耐药基因筛查工作。
点击空白处退出提示
本流程适用于环境微生物组(土壤、水体、空气)、人体肠道菌群、临床感染病原体检测、农业根际微生物及工业发酵菌群等领域的宏基因组测序数据分析。可支撑科研机构、医院检验科、疾控中心及生物技术公司开展大规模样本的微生物群落结构解析、功能基因挖掘与耐药基因筛查工作。
功能模块
原始数据质控与去宿主(Fastp + Bowtie2)
基于Kraken2/Bracken的物种分类与丰度定量
基于HUMAnN3的功能基因通路注释
基于MEGAHIT/MetaSPAdes的宏基因组组装
基于MetaBAT2/CONCOCT的分箱与基因组重构
统计可视化(Krona热图、LEfSe差异分析、PCoA降维)
主要功能描述
自动化处理双端Illumina宏基因组测序数据,从原始FASTQ到最终报告的一站式分析。支持多线程并行、断点续跑和Docker/Singularity容器化部署。输出物种组成表、功能丰度矩阵、组装contigs及高质量MAGs,并提供交互式HTML报告,便于下游统计与发表级图表生成。
采用Nextflow DSL2语法构建,核心步骤封装为独立进程:fastp_qc(质控)、bowtie2_host_removal(去宿主)、kraken2_classify(物种分类)、bracken_abundance(丰度校正)、humann3_function(功能注释)、megahit_assembly(组装)、metabat2_binning(分箱)。流程通过params.yaml配置文件灵活调整参数,支持SGE/Slurm集群提交。输出目录按样本名组织,包含中间文件与汇总结果表。依赖管理使用conda环境或Docker镜像(nf-core/metagenomics为基础),确保跨平台可复现性。




评论