大连宏基因组分析软件和方法(三) 热心肠
宏基因组分析软件和方法(三)
今天是第1283期日报。
Nature子刊:Salmon不比对快速定量宏基因组基因
Nature Methods[IF:28.467]
① Salmon是一种准确快速定量转录本丰度的方法;② 它是第一个可校正转录组片段GC含量范围内偏差的定量工具,大大提高了丰度估计的准确性以及后续差异表达分析的可靠性;③ 新的双相并行推理算法和功能丰富的偏差模型与超快速读长映射过程结合在一起;④ 其计算速度快,硬盘空间占用少等优点,也在宏基因组基因定量中广泛应用;⑤ 软件支持多种常用安装方式,且支持多样本汇总为表格。
Salmon provides fast and bias-aware quantification of transcript expression
2017-03-06, doi: 10.1038/nmeth.4197
【主编评语】传统的定量工具采用比对的方法,对于人类几万个基因都需要消耗几小时,而面对微生物组动辄千万的基因更是费时费力。Salmon的非比策略具有速度上的极大优势,同时不会生成传播的巨型SAM格式比对文件。Salmon又是体现了出版平台对文章引用存在巨大影响的例子,该软件2015年发布在BioRxiv上面,两年只有10次引用,截止目前4年也仅有37次引用。而文章被Nature Methods接收发表后,短短两年引用高达1000多次,相同时间内引用量相差高达百倍,可见这28分的杂志确实获得了同行的广泛关注。(@刘永鑫-中科院-宏基因组)
高速宏基因组功能注释工具eggNOG-Mapper
Molecular Biology and Evolution[IF:14.797]
① 同源分配非常适合功能推断,但缺少好用的工具;② eggNOG-mapper是一种基于快速同源功能分配、可用于对宏基因组大型序列集进行功能注释的工具;③ 比BLAST方法结果的假阳性率降低了11%,比InterProScan结果的回收率提高了35%;④ 在计算时间方面,运行速度比BLAST快15倍,比InterProScan快至少2.5倍;⑤ 该工具可以单独使用,也可以作为在线服务从http://eggnog-mapper.embl.de获得。
Fast Genome-Wide Functional Annotation through Orthology Assignment by eggNOG-Mapper
2017-04-29, doi: 10.1093/molbev/msx148
【主编评语】eggNOG-mapper是一款又快又准的功能基因注释工具,比传统的BLAST或InterProScan方法的注释速度提高2到15倍,同时进一步提高了回收率和降低假阳性率,是目前宏基因组基因注释中的主流方法之一,强烈推荐。(@刘永鑫-中科院-宏基因组)
eggNOG 5蛋白功能层级注释数据库重大更新
Nucleic Acids Research[IF:11.147]
① eggNOG是一个直系同源蛋白组功能注释数据库,在基因组、宏基因组的基因功能注释方面有较多应用;② 本次升级为eggNOG 5.0,已扩展到基于25 038个基因组中挑选了4445个代表性细菌和168个古菌,以及477个真核生物和2502个病毒蛋白质组,较之前的4.5版本数据量增加了一倍;③ 改进了eggNOG在线服务,用于定制基因组或宏基因组数据集的快速功能注释和直系同源预测;④ 可在线使用,或下载数据至本地部署,请访问 http://eggnog5.embl.de。
eggNOG 5.0: a hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses
2018-11-12, doi: 10.1093/nar/gky1085
【主编评语】eggNOG是一个公共数据库,包含了直接同源关系、基因进化史和功能注释。本次仅从4.5更新到5.0版,数据量就增加了一倍,共计算了分布在379个分类水平上的4.4百万个直系同源群(OGs),以及它们的相关序列比对、系统发育、HMM模型和功能描述,同时改进了在线使用的易用性。(@刘永鑫-中科院-宏基因组)