大连热心肠先生: 不懂这10个E,不是专业搞微
热心肠先生: 不懂这10个E,不是专业搞微生物组的!
一夜之间,美国国家微生物组计划公布的消息,如平地一声雷,让羡慕嫉妒恨的中国科研和产业界人士再次被震撼;
点击阅读:《热心肠先生:3个关键词,读懂美国国家微生物组计划》
一夜之间,有些人甚至焦虑了,他们发现:微生物组研究已经一日千里,过去几年的突飞猛进,加上未来几年可能有的逆天突破,恐怕会彻底改变我们对这个世界的认识,而自己似乎进入得太晚了;
一夜之间,专业人士和普通大众,似乎都对微生物与疾病、健康的关系有了新的认识,似乎更明确了肠道微生物的核心作用。
确实,因为有了基因测序为代表的伟大工具,人类在认知自我和世界的路上,已经加足油门,这一夜之间,新的篇章又开启了。
而如果“一两年”也是很短暂的“一夜”,除了震撼人心的研究进展,我们还会发现:
一夜之间,很多科学背景不够的“科学家”可以花钱测序,在世界顶级学术期刊上发表“研究”论文;
一夜之间,热心肠先生这样的科普作者出现了,写几篇流传略广的科普文章,俨然成了“砖家”;
一夜之间,测序公司沸腾了,益生菌、益生元公司沸腾了,彷佛每一个研究进展、每一篇重磅论文,都是产品的背书,更是产品的卖点。
这“一夜之间”,确实任性地发生了很多让人兴奋而又诡异的事!
不严谨的实验、错误的数据、太随意的结论充斥在科学论文里;浮躁、商业化、铜臭味充斥在研究队伍里;不靠谱、伪科学、反科学充斥在产品形态里…
你会觉得意外么?
可惜,这是事实!
怎么办?
正好我前几天看到了一篇奇文《Suddenly everyone is a microbiota specialist! 突然之间,人人都成了菌群专家!》,核心内容是:
① 介绍10个“E”打头的英文关键词;② 说明如何通过改进实验和数据分析方法,以增加可信度;③ 呼吁数据产生后,要更为严谨下结论;④ 提醒人们看到相关研究要注意分辨利益相关性。
很显然,这是正本清源的好文章!
今天我试着把其中一些内容翻译成中文,配上图,夹带一点我的私货,分享出来,希望对你有帮助:
Extraction提取
话说我写这篇文章,还挺诚惶诚恐的,毕竟这是一篇专业性很强的科普,而自己上一次提取DNA,是在十几年前了。
大概过程我还是记得的:十几年前,在教学实验上,我们还需要自己配制试剂来提取DNA;在研究实验室会好很多,已经有了很好用的试剂盒,照流程一步步走,几次离心后就可以获得DNA。
十几年后的今天,看到奇文第一个E提醒大家要注意提取方法,还是蛮亲切的,也很认同:
不同的提取方法,会严重影响微生物组分析的最终结果;使用不同的DNA提取试剂盒,对同一个样本进行分析,会得到不同的微生物组成结果。
看到这个,你会不会心里一紧,会突然想要认真选择自己要用的试剂盒?
从一开始,就请慎之又慎,选择公认的靠谱的试剂盒!
E②
Environment环境
没有Control(对照),就没有发言权!
微生物无处不在、无孔不入,空气、PCR仪、移液枪、Eppendorf管、试剂甚至常用的试剂盒里,都有它们的存在。
在做实验的时候,一定别忘了把它们的DNA也提出来去测序,做数据分析的时候,一定别忘了“减去”它们。否则你做鼻腔擦拭样本、血液等含微生物本来就不多,甚至常规状态下基本无菌的样本,可能会得到南辕北辙的结果。
各大杂志的编辑们,看到不扣除阴性对照的微生物组论文投稿,建议咔擦一下,直接拒掉!
E③
Efficiency效率
看到上面这张PCR图,是不是感觉很熟悉、很亲切?但我要告诉你严酷的事实:
用标准PCR方法时,不同16S rRNA基因序列的扩增效率可能不一样,也就是说,有些序列扩增会快一些,有些会慢一些。
经过N个循环的扩增,因为效率不一,微生物的量会“人为”地发生变化,无法准确反映样本的实际状态。
而使用Micelle PCR,则可能有效避免这个问题。这个你最好照做,哪天如果因为我这一句提醒,你中稿了,别忘了发个红包给我。
呃(⊙o⊙)…
E④
Exaggeration夸大
如果哪天你在做16S rRNA基因序列分析时,突然很兴奋,感觉自己似乎“发现”了N个新物种!
你可不要高兴太早,要且慢且慢冷静一下,因为很有可能你分析的是嵌合序列。
什么是嵌合序列?看看上面这张图,你大概会懂吧?你看到的“新序列”,有可能是“老序列”被打断后重新拼接时组成的“混合序列”。
当软件告诉你它识别不出一段序列的时候,你务必排除嵌合序列的可能性,排除了之后,还依然判断是新序列,那可能要恭喜你发现了新物种!
也提醒你一句:避免嵌合序列的一种方法,仍然是使用Micelle PCR做基因扩增;而避免数据分析和组装时出现嵌合,使用一次能测超长序列的三代测序,也是可以适当考虑的。
呃(⊙o⊙)…不知道我是不是可以去“伪装”一下微生物分析专家了?
其实,我什么都不懂。
E⑤
Evaluation评估
用不同的聚集算法评估测序数据,可能会得到不同的结果;而精确的16S rRNA分类,要依靠SILVA、RDP、GreenGenes和NCBI等参考数据库,这些数据库本身含有很多未经确认或不完整的序列,这些“不完美”甚至“有些糟糕”的数据库,有时会毁掉“可能很完美”的数据。
所以,在评估你的微生物样本的时候,小心求证,别迷信软件和数据库,才能得到真正精准的结果。
呃(⊙o⊙)…
做个微生物组研究真的好心累啊!看来写科普还是比做实验容易不少!
E⑥
Elongation延伸
一般来说,研究者只会对16S rRNA基因进行一小段测序,在用来做微生物分类的时候,这基本不足以用来鉴定到“种”的水平。
有一些属,比如我特别喜欢的Akk菌所在的属,种与种之间的16S序列差别很大,用16S测序来鉴定种,问题不大;但很多其他属可不是这样,种与种之间16S序列差异很小,你就可能出错。
所以你要记得,用16S序列做分类,做到属水平的,靠谱,做到种水平的,可能很不靠谱!
想做到株?呃(⊙o⊙)…
16S貌似做不到!
E⑦
Equality平等
拷贝数啊拷贝数,据说很多人会在这个问题上栽跟头。
结核杆菌的基因组有1个16S rRNA基因拷贝,但拜氏梭菌却有14个!所以如果你只是做了常规16S序列分析,用16S rRNA的基因数量来说明微生物数量和相对丰度,那可能会大错特错。
小心啊!
很多研究用16S分析出来的微生物数据,很有可能是不靠谱的,很多数据应该只是“16S rRNA基因拷贝数”的结果,而不是微生物数量的结果。
失之毫厘谬以千里!呃(⊙o⊙)…
很多群众要说,我们不明真相多年啊,怎样才可以雾里看到花?据说结合定量或数字PCR可以解决一些问题,这个值得你去尝试。
E⑧
Evidence证据
现在,很多微生物组的分析,主要通过生物信息方法和推测,来说明某些微生物的重要临床作用,可研究者往往忽略“科赫法则”或者新的分子诊断标准和方法。
只是分析OUT和疾病的关系,而不是先找到对应生命体,然后用科赫法则确定关系,是不严谨的。
你可能会说很多细菌根本培养不了,怎么做科赫法则分析?
其实,现在越来越多原来认为不能培养的微生物可以被培养了,不信你看《自然》杂志最近的文章:
所以,不要把不能分离培养作为理由,来掩盖你的不严谨或者水平不够。
还有要注意的:只是做DNA测序和分析,你区别不了微生物是活的还是死的。
这在你分析采用抗生素或其他抑菌方法处理过的样本时,尤其可能得到错误结果:样本里的微生物可能已经“死亡”很长时间了,你测到了它们的尸体,却可能误以为它们还活着在兴风作浪。
怎样,收集证据支持研究这条路不好走吧?
在这里,也特别推荐上海交大赵立平教授关于“菌株水平分析”的综述,希望对正在寻找“证据”的你有帮助:
也插播一个广告:
我们现在有几个专门讨论微生物组研究和应用的500人大群,有意入群并跟赵立平老师等近3000位专业人士探讨的人,请加我的个人微信号:
加我时请注明单位和职务,我会邀请你进群。
我们继续:
E⑨
Enrolment造册
很多微生物研究,采用的样本量不够或者取样只能代表局部的情况,这可能是不严谨的。
做环境微生物研究时,多点取样、集合造册统计、综合性分析,才能真正看到生态系统中微生物的分布和角色。
那问题来了:做肠道微生物研究时,粪便样本只代表肠道最末端的情况,仅仅采集粪便做研究,足够代表整个肠道微生态么?
恐怕是不太够,但因为取样方法所限,目前还主要只能这样了,但如果有谁突破实验方法,会有大Paper发的。
呃(⊙o⊙)…是不是感觉越来越难混日子了?
科学本就需要严谨,做微生物研究,从今往后千万别再简单粗暴了,张飞也要学会绣花哦。
E⑩
Expectations预期
上面两句话,经常读文献的你很熟悉吧?
“靠谱”的杂志都要请作者说明利益相关问题,绝大多数人都“老实”地说自己的研究没有接受商业经费支持、没有利益相关。
你信么?呵呵
这个问题,在中国尤其值得问一问,有多少教授可以非常坦然地说,自己的研究背后没有商业考究?
不知道大家有没有遇到过:学术会议上,外场摆台做宣传的公司和人要花钱,内场本应专心做学术演讲但严重植入广告的人却还能收钱。
有没有感觉怪怪的?呵呵。
在阅读微生物组研究论文的时候,请多留一点心:很多论文是一些“科学家”从测序公司买的;很多研究是完全夹杂私货、完全是有商业企图的;很多临床实验是益生菌、益生元企业主导的,公布的数据是有偏向性的…
风干物燥,小心火烛!哦,不对,小心“‘做出来’的研究”!
呃(⊙o⊙)…引号很高能,我是不是又真相了?
今天的文章就是这样了,作为主要参考的《Clinical Microbiology and Infection》上的奇文,你可以到MC系统下载到:
希望奇文和我都能帮到你,我们一起愉快地“伪装”自己是“砖家”吧~
下一篇:没有了