-
加倍研究已知的蛋白质家族
2023-10-13 16:32:29 生活 -
导读 想象一下,研究人员用手电筒探索一个黑暗的房间,只能清楚地识别出单束光束中的内容。当谈到微生物群落时,科学家历来无法超越光束——更糟...
想象一下,研究人员用手电筒探索一个黑暗的房间,只能清楚地识别出单束光束中的内容。当谈到微生物群落时,科学家历来无法超越光束——更糟糕的是,他们甚至不知道房间有多大。
2023 年 10 月 11 日在线发表在《自然》杂志上的一项新研究强调了微生物的大量功能多样性,通过一种新方法通过观察微生物内部的蛋白质功能来更好地了解微生物群落。这项工作由能源部 (DOE) 联合基因组研究所 (JGI) 的科学家团队、位于劳伦斯伯克利国家实验室 (伯克利实验室) 的能源部科学用户设施办公室以及多个其他研究中心的合作者领导世界各地。
该论文的主要作者、现任生物医学科学研究中心亚历山大·弗莱明研究主任的乔治斯·帕夫洛普洛斯 (Georgios Pavlopoulos) 说:“迄今为止,我们已经将已知的蛋白质家族数量增加了一倍以上,并确定了许多新颖的结构预测。” “这是通过大规模并行计算对 13 亿种蛋白质进行的大规模分析。”
在 JGI 科学家的指导下,该团队开始执行一项任务,揭开隐藏在“黑暗”功能领域的秘密。他们的重点集中在破译蛋白质功能多样性的复杂世界上:新的蛋白质家族和尚未揭晓的微生物中的新功能。他们利用 26,000 多个微生物组数据集的集体力量(所有这些数据集均可通过公开的集成微生物基因组和微生物组 (IMG/M ) 数据库访问),成功地制作了新型宏基因组蛋白质家族 (NMPF) 目录。
“我们现在可以通过与这些蛋白质家族进行比较来分析新的数据集,或者进一步分析蛋白质家族以预测新功能,”该研究的资深作者、JGI微生物组数据科学小组负责人Nikos Kyrpides说。
揭示功能性“暗物质”
从土壤、胃到深海,无处不在的微生物群落能够在能源循环方面做出许多独特的事情——将生物质转化为乙醇或氢气,或将太阳能转化为氢气。
微生物群落的研究也极其困难。其中的许多微生物无法在实验室环境中培养。由于每个微生物群落都有其独特的微生物参与者组成及其所执行的功能,因此人工复制整个群落是不可能的。
宏基因组测序使研究人员能够通过样本的全基因组测序来研究这些群落的整个基因组成,而无法区分哪个基因属于群落中的每个微生物物种。因此,该过程取决于对现有基因组序列的参考。
其中一些蛋白质被科学家称为“已知的已知蛋白质”——也就是说,它们与具有已知功能的基因相似。其他基因被称为“已知的未知基因”——也就是说,它们与先前已知的来自分离生物体的基因相似,但我们仍然不确定它们的功能。
然而,如果群落中的某个基因与分离株中任何先前已知的基因都不匹配,那么科学家就无法了解其功能或起源。因此,这些基因通常作为无用信息从任何分析中被丢弃。这些代表“未知的未知数”,因为它们与我们已经定义的任何东西都不相似。
Kyrpides 说:“到目前为止,我们所知道的蛋白质家族中,有很大一部分——大约 30-50%——仍然没有任何已知的功能,但我们知道这些家族。” 然而,“近 20 年的宏基因组数据和宏基因组分析,仍然没有对宏基因组本身的蛋白质家族进行真正的分析。”
最近,其他研究团队利用人工智能的力量来解码蛋白质序列的语言,并获得其可能功能的提示。然而这些努力仅限于已知的蛋白质序列领域。
标 签:
免责声明:本文由用户上传,如有侵权请联系删除!