流感和艾滋病疫苗研制之所以困难,是因为这些病毒的变异非常快,从而发生“病毒逃逸”,避开特定疫苗产生的抗体。
麻省理工学院的研究人员现在设计了一种新的模型,来分析病毒逃逸的过程。该模型可预测病毒表面蛋白的哪些部分更容易发生突变,哪些不太可能发生突变,从而为新疫苗的设计提供参考。
1月14日发表在《Science》期刊上的一项研究,确定了流感、艾滋病毒和SARS-CoV-2疫苗可能针对的病毒靶标。
病毒的基因突变促进病毒逃逸,然而,蛋白质又不能因此而失去功能。麻省理工学院的研究小组决定使用一种被称为语言模型的计算模型对这些标准进行建模,这种模型来自自然语言处理(NLP)领域。这些模型最初被设计用来分析语言中的模式,特别是某些单词同时出现的频率。然后,这些模型就可以预测哪些单词可以用来完成一个句子。
研究人员发现,这种模型也可以应用于生物信息,如基因序列的分析。在这种情况下,语法类似于确定特定序列编码的蛋白质是否具有功能的规则,语义类似于蛋白质是否能够呈现新的形状,帮助它逃避抗体。因此,使病毒能够逃脱的突变必须保持序列的语法性,但以一种有用的方式改变蛋白质的结构。
为了模拟这一过程,研究人员训练了一个NLP模型来分析基因序列中的模式。该模型可以在相对少量的信息上进行训练——在这项研究中,研究人员使用了60000条HIV序列、45000条流感序列和4000条冠状病毒序列。
“语言模型非常强大,因为它们可以学习这个复杂的分布结构,并从序列变化中获得一些对功能的洞见,”研究人员指出:“我们对每个氨基酸位置都有大量的病毒序列数据,模型通过训练数据学习氨基酸共现和共变的这些特性。”
一旦该模型被训练,研究人员即用它来预测冠状病毒刺突蛋白、艾滋病毒包膜蛋白和流感血凝素(HA)蛋白的序列,这些蛋白或多或少可能产生逃逸突变。
对于流感,该模型揭示了最不可能发生突变和产生病毒逃逸的序列是在HA蛋白的“茎部”。这与最近的研究一致。研究表明,针对HA茎部的抗体可以提供几乎所有的保护,以对抗任何流感毒株。
该模型对冠状病毒的分析表明,刺突蛋白的S2亚基最不容易产生突变。
在对HIV的研究中,研究人员发现,该蛋白的V1-V2高变区域有许多可能的逃逸突变,这与之前的研究结果一致,他们还发现了逃逸概率较低的序列。
研究人员现在正与其他人合作,利用他们的模型来确定癌症疫苗的可能目标,从而刺激人体自身免疫系统来摧毁肿瘤。它还可应用设计小分子药物,例如针对结核杆菌而不容易产生耐药。
基因分析技术是目前生物医学较常见的研究手段,但同时要预防外源性的DNA/RNA污染。可采用德国MB的PCR Clean喷雾或湿巾,快速有效地清除DNA或RNA污染。1分钟起效。 非碱性,无致癌性。
感谢缔一生物提供相关内容。
领取专属 10元无门槛券
私享最新 技术干货