发现新药物(称为“药物发现”)是一项昂贵而耗时的任务。但是一种名为机器学习的人工智能技术可以大大加速这个过程,并以极低的成本完成这项工作。
发现新药物(称为“药物发现”)是一项昂贵而耗时的任务。但是一种名为机器学习的人工智能技术可以大大加速这个过程,并以极低的成本完成这项工作。
我和我的同事最近利用这项技术找到了三种有前景的老化缓解药物候选物,也就是能够减缓衰老并预防与年龄相关的疾病的药物。
老化缓解药物通过杀死衰老细胞来发挥作用。这些细胞在代谢上仍然“存活”,但无法再复制,因此被称为“僵尸细胞”。
无法复制并不一定是坏事。这些细胞的DNA受到了损害,例如皮肤细胞受到阳光照射导致的损伤,因此停止复制可以阻止损害的扩散。
但是,衰老细胞并不总是好事。它们分泌一系列炎症蛋白质,可以传播到周围的细胞。细胞在一生中遭受了各种攻击,从紫外线到化学物质的暴露,所以这些细胞会积累起来。
大量衰老细胞与多种疾病有关,包括2型糖尿病、COVID、肺纤维化、骨关节炎和癌症。
在实验室小鼠中的研究表明,使用老化缓解药物消除衰老细胞可以改善这些疾病。这些药物可以杀死僵尸细胞,同时保持健康细胞的存活。
已知大约有80种老化缓解药物,但只有两种已在人类中进行了测试:一种组合药物(达沙替尼和槲皮素)。能够找到更多可以用于不同疾病的老化缓解药物将是很好的,但是一个药物要上市需要花费10到20年的时间和数十亿美元。
五分钟内出结果
我和我的同事,包括爱丁堡大学和西班牙国家研究委员会IBBTEC-CSIC在圣坦德尔的研究人员,想知道我们是否能够训练机器学习模型来识别新的老化缓解药物候选物。
为此,我们用已知的老化缓解药物和非老化缓解药物的示例来训练AI模型。模型学会区分这两者,并可用于预测它们从未见过的分子是否也是老化缓解药物。
在解决机器学习问题时,通常我们会先在一系列不同的模型上测试数据,因为其中一些模型的表现往往比其他模型好。
为了确定表现最佳的模型,在过程开始时,我们从可用的训练数据中分离出一小部分,并在训练过程完成后将其隐藏起来,直到之后才使用这些测试数据来量化模型的错误率。错误率最低的模型获胜。
我们确定了最佳模型,并设置其进行预测。我们提供了4,340个分子,五分钟后它给出了一个结果列表。
AI模型确定了21种得分最高的分子,认为它们很有可能是老化缓解药物。如果我们在实验室中对原始的4,340个分子进行测试,至少需要几周的密集工作和5万英镑的成本,这还不包括实验设备和设置的费用。
然后,我们在两种类型的细胞(健康细胞和衰老细胞)上对这些药物候选物进行了测试。结果显示,在这21种化合物中,有三种(洋金丝桃甙、毛地黄甙和银杏素)能够消除衰老细胞,同时保持大部分正常细胞的存活。这些新的老化缓解药物随后进行了进一步的测试,以了解它们在人体中的作用方式。
更详细的生物学实验表明,在这三种药物中,毛地黄甙比同类已知老化缓解药物的表现更有效。
这种跨学科方法的潜在影响巨大,涉及数据科学家、化学家和生物学家的参与。在有足够高质量的数据的情况下,人工智能模型可以加速化学家和生物学家为疾病寻找治疗方法和疗法的出色工作,尤其是那些未得到满足需求的疾病。
在衰老细胞中经过验证后,我们现在正在人类肺组织中测试这三种候选老化缓解药物。我们希望在两年后能够报告我们的下一批结果。