AI 药物发现呈爆炸式增长。
无论是否过度炒作,人工智能药物发现的投资从 2014 年的 4.5 亿美元跃升至 2021 年的 580 亿美元。所有制药巨头,包括拜耳、阿斯利康、武田、赛诺菲、默克和辉瑞,都加大了支出,希望创造新时代的人工智能解决方案,将为流程带来成本效益、速度和精度。
长期以来,传统的药物发现一直是出了名的困难。将一种新药推向市场至少需要 10 年,花费13 亿美元。而这仅适用于在临床试验中取得成功的药物(只有十分之一)。
因此,我们对寻找发现和设计药物的新方法产生了兴趣。
AI 已经帮助确定了有前途的候选疗法,而且不需要数年,而是数月甚至数天。
在本文中,我们将探讨 AI 药物发现如何改变行业。我们将研究成功案例、AI 优势和局限性。我们走吧。
药物发现过程通常始于科学家确定体内与疾病有关的靶标,例如特定蛋白质或激素。然后他们使用不同的方法来寻找一个可能的解决方案,一个候选药物,包括:
一旦发现了潜在的候选药物(称为先导化合物),就会在细胞或动物中进行测试,然后进入包括三个阶段的临床试验,从一小群健康志愿者开始,然后进行到更大的患有具体情况。
人工智能涵盖各种技术和方法,涉及使用复杂的计算方法来模仿人类智能的要素,例如视觉感知、语音识别、决策制定和语言理解。
人工智能始于 1950 年代,只是一系列简单的“如果,则规则”,并在开发出更复杂的算法后二十年后进入医疗保健领域。自 2000 年代深度学习问世以来,人工智能在医疗保健领域的应用得到了扩展。
一些人工智能技术正在赋能药物设计。
机器学习 (ML)侧重于训练计算机算法从数据中学习并提高其性能,而无需明确编程。
ML 解决方案包含各种分支,每个分支都有自己独特的特征和方法。这些分支包括有监督和无监督学习,以及强化学习,在每个分支中,都有用于实现特定目标的各种算法技术,例如线性回归、神经网络和支持向量机。 ML 有许多不同的应用领域,其中之一是 AI 药物发现领域,它可以实现以下功能:
深度学习 (DL) 是基于使用人工神经网络 (ANN) 的 ML 的一个子集。人工神经网络由相互连接的节点或“神经元”组成,这些节点通过称为“突触”的通路连接。就像在人脑中一样,这些神经元协同工作以处理信息并做出预测或决策。神经网络拥有的互连神经元层数越多,它就越“深”。
与只能在结构化数据中识别模式的监督和半监督学习算法不同,深度学习模型能够处理大量非结构化数据,并在几乎不需要人工监督的情况下做出更高级的预测。
在 AI 药物发现中,DL 用于:
NLP 依赖于语言学、数学和计算机科学(包括 DL 模型)的技术组合来分析、理解和生成人类语言。 AI 药物发现研究通常使用 NLP 从结构化和非结构化数据中提取信息以完成以下任务:
在过去几年中,制药行业的公司已采取措施将 AI 纳入其研究方法。这包括建立内部 AI 团队,聘请 AI 医疗保健专业人员和数据分析师,支持专注于 AI 的初创公司,以及与技术公司或研究中心合作。
多种因素共同推动了这一趋势。
最近的技术进步已经改变了 AI 药物发现研究的传统重点。
由于该行业的大多数公司(根据BiopharmaTrend AI 报告,到 2022 年大约有 150 家)继续忙于设计小分子,这些小分子很容易在计算上表示并进行大规模比较,因此人们对人工智能的新应用也越来越感兴趣在药物发现方面。
许多公司开始采用 AI 来设计生物制品(77 家公司)并发现指示疾病存在或进展的生物标志物 (59)。其他人专注于构建包罗万象的 AI 药物发现平台、识别新目标或创建本体——不同实体(如化合物、蛋白质和疾病)之间关系的结构化表示。
由于人工智能人才短缺的情况没有缓解的迹象,人工智能药物发现的准入门槛实际上已经降低。技术供应商和制药巨头正在发布越来越复杂的人工智能平台,包括随时可用的无代码和拖放系统,使非人工智能专家能够将人工智能集成到他们的研究中。这些发展在行业加速采用人工智能方面发挥着重要作用。
学术界和业界开展的 AI 药物发现项目已经在药物发现的整个价值链中取得了首批成功的成果。例子包括:
AI 是一种强大的工具,有望彻底改变制药行业。凭借其分析大量数据和做出预测的能力,人工智能可以通过以下方式帮助研究人员克服长期阻碍药物发现过程的障碍:
据 Insider Intelligence 称,AI 可为制药行业节省高达 70% 的药物发现成本。人工智能在药物发现方面的潜力确实令人兴奋,但要充分利用它,首先需要解决一些障碍。
谈到人工智能,它总是归结为输入数据。不允许整合的数据孤岛和遗留系统是任何领域人工智能研究的重大障碍。在制药行业,问题可能更为突出。
制药公司传统上不善于共享数据,无论是临床研究的结果还是去识别化的患者信息,而他们拥有的大量数据可能会为原始研究人员从未考虑过的问题提供答案。
当最终涉及共享数据时,它通常是不完整的、不一致的或有偏见的,就像用于预测对药物发现至关重要的蛋白质-配体结合亲和力的数据集一样。在某些情况下,数据甚至可能无法反映整个人口,人工智能模型在现实场景中可能存在不足。
生物系统的绝对复杂性使得基于人工智能的分析和预测其行为的时间和空间变化变得困难。
生物系统中存在大量复杂和动态的相互作用,其中蛋白质、基因和细胞等每个元素都可以具有多种功能,并受到多种因素的影响,包括遗传变异、环境条件和疾病状态。
不同元素之间的相互作用也可以是非线性的,这意味着一个元素的微小变化可能导致整个系统发生巨大变化。例如,控制细胞分裂的单个基因可能对肿瘤的生长产生很大影响,或者多种蛋白质之间的相互作用可能导致高度特异性和复杂结构的发展,例如细胞的细胞骨架。
另一个挑战是缺乏合格的员工来处理人工智能药物发现工具。
在 AI 药物发现中使用神经网络已经突破了可能的界限,但缺乏它们的可解释性构成了重大挑战。被称为黑匣子的人工智能模型可能会产生最准确的预测,但即使是工程师也无法解释其背后的原因。这在深度学习中尤其具有挑战性,因为随着层数的增加,理解每一层输出的复杂性也会增加。
这种缺乏透明度会导致有缺陷的解决方案,并降低研究人员、医疗专业人员和监管机构对人工智能的信任。为了应对这一挑战,人们越来越需要开发可解释、值得信赖的人工智能。
正在改变患者游戏规则的新药不断涌现。
在 1980 年代 HIV 被确定为 AIDS 的原因后仅仅 15 年,制药业就开发了一种多药疗法,可以让受病毒影响的人过上正常的生活。诺华的格列卫延长了白血病患者的生命。来自 Vertex Pharmaceuticals 的 Incivek 使丙型肝炎治愈率提高了一倍。默克公司的 Keytruda 可将患者接受手术切除黑色素瘤后癌症复发的风险降低 35%。
但并非所有新药都是生而平等的。
最近在德国对 200 多种新药进行的分析表明,只有 25% 的药物比现有疗法具有显着优势。其余药物产生的益处很小或没有,或者它们的影响不确定。
鉴于药物发现的成本高昂和耗时的性质,制药行业显然需要重大变革。这就是人工智能药物发现可以发挥作用的地方。人工智能很有可能做出超越加速临床时间的变革性贡献。
考虑您自己的 AI 药物发现项目?给我们写信。凭借多年为医疗保健创建 AI 解决方案的经验,我们是您合适的合作伙伴。