预测细胞生长的人工智能技术有朝一日可以诊断癌症或开发新药
机器学习技术无处不在。搜索引擎、社交媒体、甚至网上银行都在使用它们。但这项技术仍在发展的一个领域是医学。
机器学习技术在医学上很有前途,可以用于许多应用,比如检测疾病的体征细胞或者发现治疗罕见疾病的新药。但是为了让机器学习方法能够做这些事情,它需要精确并且能够理解细胞是如何工作的。
我们的团队开发了一个准确机器学习方法可以预测细胞生长以一种研究人员很容易理解的方式。机器学习技术通过观察细胞在不同条件下的变化和行为来做出预测。这种方法有一天可能被用于诊断癌症,或预测某些药物如何与患者相互作用。
解读机器学习预测
从本质上讲,机器学习是人工智能(AI)的一种形式,在这种形式中,数据被用来教会计算机自己做决定,而不需要有人在那里为它们做决定。
但在生物学和医学领域,机器学习技术的一个主要缺点是,它们没有在学习过程中融入生物知识,比如潜在的细胞生物化学。一般来说,他们在做预测时也会忽略这些知识。这是因为这些系统将生物信息视为数据或数字,所以他们不考虑这些数字的实际生物学意义。
这些系统通常被称为“黑匣子”系统。这些是提供数据的AI,并为用户提供基于该数据中的模式的明确决策或预测。但是,由于其分析的复杂程度,通常不清楚AI如何做出决定。
黑匣子预测不是在高精度的领域中的主要问题 - 例如在用于预测垃圾邮件的软件中。但它在生物医学里是一个主要缺点。由于它们是多么复杂,研究人员无法解释黑匣子预测,这意味着它们几乎没有了解AI算法如何达到其预测。
另一方面,“白盒”系统的决策或预测可能稍不准确,但对用户来说,他们根据给定的数据推断出的关系更清楚。白盒系统的好处是,用户可以理解系统用来进行预测的信息,因为它是可以理解的,用户也可以询问决策本身,并从生物学的角度来解释它。
机器学习预测需要是可解释的和合理的,是值得信赖的,并在生物医学工作。在检测癌症方面,如果人工智能技术出现假阳性预言,它可能导致不必要的治疗,而错误的阴性预测可能导致疾病得不到治疗。理解机器学习算法做出的预测也将有助于在研究潜在药物及其可能产生的任何副作用时避免错误否定。
预测细胞生长
为了让人工智能方法在生物医学领域发挥作用,我们首先需要设计一种机器学习方法预测细胞生长,并了解什么是推动这种增长。了解细胞如何生长以及它们在不同条件下的增长变化如何是能够设计可以检测疾病存在或预测某些治疗可能有效的AI的第一步。
我们的团队评估了27种兼顾两者的机器学习方法基因表达谱以及机械代谢模型。基因表达谱显示了细胞在不同条件下组装蛋白质的过程是如何变化的。代谢模型显示了每个品系中潜在的细胞生物化学是如何工作的。
然后,我们建立了自己的白盒机器学习技术,这将使我们能够轻松解释人工智能是如何做出决策的,克服了以往计算机学习技术的不足。我们通过教会我们的人工智能使用基因表达和代谢模型的数据来做决定——这是以前从未做过的。
与仅使用基因表达数据相比,使用这两种模型来构建我们的机器学习方法在某些情况下提高了预测精度,最高可达4%。这有助于揭示基因表达和代谢活性之间未知的相互作用。
然后我们在1000多个不同的菌株上检查了我们的方法酿酒酵母- 烘焙,酿造和葡萄酒的酵母种类常见。这种类型的酵母的数据是广泛的可用性的,使其易于评估我们机器学习方法的有效性。
酵母的结果表明,随着我们的白盒方法,我们可以维持,在某些情况下,可以提高AI技术的预测准确性。但重要的是,我们还提供了对这些预测的解释,通过解释在各种条件下在细胞中活跃的生物化学反应。
我们的方法在学习过程中整合了生物机制的信息,如细胞生物化学。这克服了传统数据驱动方法的黑盒限制,并向可解释机器学习模型的发展迈进了一步。
这样做的好处是基于我们方法的机器学习模型将更值得信赖。我们的研究结果表明,将数据和知识驱动模型相结合,可以为研究人员提供更多关于细胞在特定条件下如何生长和工作的信息。
虽然这还需要使用人类细胞进行测试,但它在未来可能会有很多有前途的应用。例如,了解癌细胞如何受到其基因组成和环境条件的影响,是治疗和预防癌症的一个重大而紧迫的挑战。
用户评论