人工智能识别癌细胞

人工智能识别癌细胞
多个数据集的集成使信息基因集的提取更加可靠。A、B伊库鲁斯工作流。Ikarus是细胞分类的两步程序。在第一步中,集成多个专家标记的数据集可以提取稳健的基因标记。然后将这些基因标记用于由逻辑回归和网络传播组成的复合分类器。C签名推导和模型选择的交叉验证精度比较。在验证集上选择最小平衡精度作为选择的度量(即,在测试集上表现更差)。仅在一个数据集上训练的模型获得的平衡精度低于在两个数据集上训练的模型(双面Wilcoxon检验给出的p值为0.063)。Lee等人的结直肠癌和Laughney等人的肺癌的组合达到了最高的最低平衡精度,为0.97。D激光显微解剖胃癌资料中基因特征评分的比较。 The normal gene list shows lower signature scores in cancer samples (p value 0.052, N = 8, Mood's median test), when compared to the cancer-associated normal tissue. The tumor gene signature is significantly higher for cancer samples than the normal tissue (p value 0.003, N = 8, Mood's median test). E Primary cells and cancer cell lines have significantly different gene signature distributions. The normal-cell gene signature shows a gradual reduction in gene signature score distribution when compared in primary cells, cell lines, and tumor cell lines. The gene signature shows the complete opposite effect. Cancer cell lines have the higher gene signature score distribution, followed by cell lines, and primary cells. Distributions were compared using pairwise Wilcoxon tests with BH-FDR correction. All adjusted p values were lower than 0.01. F Patient-derived xenografts (PDX) show significantly higher tumor gene signature score, than the normal gene signature score. The same pattern is observed in multiple cancer types. Normal and tumor signature distributions were compared using Wilcoxon tests, for each cancer type, followed by BH-FDR correction. All adjusted p values were lower than 0.01. Credit:基因组生物学(2022)。DOI: 10.1186 / s13059 022量02683量1

癌细胞与健康细胞有何不同?MDC生物信息学家Altuna Akalin领导的团队在杂志上报道,一种名为“ikarus”的新型机器学习算法知道答案基因组生物学.人工智能程序发现了肿瘤的一个基因特征。

在识别海量数据中的模式方面,人类根本不是人工智能(AI)的对手。特别是人工智能的一个分支通常用于在数据集中寻找规律——无论是股票市场分析、图像和语音识别,还是单元格分类。为了可靠地区分目前,由Helmholtz协会(MDC) Max Delbrück分子医学中心生物信息学和组学数据科学平台负责人Altuna Akalin博士领导的团队开发了一种名为“ikarus”的机器学习程序。

该项目在不同类型的肿瘤细胞中发现了一种共同的模式由基因的特征组合组成。根据该团队在杂志上发表的论文基因组生物学,该算法还在该模式中检测出了以前从未明确与癌症相关的基因类型。

机器学习本质上是指算法使用训练数据来学习如何自己回答某些问题。它通过搜索数据中的模式来帮助它解决问题。在训练阶段之后,系统可以从它所学到的知识中进行归纳,以评估未知数据。该论文的第一作者Jan Dohmen说:“在专家们已经明确区分‘健康’细胞和‘癌细胞’的情况下,获得合适的训练数据是一个重大挑战。”

成功率高得惊人

此外,单细胞测序数据集通常有噪声。这意味着它们所包含的关于单个细胞的分子特征的信息不是很精确——也许是因为每个细胞中检测到的基因数量不同,或者因为样本并不总是以相同的方式处理。正如Dohmen和他的同事Vedran Franke博士(该研究的联合负责人)报告的那样,他们筛选了无数的出版物,并联系了相当多的研究小组,以获得足够的数据集。该团队最终使用了来自肺癌和结直肠癌细胞的数据来训练算法,然后将其应用于其他类型的肿瘤。

在训练阶段,ikarus必须找到一个特征基因列表,然后用来对细胞进行分类。“我们尝试并改进了各种方法,”Dohmen说。正如三位科学家所述,这是一项耗时的工作。“关键是伊卡拉斯最终使用了两个列表:一个是癌症基因,一个是来自其他细胞的基因,”弗兰克解释说。在学习阶段之后,该算法也能够可靠地区分其他类型癌症中的健康细胞和肿瘤细胞,例如在癌症中来自肝癌或成神经细胞瘤患者。它的成功率往往非常高,这甚至让研究小组都感到惊讶。阿卡林说:“我们没想到会有一个共同的特征,如此精确地定义了不同类型癌症的肿瘤细胞。”“但我们仍然不能说这种方法是否适用于所有类型的癌症,”Dohmen补充道。为了使伊karus成为癌症诊断的可靠工具,研究人员现在想在其他类型的肿瘤上进行测试。

人工智能作为全自动诊断工具

该项目旨在远远超越“健康”与“癌细胞”的分类。在最初的测试中,ikarus已经证明了该方法也可以区分其他类型(和某些亚型).阿卡林说:“我们希望使这种方法更加全面,进一步发展,以便它可以在活检中区分所有可能的细胞类型。”

在医院里,病理学家倾向于只在显微镜下检查肿瘤组织样本,以确定不同的细胞类型。这是一项费时费力的工作。有了ikarus,这一步有一天可能会变成一个完全自动化的过程。此外,Akalin指出,这些数据可以用来得出关于肿瘤直接环境的结论。这可以帮助医生选择最好的治疗方法。因为癌变组织的构成和微环境往往表明某种治疗或药物是否有效。此外,人工智能在开发新药方面也可能有用。阿卡林说:“Ikarus让我们识别出潜在的癌症驱动基因。”新的治疗剂可以用于靶向这些分子结构。

这份出版物的一个显著特点是,它完全是在COVID大流行期间编写的。所有参与者都不在他们在柏林医学系统生物学研究所(BIMSB)通常的办公桌前,该研究所是MDC的一部分。相反,他们在家庭办公室,彼此之间只进行数字交流。因此,在弗兰克看来,“这个项目表明,在这些条件下,可以创建一个数字结构来促进科学工作。”


进一步探索

研究人员开发了分离肿瘤样本中组织类型的方法

更多信息:Altuna Akalin等人,利用机器学习在单细胞水平识别肿瘤细胞,基因组生物学(2022)。DOI: 10.1186 / s13059 022量02683量1基因组生物学.生物医学中心.co . 6/s13059-022-02683-1
期刊信息: 基因组生物学

引用:人工智能识别癌细胞(2022,6月10日)检索自2022年7月7日//www.pyrotek-europe.com/news/2022-06-ai-cancer-cells.html
这份文件受版权保护。除为私人学习或研究目的而进行的公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。
280股票

对编辑的反馈