研究人员仅通过文本数据准确地识别患有PTSD的人
艾伯塔省大学的研究人员已经培训了一种机器学习模型,以通过分析文本数据来识别具有80%精度的创伤后应激障碍的人。该模型有一天可以用作可访问且廉价的筛查工具,以支持卫生专业人员通过远程医疗平台检测和诊断PTSD或其他精神健康障碍。
精神病学博士领导该项目的候选人杰夫·萨瓦哈(Jeff Sawalha)对乔纳森·格拉奇(Jonathan Gratch)在南加州大学创意技术研究所(USC Creative Technologies)创建的数据集进行了文本分析。情感分析涉及获取大量数据,例如一系列推文的内容,并对它们进行分类,例如,看到有多少人表达了积极的想法以及有多少人在表达负面思想。
“我们想严格看一下情感分析从这个数据集中,您是否可以使用这些访谈的情感内容来正确识别或区分PTSD的人,” Sawalha说。
USC中的文字数据集通过人造角色埃莉(Ellie)进行的250次半结构化访谈收集视频会议致电188人没有PTSD,并与PTSD致电87人。
Sawalha和他的团队能够通过分数来识别患有PTSD的人,这表明他们的演讲主要是中性或负面反应。
“这与许多关于情感和PTSD的文献一致。有些人倾向于中立,麻木情绪,也许不会说太多。然后还有其他人表达他们的负面情绪。”
该过程无疑是复杂的。例如,即使是一个简单的短语,例如“我不讨厌”这样的简单短语,可以证明对分类构成挑战,Russ Greiner,研究合着者,计算机科学系教授和艾伯塔省机器情报学院的创始科学总监。但是,Sawalha能够收集有关哪些人从文本数据中获得PTSD的信息这一事实为将类似模型应用于其他数据集应用于其他心理健康障碍的可能性打开了大门。
Sawalha说:“文本数据无处不在,它是如此可用,您拥有很多。”“从机器学习的角度来看,有了这么多数据,它可能会更好地学习一些复杂的模式,以帮助区分患有特定精神疾病的人。”
下一步涉及与A的合作者合作,以查看集成其他类型的数据(例如语音或运动)是否可以帮助丰富模型。此外,一些神经系统疾病,例如阿尔茨海默氏症以及一些心理健康障碍Sawalha解释说,就像精神分裂症具有强大的语言成分一样,使它们成为了另一个潜在的分析领域。
该研究发表在精神病学领域。
进一步探索