浏览历史会无意中透露出一个人的健康状况吗?
几年前的一天,宾夕法尼亚大学的急诊科医生阿里·弗里德曼(Ari Friedman)决定看看,如果他拒绝了医学杂志网站上的第三方cookie,会发生什么。弗里德曼说:“我读了足够多关于隐私和泄露的内容,以及数据的情况,我想关掉它们。”
他不仅找不到他想要的那篇杂志文章,甚至连那期杂志的目录都找不到。“我很震惊,”他说。“我对学术界仍然抱有很多理想主义,这与这些期刊的使命——分享知识——背道而驰。”
那时,弗里德曼除了在需要查看需要cookie的东西时接受cookie外,别无他法。但这段经历一直困扰着他,以至于他把这个课题纳入了自己的研究议程,而他的研究议程原本是围绕老年学和老年急诊医学展开的。
由此产生了宾夕法尼亚大学梅隆大学数字健康隐私倡议,弗里德曼现在与宾夕法尼亚大学医学院的马修·麦考伊和卡耐基梅隆大学的计算机科学家卢乔·鲍尔共同管理该倡议。由公共利益技术大学网络(PIT-UN)资助,由SNF Paideia项目在宾夕法尼亚大学推动,该倡议旨在精确查明常规收集非健康数据可能会无意中透露一个人的健康状况,以及这对从保险覆盖范围到信用评分等一系列领域的影响。
在成立的第一年,该组织一直致力于在整个在线健康生态系统中全面绘制第三方跟踪地图,包括在网站上医学期刊和医院。根据McCoy和Friedman的说法,下一步是评估这种跟踪如何导致对一个人、定向广告等的推断。
“在网络的许多不同角落,你无法访问健康信息而不被追踪,”医学伦理和卫生政策助理教授McCoy说。“大多数人可能知道cookie,但他们可能没有考虑过它的含义,也没有考虑过让一个实体知道你所查看的所有页面意味着什么。我们希望帮助人们理解为什么这很重要。”
大流行期间的在线浏览
当弗里德曼于2019年加入宾夕法尼亚大学佩雷尔曼医学院时,他开始思考他的研究议程的轨迹。在与宾夕法尼亚大学医学伦理学家Atheendar Venkataramani的一次早期谈话中,弗里德曼描述了他为一家医学杂志网站关闭饼干时撞到的一堵墙。文卡塔拉马尼建议他和麦考伊谈谈,很快两人就开始合作,与当时在CMU的宾夕法尼亚校友蒂莫西·利伯特(Timothy Libert)合作,后者后来离开母校,在私营部门工作。
然后大流行爆发了。麦科伊说:“几乎很难让自己回到这种思维空间,但人们早期真正担心的一件事是这些接触追踪和接近检测应用程序对隐私的影响。”相反,人们并不担心每次有人访问与COVID-19有关的网站时都会ping到数十个实体。
研究人员决定分析500个左右流量最大的与covid相关的网站,例如,人们用来了解新病毒症状的网站,或者找到一个测试地点。“我们想弄清楚,如果你访问了其中一个网站,有多少人能知道你访问了这些网站?”麦科伊说。“即使在人们不希望被跟踪的学术和政府网站上,这种第三方跟踪也很普遍。”
具体来说,研究人员发现,99%的这些网页包括第三方数据请求,89%的网页包括第三方cookie,这些结果在互联网上共享美国医学协会杂志2020年10月。
大约在同一时间,弗里德曼和麦考伊了解到pitun,这是宾夕法尼亚大学于2020年加入的学院和大学的合作伙伴关系。几年来,pitn - un已经为旨在“在大学层面促进公众对技术的兴趣”的项目提供了数百万美元的种子基金。通过2021年PIT-UN挑战,并在SNF Paideia计划的支持下,研究人员获得了正式启动宾夕法尼亚大学- cmu数字健康隐私倡议的资金。
影响和长期解决方案
自从他们在COVID-19网站上发表了第一篇论文以来,他们已经发表了关于医学杂志网站的研究结果,其中一篇发表在JAMA网络开放关于阻止cookie的用户访问的拒绝(受到导致该倡议的原始体验的启发),以及另一个在美国医学会健康论坛关于此类网站上第三方跟踪的流行程度。4月中旬,他们在杂志上发表了最新的研究结果老年学与老年医学,关于老年人在线健康隐私风险。
麦科伊说:“现在,我们真的处于第二年的第一季度,正在采取下一步措施,了解正在进行这种跟踪的公司如何利用它来推断你的健康状况,并向你投放不同的广告。”“例如,如果一个人的浏览记录显示他被诊断患有糖尿病,那么他得到的广告是否与那些没有被诊断患有糖尿病的人不同?”
“我们一遍又一遍地记录,大多数与健康相关的网页都有一些跟踪,”弗里德曼说。“这意味着什么?”
虽然他和麦考伊还不知道答案,但他们有一些猜测。这些范围从相对无害的广告定位到更具破坏性的隐私损失,以及可能对信用评分、保险范围和人们生活中许多尚未被发现的方面产生的多米诺骨牌效应。出于这个原因,他们说,他们希望这项研究也能让消费者更多地意识到他们浏览历史的潜在影响。
麦考伊说,大多数人只是在弹出的询问cookie使用情况的窗口上点击“是”,而没有仔细考虑他们同意了什么。“现在网络的设置方式,除了单方面选择退出网络生活,你通常没有其他选择来保护自己不被跟踪。”数字健康隐私倡议团队知道,在大多数情况下这是不现实的。相反,他们表示,解决方案需要在政策层面上提出,并应解决数据隐私和透明度问题。
弗里德曼说:“下一代饼干看起来不会像饼干。“最终,我们希望解决需要多少跟踪才能了解某人的健康状况的问题。”他们将不断揭开这个不透明系统的层层面纱——弗里德曼称之为“黑盒子”——直到他们能够完全跟踪这些数据在网络上传播的路径。
Ravi Gupta等人,医学杂志网站上第三方跟踪的流行度,美国医学会健康论坛(2022)。DOI: 10.1001 / jamahealthforum.2022.0167
阿里·b·弗里德曼等人,解决老年人在线健康隐私风险:道德考虑和建议的视角,老年学与老年医学(2022)。DOI: 10.1177 / 23337214221095705