AppleWatch的数据“黑匣子”会给研究带来问题
据外媒报道,哈佛大学的一位生物统计学家在发现 Apple Watch 收集的心率变异数据存在不一致问题后,正在重新考虑将 Apple Watch 纳入研究项目的计划。他发现,同期收集的数据似乎在毫无预警的情况下发生了变化。
“这些算法就是我们所说的黑匣子——它们不透明,”哈佛大学公共卫生学院生物统计学副教授、开源数据平台贝韦的开发者 JP Onnela 告诉 The边缘。
正常情况下,Onnela 的研究不会使用苹果等商用可穿戴设备?手表。在大多数情况下,他的团队使用旨在收集科学研究数据的研究级设备。然而,作为与 Brigham and Women's Hospital Neurosurgery 合作的一部分,他也对市场上可用的产品感兴趣。虽然他知道这些产品有时会出现数据问题,但他的团队想在开始之前检查这些问题的严重程度。
为此,他们检查了他的搭档、布莱根妇女医院研究员 Hassan Dawood 佩戴的 Apple Watch 输出的心率数据。 Dawood 导出了他的每日心率变异数据两次:一次是在 2020 年 9 月 5 日,第二次是在 2021 年 4 月 15 日。在这个实验中,他们查看了同一时间段(2018 年 12 月上旬至 2020 年 9 月)收集的数据。
由于导出的两个数据集包含同一时间段的数据,理论上两个数据集的数据应该是一样的。但 Onnela 说他预计会有一些差异。可穿戴算法的“黑匣子”一直是研究人员面临的挑战。这些产品通常只允许研究人员通过一定的算法分析和过滤后输出信息,而不是显示设备收集的原始数据。
由于公司会在没有预警的情况下定期更换算法,因此2020年9月的输出数据可能包含与2021年4月导出的算法不同的数据。“令人惊讶的是,它们如此不同。这可能是我见过的这种现象最明显的例子,”Onnels 说。
Apple 告诉 The Verge,对其算法的任何修改仅适用于未来的数据,这款手表不会重新计算过去的数据。除了用于导出数据的第三方应用程序的问题外,Apple 没有解释这种差异。
密歇根大学研究可穿戴设备和应用数据的睡眠研究员 Olivia Walch 表示,如此清楚地看到差异令人震惊。长期以来,沃尔奇一直主张研究人员使用直接从设备传感器中提取的原始数据,而不是通过其软件过滤的数据。