Nature论文 | 超声医师与 AI 心脏功能评估的盲法随机试验

标题：Blinded, randomized trial of sonographer versus AI cardiac function assessment

作者：

Bryan He, Alan C. Kwan, Jae Hyung Cho, Neal Yuan, Charles Pollick, Takahiro Shiota, Joseph Ebinger, Natalie A. Bello, Janet Wei, Kiranbir Josan, Grant Duffy, Melvin Jujjavarapu, Robert Siegel, Susan Cheng, James Y. Zou & David Ouyang

[ Stanford University & Department of Cardiology, Smidt Heart Institute, Cedars-Sinai Medical Center &
Division of Cardiology, San Francisco VA & Enterprise Information Services, Cedars-Sinai Medical Center, Los Angeles, CA, USA. & Department of Biomedical Data Science, Stanford University, & Division of Artificial Intelligence in Medicine, Cedars-Sinai Medical Center]

论文下载：

https://www.nature.com/articles/s41586-023-05947-3.pdf

代码：GitHub ( https://github.com/echonet/dynamic

推特：https://twitter.com/David_Ouyang/status/1643633476254543872

简介：

人工智能 (AI) 已开发用于超声心动图, 尽管尚未通过盲法和随机化进行测试。

在这里，我们设计了一项盲法、随机的非劣效性临床试验，比较 AI 与超声医师对左心室射血分数 (LVEF) 的初步评估，以评估 AI 在解释工作流程中的影响。主要终点是初始 AI 或超声医师评估与最终心脏病专家评估之间 LVEF 的变化，根据具有实质性变化（超过 5% 的变化）的研究比例进行评估。

在筛选的 3,769 项超声心动图研究中，有 274 项研究因图像质量差而被排除。AI 组的研究发生重大变化的比例为 16.8%，超声医师组为 27.2%（差异为 -10.4%，95% 置信区间：-13.2% 至 -7.7%，P < 0.001 表示非劣效性，P < 0.001 表示优效性）。AI 组的最终心脏病专家评估与独立的先前心脏病专家评估之间的平均绝对差异为 6.29%，超声医师组为 7.23%（差异为 -0.96%，95% 置信区间：-1.34% 至 -0.54%，P < 0.001为了优越感）。AI 引导的工作流程为超声医师和心脏病专家节省了时间，而心脏病专家无法区分 AI 与超声医师的初始评估（致盲指数为 0.088）。对于接受心脏功能超声心动图量化的患者，人工智能对 LVEF 的初步评估并不劣于超声医师的评估。

结果评估

主要结果是 AI 或超声医师的初始评估与最终心脏病专家评估之间 LVEF 的变化。主要结果被评估为具有实质性变化的研究的比例以及初始和最终评估之间的平均绝对差异。实质性变化定义为初始和最终评估之间 LVEF 变化超过 5%。分析是随机进行的，两组之间没有交叉。

跟踪超声医师和心脏病专家进行轮廓调整和调整的持续时间，并在超声医师和 AI 组之间进行比较。为了评估盲法，心脏病专家被要求预测最初的解释是人工智能、超声医师还是无法分辨每项研究。一个关键的次要安全性终点是心脏病专家最终裁定的 LVEF 与之前心脏病专家报告的 LVEF 相比的变化。另一个次要终点包括在初始和最终解释之间 LVEF 没有变化的研究比例。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

Nature论文 | 超声医师与 AI 心脏功能评估的盲法随机试验

结果评估

评论