辅助资源

新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

2026-05-01

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生最近，医学诊断圈子

新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

最近，医学诊断圈子里有个消息挺炸裂的。一支由哈佛医学院和斯坦福大学组成的顶尖科研团队，对OpenAI的o1-preview模型做了一次深度评估，结果让人既兴奋又得冷静思考：这个AI，在处理那些让医生都头疼的疑难杂症时，表现居然更胜一筹。

新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

具体数据怎么说？根据研究报告，o1-preview在整体测试案例中的正确诊断率达到了78.3%。而在一个包含70个特定案例的对比测试中，它的准确率更是飙升至88.6%。这个成绩，不仅远超其前代GPT-4模型72.9%的表现，更是把门槛拉高了一截。

如果觉得百分比还不够直观，那么来看看更细的评估。研究人员采用了医学推理质量评估标准量表（R-IDEA）来进行打分。在80个案例中，o1-preview惊人地拿下了78个满分。这是个什么概念？对比之下，经验丰富的资深医生只在28个案例中获得了满分，而还在成长阶段的住院医生，这个数字是16。差距，一下子就拉开了。

这还没完。研究团队特意设置了25个由专家设计的、极其复杂的诊断案例，用来模拟真实世界中最棘手的状况。结果，o1-preview交出了86分的高分答卷。这个分数，是使用GPT-4进行辅助的医生（41%）的两倍还多，更是那些仅使用传统诊断工具医生（34%）的两倍有余。可以说，在纯粹的逻辑推演和知识整合环节，AI展现出了压倒性的优势。

当然，先别急着下结论说医生要被取代了。这份研究的研究人员自己也相当清醒，他们明确指出了测试的几处局限性。首先，部分测试案例有可能已经包含在o1-preview前期的训练数据里了，这可能会对结果的绝对公平性产生一些影响。其次，目前的测试主要聚焦于AI系统“单打独斗”的能力，它如何与人类医生协同工作、取长补短，这个更贴近现实的应用场景，研究并未充分展开。最后，还有一个非常实际的问题：o1-preview在推理过程中有时会建议进行一系列成本高昂的检测，这在实际的医疗资源分配中，可行性存疑。

所以，这项研究的真正价值或许在于，它清晰地标定了一个新起点。AI在复杂诊断中的潜力已经显露无遗，但它更像是一个拥有超强分析能力的“超级助手”，而非替代者。如何将这种能力安全、有效、合乎伦理地整合进现有的医疗体系，让医生如虎添翼，才是接下来真正值得深思的课题。

来源：互联网

上一篇 Free Flash Image-AI生图工具 下一篇 免费Nano Banana Free-免费不限次的Nano Banana

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

摘要

新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

相关文章推荐