ChatGPT通过美放射学委员会考试但搜集信息的可靠性仍然堪忧

首页 > 科技 > 正文

2023-05-18 10:03:27 来源：关灯

　　加拿大科学家在16日出版的《放射学》杂志上刊登新论文称，最新版本的ChatGPT通过了美国放射学委员会的考试，突出了大型语言模型的潜力，但它也给出了一些错误答案，表明人们仍需对其提供的答案进行核查。

　　为评估ChatGPT在美国放射学委员会考试问题上的表现并探索其优势和局限性，多伦多大学研究人员首先测试了基于GPT-3.5的ChatGPT的表现。研究团队使用了150道选择题，这些选择题与加拿大皇家学院和美国放射学委员会考试的风格、内容和难度相当。这些问题不包括图像，分为低阶(知识回忆、基本理解)和高阶(应用、分析、综合)思维问题。高阶思维问题可进一步细分为影像学表现描述、临床管理、计算和分类、疾病关联。

　　研究人员发现，基于GPT-3.5的ChatGPT的正确率为69%，接近70%的及格线。该模型在低阶思维问题上表现相对较好，正确率为84%，但回答高级思维问题时表现不佳，正确率仅为60%。而性能更优异的GPT-4的正确率为81%，且在高阶思维问题上的正确率为81%，远好于GPT-3.5。但GPT-4在低阶思维问题上的正确率仅为80%，答错了12道题，而GPT-3.5全部答对了这些题目，这引发了研究团队对GPT-4收集信息的可靠性的担忧。

　　这两项研究都表明，ChatGPT会有提供不正确答案的倾向，如果仅仅依靠它获取信息，非常危险，因为人们可能意识不到其给出的答案是不准确的，这是它目前面临的最大的问题。

大视野融媒网是最富价值的互联网推广平台，致力于打造国内最有影响力的融媒体发布平台。

编辑：

关注大视野融媒网客户端，免费浏览更多精彩新闻资讯

大视野融媒网版权与免责声明：

一、凡本站中注明“来源：大视野融媒网”的所有文字、图片和音视频，版权均属大视野融媒网所有，转载时必须注明“来源：大视野融媒网”，并附上原文链接。

二、凡来源非大视野融媒网的新闻（作品）只代表本网传播该消息，并不代表赞同其观点。

如因作品内容、版权和其它问题需要同本网联系的，请在见网后30日内进行，联系邮箱：dsynews@126.com。

为你推荐

《即刻上场》收官！刘海宽用细腻演技戳中“打工人”真实现状

热点排榜

聆听城事共话未来城市探访纪实节目《共同说》12月1日开播（大视野新闻网讯贾鑫宇）城市探访纪 ......