> 自媒体 > (AI)人工智能 > 谷歌医疗版ChatGPT已在诊所实测!多个指标和真人医生相当
谷歌医疗版ChatGPT已在诊所实测!多个指标和真人医生相当
来源:量子位
2023-07-13 14:10:15
339
管理

明敏 发自 凹非寺

量子位 | 公众号 QbitAI

谷歌对外发布才2个月的医疗大模型Med-PaLM 2,已经“偷偷”在医疗诊所实习很久了。

《华尔街日报》爆料,早在今年4月(也就是对外发布前),Med-PaLM 2就开始在多家诊所内测试。

负责的工作包括回答医疗问题、总结文件或处理医疗大数据等。

基于谷歌当下最先进的大语言模型PaLM 2以及大量医疗数据训练,Med-PaLM 2是第一个在MedQA测试集中达到“专家”水平的AI大模型。

谷歌曾经表示,在医疗领域,Med-PaLM 2的效果优于Bard、Bing、ChatGPT等通用大模型。

实际上,谷歌最新被曝光的这一动作,也被视为和微软竞争的一个方面。

毕竟ChatGPT爆火引发了医疗系统对于AI提升工作效率的新一轮思考,而基于GPT-4能力的AI工具,被曝已经为130个诊所、600名以上医疗工作者提供服务。

所以,谷歌在AI医疗的新一轮发力,进展如何?

Med-PaLM 2能力如何?

Med-PaLM 2基于谷歌当下最先进的大语言模型PaLM2,PaLM 2具备3400亿参数、3.6万亿tokens。

它的前身Med-PaLM是首个在美国医疗执照考试(USMLE)中取得“及格”以上分数的AI模型,在MedQA数据集上的得分为67.2。

Med-PaLM 2将这一分数提升了19%,达到86.5。

并且在MedMACQA、PubMedQA和MMLU几个临床方面的数据集上性能接近或超过SOTA。

在1000多个实际医疗场景问答中,Med-PaLM 2在9项基准测试中,有8项表现良好,相较于人类医生回答更受认可。

和普通医生的回答相比,Med-PaLM 2有72.9%的回答被认为是和医生回答相对一致的。

但这些数据距离Med-PaLM 2能被完全投入到实际医疗场景中应用,还有一段距离。

参与Med-PaLM 2研发的谷歌技术高管格雷格•科拉多(Greg Corrado)也表示,目前这一技术的应用仍处于早期阶段。

它还没有到达能让人放心使用的程度。

最明显的就是Med PaLM 2在回答问题的准确性和稳定性上,表现依旧不是很好。

比如上面的测试中Med PaLM 2唯一一项没有被认可的基准测试,就是“信息准确性/相关性”。

今年世卫组织也对LLM回答的不稳定性表示担忧。

除此之外,AI在医疗领域的应用上,数据问题非常关键,这涉及到患者的个人隐私。此前DeepMind开发的医疗软件就被发现,违法使用了160万份患者诊断记录。

在这方面,谷歌声明所有数据将由医疗机构负责保管,谷歌是无法拿到的。

尽管在实际应用落地中存在诸多困难,但不可否认,AI医疗领域现在已成为科技巨头们紧盯的一块重要阵地。

科技巨头一直紧盯医疗领域

正如谷歌曝光邮件中所写的那样,Med-PaLM 2等医疗大模型的应用,能够给医疗资源紧张地区提供很大帮助。

近年来,如微软、谷歌、IBM等科技大厂也在持续关注AI医疗方面的应用落地。在这轮大模型浪潮之前,AI检测心电图、X光片已在一些医院中投入应用。

而ChatGPT一来,AI医疗有了更多实质性进展。

比如微软和医疗软件公司Epic合作,开发了一种基于ChatGPT的工具,可以向患者自动发送信息。

还有Carbon Health也基于GPT-4推出了一种AI工具,可以根据医生病人之间的对话,自动生成诊断记录。

据介绍,这个工具可以在4分钟内完成咨询的总结,比医生自己操作快12分钟。

目前这个AI工具已经被130 家诊所、超过600名医疗人员使用,旧金山的一家诊所表示在使用了这个工具后来就诊的病人数量增加了30%。

以及国内也有这方面进展。

MedGPT——基于Transformer的1000亿参数大模型,目前共接诊120多名患者,从问诊、检查到诊疗方案全流程覆盖。

但在大厂们热烈推进AI医疗应用的另一边,不少人对于这种应用还表示比较担忧,毕竟医疗行业是非常严肃的一个领域。

有人就表示,LLM产生的“幻觉”非常多,他不相信LLM能帮他完成研究。

还有数据隐私方面的担忧,更是老生常谈了。

不过如果仅仅是让AI帮助医生完成一些重复性的基础性工作,有人觉得这还是值得提倡的。

即使LLM有幻觉,但是在生成笔记上还是非常成熟的。

你怎么看?

参考链接:[1]https://www.wsj.com/articles/in-battle-with-microsoft-google-bets-on-medical-ai-program-to-crack-healthcare-industry-bb7c2db8?mod=djemalertNEWS[2]https://www.theverge.com/2023/7/8/23788265/google-med-palm-2-mayo-clinic-chatbot-bard-chatgpt[3]https://www.theregister.com/2023/06/06/carbon_health_deploys_gpt4powered_tools/[4]https://cloud.google.com/blog/topics/healthcare-life-sciences/sharing-google-med-palm-2-medical-large-language-model

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
Stability开源类ChatGPT模型!上线14小时,狂揽超4.8k星,支持商业化..
智东西编译 | 吴菲凝编辑 | 李水青智东西4月20日报道,开发出AI图像生成..
GPT-4即将超越拐点,憋大招:欲将应用成本暴降95%
Op­e­n­AI计划下个月为开发者推出重大更新,可以使基于其人工智能(AI..
超市老板娘肉体出轨小鲜肉,两人聊天记录曝光,内容既露骨又搞笑..
正文:最近,一则令人瞠目结舌的新闻在社交媒体上疯传。一位超市老板娘竟..
GPT 4.0本周发布!
如果微软员工没瞎说,就在这周,刚刚放开 ChatGPT 也就是 GPT-3.5 接口没..
女老师跟20多人偷情?聊天记录不堪入目,比失足女还疯狂!..
据吴先生声称,从2018年4月开始,他的妻子似乎完全抛弃了一岁多的亲生女..
一周新闻 | Delhaize筹建100家无人商店;塔吉特在线上业务押注.....
DelhAIze正在筹建100家无人商店图片来源:视觉中国去年,Delhaize和瑞士S..
吊打“绝望的文盲”,ChatGPT能为“流量”做什么?
2022年11月30日,美国人工智能研究实验室OpenAI推出人工智能技术驱动的自..
chatgpt到底有多牛
AI浪潮滚滚而来啊,现在只用简单的一句话就能创建一个非常漂亮的网站 且..
人工智能语言模型GPT-3的推理能力堪比大学生:心理学家报告..
**摘要:**人工智能语言模型GPT-3在解决某些逻辑问题方面的表现与大学生..
关于作者
阳光下的微笑..(普通会员)
文章
338
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成186804 电子证书796 电子名片49 自媒体20815

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索