医疗版ChatGPT直播评测！治疗方案与真人医生96%一致-脚本导航

> 自媒体 > （AI）人工智能 > 医疗版ChatGPT直播评测！治疗方案与真人医生96%一致

医疗版ChatGPT直播评测！治疗方案与真人医生96%一致

来源：量子位

2023-07-10 09:35:12

355

管理

杨净发自凹非寺

量子位 | 公众号 QbitAI

国内首个医疗大模型，已经在“接诊”患者了。

最终，经过一天的鏖战，真人医生综合得分为 7.5分，AI 医生综合得分为 7.2分，比分结果上一致性达到了96%。

不可否认的是，MedGPT还有些问题需要调整，几位专家指出它会出现偶尔过度给出治疗建议、重复推荐检查项目、某些概念表述不准确，以及无法实现查体等局限——要想MedGPT更加可用，这些意见一定程度比正面评价还要重要。

但总的来说，首个医疗大模型的公开首秀的结果还算不错。

总结下来，首先是大模型的基本能力都有，语义理解、多轮对话、多模态识别等，还能像OpenAI那样通过插件商店链接到各种行业应用。

还有通用大模型被广为诟病的对齐和准确性问题，MedGPT整个流程结果也不输真人医生。

再从行业维度来看，确实能真正从医学角度为医生提供有效帮助，提升患者疾病管理效率。

此次真实测试过程中可以看到，它能基于有效问诊以及医学检查数据，MedGPT得以进行准确的疾病诊断，并为患者设计疾病治疗方案。

这对企业来说，不单只是算法、算力和数据的考验，而是一整套系统工程性难题。

既然如此，作为国内首个医疗大模型MedGPT，又是如何做到的呢？

简单总结：专业大模型，以及多种准确性机制保架护航。

首先，一上来就打造医疗大模型。

此前专业大模型的思路是，先打造一个大模型，再利用专业数据做监督微调。但MedGPT直接是以医疗数据预训练、微调以及超100名医生参与RLHF机制。

这就需要企业既要在垂直行业深耕，还要有AI技术实力。这就需要提及它背后的缔造者——医联。

在行业上，作为互联网医疗的早期入局者，医联已经积累了超过150万医生和2000万患者，稳固的医患关系链长期互动之下，形成了大量专业的医学数据。

此外医联长期关注医疗与技术的深度融合，已打造了近140个疾病管理标准化流程，涉及肿瘤、心脑血管、糖尿病等常见病症，覆盖1000多个病种，形成了一整套全数字化全流程疾病管理体系。

在互联网医疗时代，这些疾病管理体系可以为行业提供线上管理的有效依据，提升行业整体效率。而在AI赋能下的数字医疗行业来临之时，这便成了AI医疗的重要依托。

比如，在为患者输出正式答案前，会先经过临床医学规则器的校验。还有招募真实医生在电脑前判断，然后将两者结果交给专家委员会评议，以此来对标真实医生。

基于这样的方法论，医联团队率先为专业大模型的打造在行业中打了个样。

医疗AI2.0大幕拉开

最后回到MedGPT公开评测这件事情本身，也带来了大模型发展进程中的三点趋势。

第一、医疗AI2.0大幕已经拉开，系统复杂性问题将会得到解决。

以大模型为代表的AI2.0时代的到来——对话即入口，让所有的应用场景都得到了重新定义。被AI所辐射的千行百业也深处于变革之中。

以往AI 1.0，NLP、CV、多模态等单点技术蓬勃发展，医疗AI应用场景丰富多样，他们强规则、具有可控性。但场景、数据之间没有打通，导致泛化能力不强，无法处理系统性、复杂性的问题。

得益于Transformer，打破了模态、数据、任务场景之间的壁垒。医疗场景中，利用海量医学文本与数据中，进行高并发/长距离学习整合，一些复杂性、系统性问题可以得到解决。

如果继续畅想，结合医联的云药房、云检验等云化能力，不仅是AI医生本身疾病管理能力会得到提升，患者甚至可以摆脱地理限制，轻松完成所有疾病从预防、诊断、治疗、康复的全流程管理路径。

这其实也并不难想象，只需要知道有一个能看各个专科领域并且比肩三甲医院医生的AI医生能够24小时在你身边为你出诊，同时，检验检测服务在家附近1公里就能全部完成。

有去三甲医院排队挂号看病经历的同学应该都懂——专家挂不上号、检验检查等一个月，这都是时有发生的事情。降本增效、解决行业问题，走入医疗的下一个时代，就是靠MedGPT这类专业模型做的。

第二、大模型的行业红利并非在科技巨头手中，而在有场景有数据的玩家手里。

相信大家都或多或少有所看到，目前医疗领域的专用大模型和产品正在不断问世，最具代表性的产品来自谷歌和微软这两个大厂。

谷歌Med-PaLM 2目前正在尝试多模态能力，比如自己检查X光片后给出诊断。在今年晚些时候将对一小部分谷歌云用户开放。

还有被微软200亿美元收购的Nuance，借由微软OpenAI合作之便，正在将GPT-4集成到临床笔记软件DAX中，以减轻临床医生的负担。

前者的大模型还没有到真正落地，后者无非是集成通用大模型的API，其行业的准确性和一致性无法得到保障。

但MedGPT一亮相就惊艳全场，并拿下多个行业首次：

首次突破AI医生多轮对话的难题；

首次实现从有效问诊到医学检查的跨越；

首次实现AI给出准确诊断和治疗方案；

首次AI具备全流程诊断能力……

这与垂直领域深耕、有场景有数据有关。

医联在医疗行业有9年深耕，积累了丰富的知识、数据和应用，构筑起了深厚的技术和用户壁垒。

一旦实现大模型技术的应用，在现有的用户场景基础之下，将会迅速规模化落地。这是其他想入局者无法拥有的先发优势。

上一次AI浪潮来袭时，最终也是场景玩家率先吃掉AI红利。

现在同样也依旧是场景玩家吃掉大模型红利，只不过技术路径已经明晰，落地速度自然要比以往快得多。

第三，医疗AI落地提速，也侧面印证了大模型的发展趋势——

雪球效应展现，从技术到应用部署的飞轮会越转越快。

ChatGPT最开始只会一本正经地胡说八道，短短几个月内基于用户反馈、插件开发生态，真正被各行业的人加入到工作流中，并上线了端侧应用。

还有Midjourney、Stable Diffusion被人诟病无法画手的问题，也能在短短几周内解决；以及国内大模型涌现、更新速度加快，文心一言一个月能迭代四次等等。

“大模型-应用-数据”的加速闭环一旦打通，那么产业落地的速度将会比上一波浪潮更快。

而医联大模型MedGPT一个月就进入到真实患者全流程测试阶段。在此之后，根据数据飞轮迭代大模型，落地速度只会越来越快。

或许很快，医疗AI2.0就会惠及到每个人身边。

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

让ChatGPT当你的数据统计师的方法

2023-07-10 09:36

IBM量子计算最新进展：量子计算的chatGPT时刻即将来临？

2023-07-10 09:33

相关文章

专访王小川|曾预言过ChatGPT方向，年内推出中国版ChatGPT PRO..

ChatGPT引燃了一轮AI创业潮，无数头顶光环的企业家入局，王小川也是其中..

法媒关注中国国产ChatGPT

据《费加罗报》8月31日报道，百度发布的“中国版ChatGPT”聊天机器人文心..

中国版ChatGPT正在血洗职场：你的饭碗还能端多久？

"我用DeepSeek写周报被主管连夸三天，现在慌得睡不着觉。"凌晨2点，某互..

荐书丨《ChatGPT来了：语言科学如何看待ChatGPT》

ChatGPT来了基本信息副标题：语言科学如何看待ChatGPT作者: 杨旭 / 罗仁..

ChatGPT vs DeepSeek - 中文语法推理

问题：“你这铺馆没字号，就叫狗不理吧。 ” 这句话当中的 “就” 是个介..

ChatGPT时代语料库与术语库建设与应用工作坊

戴光荣博士，广东外语外贸大学教授，原福建工程学院人文学院院长，福建省..

“请不要对我有过高的期望，我仅是一个AI模型”丨对话ChatGPT..

当地时间2023年2月1日，瑞士高中教师参加了关于ChatGPT的研讨会。（视觉..

新闻可信度评估机构：ChatGPT或成传播网络谣言最强工具..

由OpenAI开发的人工智能聊天工具ChatGPT在全球引发广泛关注，众多用户尝..

对话调教ChatGPT，居然变成在线犯罪指南！

关于作者

大男孩(普通会员)

文章

862

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

04

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

05

介绍一个能够免费使用国内chatgpt的插件wetab

2023/04/27

标签云

成员 网址收录40387 企业收录2981 印章生成231923 电子证书1025 电子名片60 自媒体46877

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索