最近在GitHub上发现了一个爆火的开源项目。
好家伙,凑近一看,居然还是由微软开源,并且和最近炙手可热的ChatGPT息息相关。
项目的名字叫做:Visual ChatGPT。
https://github.com/microsoft/visual-chatgpt
Visual ChatGPT的整体技术架构图如上所示,我们可以清楚地看到ChatGPT和视觉基础模型(VFM,Visual Foundation Model)分别位于其中的位置。
一方面,ChatGPT(或LLM)作为一个通用接口,继续发挥它本身的优势,提供对不同话题的智能理解。另一方面,基础视觉模型VFM则通过提供特定领域的深入知识来充当领域专家,它们通过交互管理模块(Prompt Manger)进行连接和适配。
这样聊可能比较抽象,我们可以拿官方给的一个例子来进行说明:
里面关于这部分的流程解释得非常详细,而且还给出了多轮对话的案例、以及实验结果,有兴趣的小伙伴可以看看。
好了,今天的分享就到这里了,感谢大家的收看,我们下篇见。
相关文章
猜你喜欢
成员 网址收录40402 企业收录2983 印章生成238547 电子证书1060 电子名片60 自媒体57689