一、图像分割领域的GPT-4.0
大家好,我是千与千寻,今天给大家介绍的AI算法可以称得上是图像分割领域的GPT-4.0,号称可以分割一切的AI图像分割算法——Segment Anything。
提到GPT-4.0模型,相信不必我多说,大家都不会陌生,最近实在是太火爆了,大家应该也都体验过ChatGPT那种与未来相连般的内心震撼,现在的GPT-4.0可以在人机对话中达到近乎百分之百准确率的智能问答。事实上,通用ChatGPT背后所使用的自然语言模型是GPT-3.5,而GPT-4.0的模型性能比GPT-3.5相比更加强大,几乎可以做到"回答一切"。
那么,为什么说这个AI算法是图像分割领域的GPT-4.0呢?这是因为类比GPT-4.0 回答一切的能力,Segment Anything图像分割算法,可以做到“分割一切”,实现对任何一张样本图片进行零样本的迁移图像分割。这么说,或许你可能觉得有些云里雾里,别急,我们下面详细解释它的用法。
下面进入我们今天的主角——Segment Anything图像分割模型,其图像分割功能包含三种实现形式,点击交互式图像分割,设定方框图区域图像分割,Anything分割也就全局分割,你可能有感觉听不明白,不着急,我们马上对这三种图像分割方式,给大家进行一一演示其分割效果与工作原理。
三、上手实践Segment Anything图像分割
首先进入Demo演示的官网地址,https://segment-anything.com/demo
点击Try to demo按钮,进行分割demo的操作界面,如下图所示。
Mult-mask模式的图像分割方式,不仅可以将所指定的“抠图”区域进行准确分割,还可以将图像分割区域与原图像进行一个三维视觉下的对比,如下图中的对比效果。
3、Anything分割(全局分割)
前两种模式均包含人机交互部分,比如需要手动指定分割定位点,或者手动绘制矩形方框区域,完成部分类别的物体图像分割,而第三种全局分割所实现的功能效果,则是将图片中所包含的类别进行一次性的分割出来,如下图中的分割效果。可以说是最为简便也是最为直接的图像分割。
其实我们可以看到在第三种全局分割模式下,图像中的每块区域都进行了分割操作,这种模式用于自动驾驶领域相对较多一些,至于前两种方式,当你需要扣除图像中的一小部分来生成图片或部分标记的时候,我们可以借助这样的图像分割模式,指定方框区域或者具体中心定位点,将目标分割区域进行分割。
这个分割一切的图像分割模型是非常具有里程碑式并且很有意思的AI算法,大家可以去亲身去体验一下,对其中原理和方法进行了解,把它应用到我们的实际生活中,提高我们的工作效率。
说到这里感叹一下,现在AI算法的发展真的是如此之快,从几乎可以回答一切问题的GPT-4.0,再到图像分割一切的Segment Anything 模型,而且还在不断发展,后续准备开设有一个新的专栏《简单好玩的AI算法》,带领无论是已经在AI算法领域还是对AI算法感兴趣的小伙伴,一起动手学习体验AI算法的魅力。
SAM Demo:https://segment-anything.com/开源地址:https://github.com/facebookresearch/segment-anything论文地址:https://ai.facebook.com/research/publications/segment-anything/SA-1B数据集:https://ai.facebook.com/datasets/segment-anything/我是千与千寻,一个只讲干活的码农!我们下期见~
相关文章
猜你喜欢