X-Decoder的正式实现,用于像素、图像和语言的广义解码
https://github.com/microsoft/X-Decoder/tree/xgpt
我们受到MSRA同事开发的visual-chatgpt的启发,使用语言链来增强会话X-Decoder,并涵盖我们单个X-Decoder模型的所有功能。
X-GPT有几个独特的新功能:
- 它使用单个X解码器模型来支持广泛的视觉和视觉语言任务。不需要为单个任务提供单独的模型。
- 它提供最先进的细分性能。它比CLIPSeg或其他现有的开放式词汇细分系统要好得多。
- 它还支持文本到图像检索。您可以选择从自己的池中找到真实图像,或要求生成新图像。
在X-Decoder的支持下,我们开发了一个更接地的指示Pix2Pix,将其集成到我们的X-GPT中。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢