麻省理工学院的 Masked Generative 编码器将图像识别和生成结合起来,实现了和谐的融合。

计算机视觉系统与图像识别和生成相结合

计算机在图像方面拥有两项非凡的能力:它们既可以识别图像,也可以重新生成图像。 从历史上看,这些功能是分开的,就像善于创造菜肴的厨师(一代)和善于品尝菜肴的鉴赏家(认可)的不同行为一样。

然而,人们不禁想知道:如何才能在这两种独特的能力之间协调一致? 厨师和鉴赏家对食物的味道有着共同的理解。 同样,统一的视觉系统需要对视觉世界的深刻理解。

现在,麻省理工学院计算机科学与人工智能实验室 (CSAIL) 的研究人员训练了一个系统来推断图像中缺失的部分,这项任务需要深入理解图像的内容。 在成功填补空白的过程中,该系统被称为蒙面生成编码器(MAGE),同时实现了两个目标:准确识别图像并创建与现实惊人相似的新图像。

来源和详细信息:

Computer Vision System Marries Image Recognition and Generation

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注