鹏城实验室取得基于掩码指代建模的视觉定位和指代分割方法、系统、设备以及存储介质专利

航空航天复材产业链月度动态报告 获取样刊

航空产业网 2024-11-12

197 0 0

鹏城实验室取得一项名为"基于掩码指代建模的视觉定位和指代分割方法、系统、设备以及存储介质"的专利,授权公告号CN118734091B,申请日期为2024-09-02。

专利摘要显示,本申请提供了一种基于掩码指代建模的视觉定位和指代分割方法、系统、设备以及存储介质,方法包括通过多模态编码器获得预训练图像与文本的视觉词元、聚合视觉词元、文本词元、聚合文本词元,并应用指代感知的动态图像掩码策略,基于文本指代的图像区域对预训练图像进行掩码,并根据视觉词元和聚合文本词元对掩码图像块以及视觉目标关联分数进行重建;应用指代感知的文本掩码策略,基于预训练文本的指代主语对预训练文本进行掩码,并根据文本词元和聚合视觉词元对掩码文本词以及语义目标关联分数进行重建,以使模型学习到通用的指代能力,进而可以使模型针对视觉定位和指代分割任务进行下游微调,以得到高精度的定位或者指代分割结果。

查看详情 : 基于掩码指代建模的视觉定位和指代分割方法、系统、设备以及存储介质

原文链接 : 点击查看


评论 (0)


暂无评论

免费试用


请完善以下信息,我们将会尽快与您联系
若当前手机号码未注册航空产业网,系统在您提交信息之后会自动为您注册账号
用户密码默认手机号码最后6位