
中国航空发动机集团简介、直属单位与主营业务
2022年04年24日
航空产业网 2024-11-12
鹏城实验室取得一项名为"基于掩码指代建模的视觉定位和指代分割方法、系统、设备以及存储介质"的专利,授权公告号CN118734091B,申请日期为2024-09-02。
专利摘要显示,本申请提供了一种基于掩码指代建模的视觉定位和指代分割方法、系统、设备以及存储介质,方法包括通过多模态编码器获得预训练图像与文本的视觉词元、聚合视觉词元、文本词元、聚合文本词元,并应用指代感知的动态图像掩码策略,基于文本指代的图像区域对预训练图像进行掩码,并根据视觉词元和聚合文本词元对掩码图像块以及视觉目标关联分数进行重建;应用指代感知的文本掩码策略,基于预训练文本的指代主语对预训练文本进行掩码,并根据文本词元和聚合视觉词元对掩码文本词以及语义目标关联分数进行重建,以使模型学习到通用的指代能力,进而可以使模型针对视觉定位和指代分割任务进行下游微调,以得到高精度的定位或者指代分割结果。
查看详情 : 基于掩码指代建模的视觉定位和指代分割方法、系统、设备以及存储介质
2022年04年24日
2019年12年07日
2022年04年20日
2019年12年13日
2023年03年18日
2019年12年11日
2019年10年05日
2019年12年12日
2022年04年12日
2022年05年03日
评论 (0)