中国科学院工程热物理研究所申请用于大模型知识增强的工业表格数据识别方法及程序产品专利

航空航天复材产业链月度动态报告 获取样刊

航空产业网 2024-10-18

257 0 0

中国科学院工程热物理研究所申请一项名为"用于大模型知识增强的工业表格数据识别方法及程序产品"的专利,申请日期为2024-06-17。

专利摘要显示,本发明公开了一种用于大模型知识增强的工业复杂表格图像处理方法及程序产品,首先识别和定位工业文件中的表格区域,提取出仅包含表格内容的数据块;然后提取表格边框的横向和竖向框线,推理出所有单元格的坐标,恢复表格结构;接着将识别出的内容与单元格坐标进行匹配,形成“单元格内容+坐标”格式的数据;随后将复杂表格中的合并单元格拆分为最小单元格,进行文本化表示;之后利用大模型对文本化表格中的单元格内容进行分类,区分为键类型或值类型,并存储于向量数据库中;最后通过向量相似度匹配和检索增强生成技术实现与向量数据库中表格数据内容的问答。本发明有效提高了大模型在处理和理解工业复杂表格数据时的效率和准确性。

查看详情 : 用于大模型知识增强的工业表格数据识别方法及程序产品

原文链接 : 点击查看


评论 (0)


暂无评论

免费试用


请完善以下信息,我们将会尽快与您联系
若当前手机号码未注册航空产业网,系统在您提交信息之后会自动为您注册账号
用户密码默认手机号码最后6位