山东省计算中心(国家超级计算济南中心)申请基于高效微调和联邦学习的行业大模型训练方法及系统专利

航空模拟器产业链月度动态报告 获取样刊

航空产业网 2024-11-19

220 0 0

山东省计算中心(国家超级计算济南中心)申请一项名为"基于高效微调和联邦学习的行业大模型训练方法及系统"的专利,申请日期为2024-10-21。

专利摘要显示,本发明提出一种基于高效微调和联邦学习的行业大模型训练方法及系统,涉及联邦学习领域。该方法由中心端执行,包括:获取原始全局模型,初始化可调低秩矩阵;所述可调低秩矩阵用于根据客户端资源量进行秩缩放;将模型结构和可调低秩矩阵发送给各客户端,以使各客户端基于本地数据对可调低秩矩阵进行微调训练,得到更新的可调低秩矩阵,并发送至中心端;将更新的可调低秩矩阵进行聚合,更新原始全局模型的权重文件,得到优化的全局模型。本发明客户端在微调训练时对预训练权重进行量化,并对具有秩缩放功能的可调低秩矩阵进行微调训练,以提取客户端本地数据有效特征,实现了模型参数的灵活调整与资源的高效利用。

查看详情 : 基于高效微调和联邦学习的行业大模型训练方法及系统

原文链接 : 点击查看


评论 (0)


暂无评论

免费试用


请完善以下信息,我们将会尽快与您联系
若当前手机号码未注册航空产业网,系统在您提交信息之后会自动为您注册账号
用户密码默认手机号码最后6位