
中国航空发动机集团简介、直属单位与主营业务
2022年04年24日
航空产业网 2024-11-19
山东省计算中心(国家超级计算济南中心)申请一项名为"基于高效微调和联邦学习的行业大模型训练方法及系统"的专利,申请日期为2024-10-21。
专利摘要显示,本发明提出一种基于高效微调和联邦学习的行业大模型训练方法及系统,涉及联邦学习领域。该方法由中心端执行,包括:获取原始全局模型,初始化可调低秩矩阵;所述可调低秩矩阵用于根据客户端资源量进行秩缩放;将模型结构和可调低秩矩阵发送给各客户端,以使各客户端基于本地数据对可调低秩矩阵进行微调训练,得到更新的可调低秩矩阵,并发送至中心端;将更新的可调低秩矩阵进行聚合,更新原始全局模型的权重文件,得到优化的全局模型。本发明客户端在微调训练时对预训练权重进行量化,并对具有秩缩放功能的可调低秩矩阵进行微调训练,以提取客户端本地数据有效特征,实现了模型参数的灵活调整与资源的高效利用。
查看详情 : 基于高效微调和联邦学习的行业大模型训练方法及系统
2022年04年24日
2022年04年20日
2019年12年07日
2019年12年13日
2023年03年18日
2019年12年11日
2019年10年05日
2019年12年12日
2022年04年12日
2022年05年03日
评论 (0)