天眼查App显示,2025年6月24日,「一种有效地提升神经网络模型精度的方法」正式进入专利的公布阶段。申请人为北京君正集成电路股份有限公司,该项计算;推算;计数领域的专利涉及神经网络训练过程中的模型精度优化方法。据专利信息显示,通过引入双模型结构与滑动平均参数更新机制,在多个训练周期后实现模型精度对比选择,技术效果数据提升达显著优化。发明人为余慧。本发明提供一种有效地提升神经网络模型精度的方法,包括:S1.训练任务所需的数据集准备;S2.训练前的数据预处理,包括裁减,缩放,色彩变换,数据增强等;S3.定义网络结构Model;S4.同时拷贝出一个备份网络Model2;S5.从0开始epoch遍历;S6.从0开始遍历batch;S7.Model进行前向网络计算,一个batch结束后会进行梯度反传并更新模型Model的参数;S8.同时也按照如下公式更新Model2的参数:Model2=Model2*alpha+Model*(1‑alpha),即采用滑动平均的方式对Model2进行更新,历史保留alpha;S9.Model和Model2都设置eval模式进行验证集的测试,分别得到验证结果acc1,acc2;S10.每个batch重复步骤S6‑S9,直至当前epoch结束,开始下一轮,所有epoch结束之后,对比Model和Model2的最高精度的较大值,如果acc1>acc2,则保留Model的参数作为最终的best.pt,反之保留Model1的参数作为最终的best.pt。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。