天眼查App显示,2025年5月16日,「一种基于单向翻译与有效性自验证的等价代码数据增强方法」正式进入专利公布阶段。申请人为大连理工大学、信华信技术股份有限公司,该项智能软件工程领域专利涉及数据增强方法的应用场景。据专利信息显示,该方法能够显著优化等价代码生成的效率与准确性。发明人为江贺、林浩、马依帆、王羽夫、周志德、任志磊、孙伟宏、徐禹尧、白亮、王婷婷、吕鹏。
本发明属于智能软件工程的数据增强方法领域,首先获取待数据增强项目内容,提取出所含各个函数,依次利用大语言模型进行功能需求单向翻译,获取自然语言描述;进而填充提示模板,输入大语言模型生成候选代码。为了确保被增强数据的语法有效性,使用静态语法分析工具检验候选代码;为了确保语义等价性,从断言知识增强与焦点方法‑测试用例关系学习角度依次预训练Func2Test模型并进行微调,为每个候选代码生成m个测试用例用于测试,最终仅保留通过率最高的候选代码作为新生成代码。最后对原始代码和新生成代码进行mixup处理,获得最终增强结果,即混合数据集Dmix。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。