一种试题作答评分方法及相关装置、设备和存储介质与流程
- 国知局
- 2024-07-31 22:41:31
本申请涉及自然语言处理,特别是涉及一种试题作答评分方法及相关装置、设备和存储介质。
背景技术:
1、利用人工智能技术,帮助老师对学生的作业或考试进行自动评阅,已经成为教育信息化中的重要课题。
2、然而,当前基于人工智能技术对于试题作答进行评分,评分标准并不统一,对于不同试题的评分效果相差较大,评分准确率低,特别是在试题需要进行多步骤作答的情况下,无法捕捉关键作答步骤,进而导致评分准确率进一步降低。
3、因此,如何提升试题作答评分的准确率,特别是多步骤作答试题的评分准确率,成为亟待解决的问题。
技术实现思路
1、本申请主要解决的技术问题是提供一种试题作答评分方法及相关装置、设备和存储介质,能够提升试题作答评分的准确率,特别是多步骤作答试题的评分准确率。
2、为了解决上述技术问题,本申请第一方面提供了一种试题作答评分方法,试题作答评分方法包括:获取目标试题文本和目标试题文本的目标答案文本,并获取目标试题文本的待处理作答文本;基于作答评分模型处理目标试题文本、目标答案文本和待处理作答文本,得到待处理作答文本的目标得分;其中,作答评分模型基于样本试题文本及样本试题文本的样本答案文本和生成作答文本,以生成作答文本所标注的样本得分为训练目标,对通用评分模型进行参数微调得到,生成作答文本基于样本参考文本生成得到,且样本参考文本至少包括样本试题文本、样本答案文本和样本答案文本中的关键步骤文本及其步骤得分,样本得分表征生成作答文本所命中关键步骤文本的命中情况。
3、为了解决上述技术问题,本申请第二方面提供了一种试题作答评分装置,试题作答评分装置包括获取模块和处理模块;获取模块用于获取目标试题文本和目标试题文本的目标答案文本,并获取目标试题文本的待处理作答文本;处理模块用于基于作答评分模型处理目标试题文本、目标答案文本和待处理作答文本,得到待处理作答文本的目标得分;其中,作答评分模型基于样本试题文本及样本试题文本的样本答案文本和生成作答文本,以生成作答文本所标注的样本得分为训练目标,对通用评分模型进行参数微调得到,生成作答文本基于样本参考文本生成得到,且样本参考文本至少包括样本试题文本、样本答案文本和样本答案文本中的关键步骤文本及其步骤得分,样本得分表征生成作答文本所命中关键步骤文本的命中情况。
4、为了解决上述技术问题,本申请第三方面提供了一种电子设备,相互耦接的存储器和处理器,处理器用于执行存储器中存储的程序指令,以实现上述第一方面中的试题作答评分方法。
5、为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,其上存储有程序指令,程序指令被处理器执行时实现上述第一方面中的试题作答评分方法。
6、上述方案,通过获取目标试题文本和目标试题文本的目标答案文本,并获取目标试题文本的待处理作答文本,再基于作答评分模型处理目标试题文本、目标答案文本和待处理作答文本,得到待处理作答文本的目标得分,其中,述作答评分模型基于样本试题文本及样本试题文本的样本答案文本和生成作答文本,以生成作答文本所标注的样本得分为训练目标,对通用评分模型进行参数微调得到,生成作答文本基于样本参考文本生成得到,且样本参考文本至少包括样本试题文本、样本答案文本和样本答案文本中的关键步骤文本及其步骤得分,样本得分表征生成作答文本所命中关键步骤文本的命中情况。因此,通过样本答案文本、关键步骤文本及其步骤得分,得到生成作答文本与样本得分,并基于此在已有的通用评分模型上进行微调训练,能够得到聚焦答案文本中关键作答步骤的作答评分模型,利用微调训练得到的作答评分模型进行评分,能够提升对试题文本评分规范的关注度,进而能够提升评分准确率,特别是在试题包括多个关键作答步骤的情况下,通过作答评分模型对各个关键作答步骤的关注度的提升,有助于提升整体评分的准确率。故此,能够提升试题作答评分的准确率,特别是多步骤作答试题的评分准确率。
技术特征:1.一种试题作答评分方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述参数微调的步骤包括:
3.根据权利要求1所述的方法,其特征在于,所述生成作答文本至少由样本参考文本输入至大语言模型生成得到。
4.根据权利要求3所述的方法,其特征在于,所述生成作答文本的生成步骤包括:
5.根据权利要求3所述的方法,其特征在于,在利用所述大语言模型得到所述生成作答文本之前,所述方法还包括:
6.根据权利要求3至5任一项所述的方法,其特征在于,所述样本得分的获取步骤包括:
7.根据权利要求3至5任一项所述的方法,其特征在于,所述大语言模型处理所述样本参考文本还得到所述生成作答文本所命中所述关键步骤文本的步骤得分,在利用所述大语言模型得到所述生成作答文本之后,所述方法还包括:
8.根据权利要求7所述的方法,其特征在于,所述大语言模型多次处理所述样本参考文本,以得到所述第三预测得分覆盖各个分数段的多个所述生成作答文本,所述选择所述生成作答文本,作为候选作答文本,包括:
9.根据权利要求7所述的方法,其特征在于,所述基于所述第三预测得分与所述第四预测得分之间差异,确定是否保留所述候选作答文本,作为用于对所述通用评分模型进行参数微调的生成作答文本,包括:
10.一种试题作答评分装置,其特征在于,包括:
11.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至9任一项所述的试题作答评分方法。
12.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至9任一项所述的试题作答评分方法。
技术总结本申请公开了一种试题作答评分方法及相关装置、设备和存储介质,其中,试题作答评分方法包括:获取目标试题文本和目标试题文本的目标答案文本,并获取目标试题文本的待处理作答文本;基于作答评分模型处理目标试题文本、目标答案文本和待处理作答文本,得到待处理作答文本的目标得分;其中,作答评分模型基于样本试题文本及样本试题文本的样本答案文本和生成作答文本,以生成作答文本所标注的样本得分为训练目标,对通用评分模型进行参数微调得到,生成作答文本基于样本参考文本生成得到,样本得分表征生成作答文本所命中关键步骤文本的命中情况。上述方案,能够提升试题作答评分的准确率,特别是多步骤作答试题的评分准确率。技术研发人员:詹文超,沙晶,盛志超,王士进,刘聪,胡国平受保护的技术使用者:科大讯飞股份有限公司技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/194143.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。