一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种标注样本选取方法、装置、电子设备和存储介质与流程

2022-05-08 06:46:28 来源:中国专利 TAG:

技术特征:
1.一种标注样本选取方法,包括:确定样本特征的第一属性和第二属性;所述第一属性和所述第二属性分别是所述样本特征在源领域样本集的特征属性和所述样本特征在目标领域样本集的特征属性;根据所述第一属性和所述第二属性,在所述源领域样本集的多个候选标注样本中确定目标标注样本;所述目标标注样本用于训练分类模型,所述分类模型包括用于对输入的待分类样本进行分析以确定情感极性的模型。2.根据权利要求1所述的方法,其中,所述第一属性的确定方式包括:确定所述样本特征在所述源领域样本集中的第一频次值;利用所述第一频次值确定所述样本特征在所述源领域样本集中的重要性和情感极性;将所述样本特征在所述源领域样本集中的重要性和情感极性作为所述第一属性。3.根据权利要求2所述的方法,其中,所述利用所述第一频次值确定所述样本特征在源领域样本集中的重要性,包括:利用所述第一频次值和所述源领域样本集的样本数量,确定所述样本特征的第一卡方值;所述第一卡方值为所述样本特征在所述源领域样本集中的卡方值;基于所述第一卡方值确定所述样本特征在所述源领域样本集中的重要性。4.根据权利要求3所述的方法,其中,所述利用所述第一频次值确定所述样本特征在源领域样本集中的情感极性,包括:利用所述第一频次值和所述源领域样本集的样本数量,确定所述样本特征的情感极性值;利用所述情感极性值确定所述样本特征在源领域样本集中的情感极性。5.根据权利要求1所述的方法,其中,所述第二属性的确定方式包括:根据预设条件,对所述目标领域样本集添加参考标签;所述参考标签包括正向标签或负向标签;利用所述参考标签确定所述样本特征的第二属性。6.根据权利要求5所述的方法,其中,所述利用所述参考标签确定所述样本特征的第二属性,包括:利用所述参考标签确定所述样本特征在所述目标领域样本集中的第二频次值;利用所述目标领域样本集的样本数量和所述第二频次值,确定所述样本特征在所述目标领域样本集中的参考重要性和参考情感极性;将所述参考重要性和所述参考情感极性作为所述第二属性。7.根据权利要求6所述的方法,其中,所述参考重要性的确定方式,包括:利用所述第二频次值和所述目标领域样本集的样本数量,确定所述样本特征的第二卡方值和偏差估计值;所述第二卡方值为所述样本特征在所述目标领域样本集中的卡方值;利用所述第二卡方值和所述偏差估计值,确定所述样本特征在所述目标领域样本集中的参考重要性。8.根据权利要求1所述的方法,其中,所述根据所述第一属性和所述第二属性,在所述源领域样本集中确定目标标注样本,包括:根据所述第一属性和所述第二属性,确定目标样本特征;利用所述目标样本特征,在所述源领域样本集中进行数据筛选,以确定所述目标标注
样本。9.根据权利要求8所述的方法,其中,所述根据所述第一属性和所述第二属性,确定目标样本特征,包括:在所述源领域样本集中,选取所述第一属性中的重要性和所述第二属性中的参考重要性均满足预定条件的样本特征,作为候选样本特征;在所述候选样本特征中,选取所述第一属性中的情感极性和所述第二属性中的参考情感极性相同的样本特征,作为所述目标样本特征。10.一种标注样本选取装置,包括:属性确定模块,用于确定确定样本特征的第一属性和第二属性;所述第一属性和所述第二属性分别是所述样本特征在源领域样本集的特征属性和所述样本特征在目标领域样本集的特征属性;标注样本确定模块,用于根据所述第一属性和所述第二属性,在所述源领域样本集的多个候选标注样本中确定目标标注样本;所述目标标注样本用于训练分类模型,所述分类模型包括用于对输入的待分类样本进行分析以确定情感极性的模型。11.根据权利要求10所述的装置,其中,所述属性确定模块,包括:第一频次值确定子模块,用于确定所述样本特征在所述源领域样本集中的第一频次值;第一属性确定子模块,用于利用所述第一频次值确定所述样本特征在所述源领域样本集中的重要性和情感极性;第一属性执行子模块,用于将所述样本特征在所述源领域样本集中的重要性和情感极性作为所述第一属性。12.根据权利要求11所述的装置,其中,所述第一属性确定子模块,包括:第一卡方值确定子模块,用于利用所述第一频次值和所述源领域样本集的样本数量,确定所述样本特征的第一卡方值;所述第一卡方值为所述样本特征在所述源领域样本集中的卡方值;重要性确定子模块,用于基于所述第一卡方值确定所述样本特征在所述源领域样本集中的重要性。13.根据权利要求12所述的装置,其中,所述第一属性确定子模块,包括:情感极性值确定子模块,用于利用所述第一频次值和所述源领域样本集的样本数量,确定所述样本特征的情感极性值;情感极性确定子模块,用于利用所述情感极性值确定所述样本特征在源领域样本集中的情感极性。14.根据权利要求10所述的装置,其中,所述属性确定模块,包括:参考标签确定子模块,用于根据预设条件对所述目标领域样本集添加参考标签;所述参考标签包括正向标签或负向标签;第二属性确定子模块,用于利用所述参考标签确定所述样本特征的第二属性。15.根据权利要求14所述的装置,其中,所述第二属性确定子模块,包括:第二频次值确定子模块,用于利用所述参考标签确定所述样本特征在所述目标领域样本集中的第二频次值;
第二属性确定子模块,用于利用所述目标领域样本集的样本数量和所述第二频次值,确定所述样本特征在所述目标领域样本集中的参考重要性和参考情感极性;第二属性执行子模块,用于将所述参考重要性和所述参考情感极性作为所述第二属性。16.根据权利要求15所述的装置,其中,所述第二属性确定子模块,包括:第二卡方值确定子模块,用于利用所述第二频次值和所述目标领域样本集的样本数量,确定所述样本特征的第二卡方值和偏差估计值;所述第二卡方值为所述样本特征在所述目标领域样本集中的卡方值;参考重要性确定子模块,用于利用所述第二卡方值和所述偏差估计值,确定所述样本特征在所述目标领域样本集中的参考重要性。17.根据权利要求10所述的装置,其中,所述标注样本确定模块,包括:目标样本特征确定子模块,用于根据所述第一属性和所述第二属性,确定目标样本特征;目标标注样本确定子模块,用于利用所述目标样本特征,在所述源领域样本集中进行数据筛选,以确定所述目标标注样本。18.根据权利要求17所述的装置,其中,所述目标样本特征确定子模块,包括:候选样本特征确定子模块,用于在所述源领域样本集中,选取所述第一属性中的重要性和所述第二属性中的参考重要性均满足预定条件的样本特征,作为候选样本特征;目标样本特征执行子模块,用于在所述候选样本特征中,选取第一属性中的情感极性和所述第二属性中的参考情感极性相同的样本特征,作为所述目标样本特征。19.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。20.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法。21.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-9中任一项所述的方法。

技术总结
本公开提供了一种标注样本选取方法、装置、电子设备和存储介质,涉及计算机技术领域,具体为人工智能、深度学习技术领域。具体实现方案为:确定样本特征的第一属性和第二属性;第一属性和第二属性分别是样本特征在源领域样本集的特征属性和样本特征在目标领域样本集的特征属性;根据第一属性和第二属性,在源领域样本集的多个候选标注样本中确定目标标注样本;目标标注样本用于训练分类模型,分类模型包括用于对输入的待分类样本进行分析以确定情感极性的模型。确定情感极性的模型。确定情感极性的模型。


技术研发人员:彭敏龙 孙明明 李平
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2022.02.09
技术公布日:2022/5/6
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献