技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于大模型的债务人画像分析处理方法与模型与流程 > 正文

一种基于大模型的债务人画像分析处理方法与模型与流程

国知局
2024-07-31 23:14:33

本发明属于数据处理，尤其涉及一种基于大模型的债务人画像分析处理方法与模型。

背景技术：

1、由于债务人的个人信息数据存在着较大的差异，这就导致不同的债务人的还款意愿和还款能力存在差异，因此不同的债务人的画像存在一定程度的差异，具体的在发明专利申请cn202010597355.9《一种用户画像生成系统、方法、装置、设备和介质》中通过根据用户相关信息、特征工程以及从关系型数据库读取的业务场景对应的特征处理方式获得各个用户标签，并利用各个用户标签生成用户画像，但是却存在以下问题：

2、催收人员在于债务人沟通时，往往是通过电话、短信亦或者邮件的形式，上述形式均存在无法准确核实对方身份的问题，而通过上述方式生成的沟通记录进行债务人的画像生成时，由于沟通记录的身份的真实性存疑，这就导致债务人的画像的生成的真实性和准确性难以满足要求。

3、针对上述技术问题，本发明提供了一种基于大模型的债务人画像分析处理方法与模型。

技术实现思路

1、为实现本发明目的，本发明采用如下技术方案：

2、根据本发明的一个方面，提供了一种基于大模型的债务人画像分析处理方法。

3、一种基于大模型的债务人画像分析处理方法，具体包括：

4、s1根据历史催收语音数据的对应时刻将历史催收语音数据划分至不同的催收语音时段，利用不同的催收语音时段之间的语音相似情况进行可信沟通时段以及不同的可信沟通时段的身份可信度的确定；

5、s2基于语义解析结果进行不同的可信沟通时段的用户还款意愿的确定，并根据不同的可信沟通时段之间的用户还款意愿的偏差情况以及身份可信度确定能够进行债务人画像的构建时，进入下一步骤；

6、s3将除去历史催收语音数据的其他类型的历史催收沟通时段划分至不同的其它催收沟通时段，基于其它催收沟通时段与不同的可信沟通时段之间的语义风格相似情况确定可信催收沟通时段以及不同的可信催收沟通时段的身份参考可信度；

7、s4分别以所述可信催收沟通时段的沟通语句、可信沟通时段的沟通语句作为大模型的输入量确定所述债务人在不同的可信催收沟通时段下以及可信沟通时段下的还款意愿用户画像，并结合不同的可信催收沟通时段的身份参考可信度以及可信沟通时段的身份可信度确定所述债务人的画像分析结果。

8、进一步的技术方案在于，所述历史催收语音数据根据催收人员与所述债务人通过语音的方式的历史沟通数据进行确定。

9、进一步的技术方案在于，将历史催收语音数据划分至不同的催收语音时段，具体包括：

10、当历史催收语音数据之间的对应时刻的间隔时长小于预设时长时，则将所述历史催收语音数据划分至同一个催收语音时段。

11、进一步的技术方案在于，所述可信沟通时段的确定的方法为：

12、基于不同的催收语音时段的历史催收语音数据进行不同的催收语音时段的语音特征的提取得到对应语音特征，并基于所述催收语音时段与其它的催收语音时段的对应语音特征的相似情况确定所述催收语音时段与其它的催收语音时段的语音特征相似度的确定；

13、根据与其它的催收语音时段的语音特征相似度进行相似语音时段的确定，并通过所述相似语音时段的数量在所述其它的催收语音时段中的占比确定所述催收语音时段的身份可信度；

14、利用所述身份可信度确定所述催收语音时段是否为可信沟通时段。

15、进一步的技术方案在于，所述语音特征包括mfcc频率特征和fbank频率特征。

16、进一步的技术方案在于，利用所述身份可信度确定所述催收语音时段是否为可信沟通时段，具体包括：

17、当所述催收语音时段的身份可信度小于预设可信度阈值时，则确定所述催收语音时段不属于可信沟通时段。

18、进一步的技术方案在于，所述可信沟通时段的用户还款意愿的取值范围在0到1之间，其中所述可信沟通时段的用户还款意愿越大，则所述债务人在所述可信沟通时段对应的还款意愿度越高。

19、进一步的技术方案在于，所述债务人在不同的可信催收沟通时段下的还款意愿用户画像根据大模型的输出结果进行确定，其中所述还款意愿用户画像包括愿意还款、拒绝还款以及犹豫是否还款。

20、进一步的技术方案在于，所述债务人的画像分析结果的确定的方法为：

21、根据还款意愿用户画像的差异进行不同类型的还款意愿用户画像对应的可信催收沟通时段以及可信沟通时段；

22、通过不同类型的还款意愿用户画像对应的可信催收沟通时段以及可信催收沟通时段的身份参考可信度、对应的可信沟通时段以及可信沟通时段的身份可信度进行不同类型的还款意愿用户画像的综合身份可信度；

23、根据不同类型的还款意愿画像的综合身份可信度进行所述债务人的画像分析结果的确定。

24、进一步的技术方案在于，所述债务人的画像分析结果包括是否可以确认债务人的还款意愿用户画像。

25、进一步的技术方案在于，根据不同类型的还款意愿画像的综合身份可信度进行所述债务人的画像分析结果的确定，具体包括：

26、当不存在综合身份可信度大于预设身份可信度阈值的还款意愿画像的类型时，则确定无法确认债务人的还款意愿用户画像；

27、当存在综合身份可信度大于预设身份可信度阈值的还款意愿画像的类型时，则确定不同类型之间的还款意愿用户画像的综合身份可信度的偏差是否在预设偏差区间内，若是，则确定无法确认债务人的还款意愿用户画像，若否，则根据综合身份可信度最高的还款意愿用户画像进行所述债务人的还款意愿用户画像的确定。

28、第二方面，本技术提供一种基于大模型的债务人画像分析处理模型，采用上述的一种基于大模型的债务人画像分析处理方法，具体包括：

29、可信度评估模块，画像构建评估模块，参考可信度评估模块，画像分析结果输出模块；

30、其中所述可信度评估模块负责根据历史催收语音数据的对应时刻将历史催收语音数据划分至不同的催收语音时段，利用不同的催收语音时段之间的语音相似情况进行可信沟通时段以及不同的可信沟通时段的身份可信度的确定；

31、所述画像构建评估模块负责基于语义解析结果进行不同的可信沟通时段的用户还款意愿的确定，并根据不同的可信沟通时段之间的用户还款意愿的偏差情况以及身份可信度确定是否能够进行债务人画像的构建；

32、所述参考可信度评估模块负责将除去历史催收语音数据的其他类型的历史催收沟通时段划分至不同的其它催收沟通时段，基于其它催收沟通时段与不同的可信沟通时段之间的语义风格相似情况确定可信催收沟通时段以及不同的可信催收沟通时段的身份参考可信度；

33、所述画像分析结果输出模块负责分别以所述可信催收沟通时段的沟通语句、可信沟通时段的沟通语句作为大模型的输入量确定所述债务人在不同的可信催收沟通时段下以及可信沟通时段下的还款意愿用户画像，并结合不同的可信催收沟通时段的身份参考可信度以及可信沟通时段的身份可信度确定所述债务人的画像分析结果。

34、本发明的有益效果在于：

35、1、在本发明中，利用不同的催收语音时段之间的语音相似情况进行可信沟通时段以及不同的可信沟通时段的身份可信度的确定，实现了从语音相似的角度进行可信沟通时段的筛选，避免由于身份存在问题对用户的画像分析结果的准确性的影响，也为进一步实现对债务人的画像的构建奠定了基础。

36、2、在本发明中，利用可信催收沟通时段下以及可信沟通时段下的还款意愿用户画像、不同的可信催收沟通时段的身份参考可信度以及可信沟通时段的身份可信度确定债务人的画像分析结果，不仅考虑到由于语音相似情况的差异导致的可信沟通时段的身份可信度的差异，同时还考虑到由于与可信沟通时段的语义风格的相似情况的差异实现了从可信催收沟通时段的筛选，既保证了用户的还款意愿画像的参考数据的可信性，同时综合多种类型的沟通时段也使得最终的还款意愿用户画像的构建结果的准确性也得到了保证。

37、其他特征和优点将在随后的说明书中阐述，本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。

38、为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。