一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

审计问题文本数据处理方法及装置与流程

2022-06-08 20:59:01 来源:中国专利 TAG:


1.本技术涉及数据处理领域,也可用于金融领域,具体涉及一种审计问题文本数据处理方法及装置。


背景技术:

2.在实际审计工作中,审计问题是审计工作的主要成果。各类检查发现的问题是开展审计工作的重要参考,也是审计人员相互学习、提升检查水平的重要知识点。随着历年审计问题的积累,如何利用合适的外部信息,有效组织问题库的信息,为审计员提供良好的搜索体验,成为亟待研究的课题。
3.审计问题标题简洁、可用性高,但是标题一般都为短文本,存着在语义稀疏的问题。因此,为了解决审计问题标题语义稀疏的问题,利用一些外部信息扩展标题信息,丰富文本内容,提高聚类结果的有效性。但盲目扩充审计问题标题,有能影响其原有标题的语义信息,不利于后续审计问题的查询。


技术实现要素:

4.针对现有技术中的问题,本技术提供一种审计问题文本数据处理方法及装置,能够丰富审计问题文本内容,增强审计问题语义信息,优化审计问题聚类效果,提高了用户对审计问题的查询效率。
5.为了解决上述问题中的至少一个,本技术提供以下技术方案:
6.第一方面,本技术提供一种审计问题文本数据处理方法,包括:
7.接收用户发送的审计问题查询请求并根据所述审计问题查询请求中的查询词进行审计问题查询,得到预设审计问题库中对应的审计问题;
8.根据所述审计问题的标题,确定对应的相关查询词和共点击审计问题的标题,其中,所述相关查询词为其他能够查询到所述审计问题的查询词,所述共点击审计问题的标题为用户历史查询数据中点击过的其他审计问题的标题;
9.根据所述相关查询词和共点击审计问题的标题对所述审计问题的标题进行信息扩展,并根据预设文本聚类算法确定经过信息拓展后的标题的文本类别。
10.进一步地,所述根据所述审计问题的标题,确定对应的相关查询词和共点击审计问题的标题,包括:
11.根据预设审计问题库中的检索关系,确定与所述审计问题的标题对应的相关查询词;
12.根据用户历史查询数据中点击过的其他审计问题的标题,确定与所述审计问题的标题对应的共点击审计问题的标题。
13.进一步地,所述根据所述相关查询词和共点击审计问题的标题对所述审计问题的标题进行信息扩展,包括:
14.将所述相关查询词和共点击审计问题的标题按照设定顺序新增至所述审计问题
的标题中,并更新所述审计问题的标题。
15.进一步地,在所述根据所述相关查询词和共点击审计问题的标题对所述审计问题的标题进行信息扩展之后,在所述根据预设文本聚类算法确定经过信息拓展后的标题的文本类别之前,包括:
16.根据预设词向量模型对经过信息拓展后的审计问题的标题进行文本预处理,得到经过文件预处理后的审计问题的标题,其中,所述文本预处理包括切词处理和特定词过滤处理中的至少一种。
17.进一步地,所述根据预设文本聚类算法确定经过信息拓展后的标题的文本类别,包括:
18.根据短文本聚类算法和长文本聚类算法对经过信息拓展后的标题进行聚类运算,确定标题的文本类别。
19.第二方面,本技术提供一种审计问题文本数据处理装置,包括:
20.审计问题查询模块,用于接收用户发送的审计问题查询请求并根据所述审计问题查询请求中的查询词进行审计问题查询,得到预设审计问题库中对应的审计问题;
21.标题信息拓展模块,用于根据所述审计问题的标题,确定对应的相关查询词和共点击审计问题的标题,其中,所述相关查询词为其他能够查询到所述审计问题的查询词,所述共点击审计问题的标题为用户历史查询数据中点击过的其他审计问题的标题;
22.标题聚类模块,用于根据所述相关查询词和共点击审计问题的标题对所述审计问题的标题进行信息扩展,并根据预设文本聚类算法确定经过信息拓展后的标题的文本类别。
23.进一步地,所述标题信息拓展模块包括:
24.相关查询词确定单元,用于根据预设审计问题库中的检索关系,确定与所述审计问题的标题对应的相关查询词;
25.共点击标题确定单元,用于根据用户历史查询数据中点击过的其他审计问题的标题,确定与所述审计问题的标题对应的共点击审计问题的标题。
26.进一步地,所述标题聚类模块包括:
27.标题更新单元,用于将所述相关查询词和共点击审计问题的标题按照设定顺序新增至所述审计问题的标题中,并更新所述审计问题的标题。
28.进一步地,所述标题聚类模块包括:
29.文本预处理单元,用于根据预设词向量模型对经过信息拓展后的审计问题的标题进行文本预处理,得到经过文件预处理后的审计问题的标题,其中,所述文本预处理包括切词处理和特定词过滤处理中的至少一种。
30.进一步地,所述标题聚类模块包括:
31.文本类别确定单元,用于根据短文本聚类算法和长文本聚类算法对经过信息拓展后的标题进行聚类运算,确定标题的文本类别。
32.第三方面,本技术提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的审计问题文本数据处理方法的步骤。
33.第四方面,本技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算
机程序被处理器执行时实现所述的审计问题文本数据处理方法的步骤。
34.第五方面,本技术提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现所述的审计问题文本数据处理方法的步骤。
35.由上述技术方案可知,本技术提供一种审计问题文本数据处理方法及装置,通过基于用户发送的审计问题查询请求确定相应的相关查询词和共点击审计问题的标题,并由此对查询到的审计问题的标题进行拓展,据此能够丰富审计问题文本内容,增强审计问题语义信息,优化审计问题聚类效果,提高了用户对审计问题的查询效率。
附图说明
36.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
37.图1为本技术实施例中的审计问题文本数据处理方法的流程示意图之一;
38.图2为本技术实施例中的审计问题文本数据处理方法的流程示意图之二;
39.图3为本技术实施例中的审计问题文本数据处理装置的结构图之一;
40.图4为本技术实施例中的审计问题文本数据处理装置的结构图之二;
41.图5为本技术实施例中的审计问题文本数据处理装置的结构图之三;
42.图6为本技术实施例中的审计问题文本数据处理装置的结构图之四;
43.图7为本技术实施例中的审计问题文本数据处理装置的结构图之五;
44.图8为本技术一具体实施例中的审计问题文本数据处理流程的示意图;
45.图9为本技术实施例中的电子设备的结构示意图。
具体实施方式
46.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
47.本技术技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
48.考虑到现有技术中盲目扩充审计问题标题,有能影响其原有标题的语义信息,不利于后续审计问题的查询的问题,本技术提供一种审计问题文本数据处理方法及装置,通过基于用户发送的审计问题查询请求确定相应的相关查询词和共点击审计问题的标题,并由此对查询到的审计问题的标题进行拓展,据此能够丰富审计问题文本内容,增强审计问题语义信息,优化审计问题聚类效果,提高了用户对审计问题的查询效率。
49.为了能够丰富审计问题文本内容,增强审计问题语义信息,优化审计问题聚类效果,提高了用户对审计问题的查询效率,本技术提供一种审计问题文本数据处理方法的实施例,参见图1,所述审计问题文本数据处理方法具体包含有如下内容:
50.步骤s101:接收用户发送的审计问题查询请求并根据所述审计问题查询请求中的
查询词进行审计问题查询,得到预设审计问题库中对应的审计问题。
51.可选的,本技术预设有包含所有审计问题的审计问题库,以供用户/审计员进行检索查询。
52.可选的,本技术在接收到用户发送的审计问题查询请求后,可以根据所述审计问题查询请求中包含的查询词进行审计问题查询,得到预设审计问题库中对应的审计问题,并进行该审计问题的标题的展示(标题是用户/审计员实际场景中最关注的信息)。
53.步骤s102:根据所述审计问题的标题,确定对应的相关查询词和共点击审计问题的标题,其中,所述相关查询词为其他能够查询到所述审计问题的查询词,所述共点击审计问题的标题为用户历史查询数据中点击过的其他审计问题的标题。
54.可选的,所述用户历史查询数据既可以是当前用户的历史查询数据,也可以是系统中其他用户的部分或所有历史查询数据。
55.可选的,为了丰富审计问题文本内容,增强审计问题语义信息,本技术考虑到用户在进行查询审计问题时,相关查询词与其在内容上有语义相关性,共点击问题的标题与其标题的词汇有也有相关性,因此本技术利用这些外部信息,进一步丰富文本内容。
56.可选的,本技术可以根据查询到的审计问题的标题,确定对应的相关查询词和共点击审计问题的标题。
57.其中,所述相关查询词为其他能够查询到所述审计问题的查询词,所述共点击审计问题的标题为用户历史查询数据中点击过的其他审计问题的标题。
58.步骤s103:根据所述相关查询词和共点击审计问题的标题对所述审计问题的标题进行信息扩展,并根据预设文本聚类算法确定经过信息拓展后的标题的文本类别。
59.可选的,基于上述确定的相关查询词和共点击审计问题的标题,本技术可以对查询到的审计问题的标题进行信息拓展,以此丰富审计问题文本内容,增强审计问题语义信息。
60.可以理解的是,由于对原有的审计问题的标题进行了扩充,导致无法准确定位扩充后的文本类别(即属于短文本还是长文本),因此本技术可以选取代表性的短文本聚类算法和长文本聚类算法验证标题的扩展效果,重新确定经过信息拓展后的标题的文本类别。
61.从上述描述可知,本技术实施例提供的审计问题文本数据处理方法,能够通过基于用户发送的审计问题查询请求确定相应的相关查询词和共点击审计问题的标题,并由此对查询到的审计问题的标题进行拓展,据此能够丰富审计问题文本内容,增强审计问题语义信息,优化审计问题聚类效果,提高了用户对审计问题的查询效率。
62.为了能够准确对查询到的审计问题的标题进行拓展,在本技术的审计问题文本数据处理方法的一实施例中,参见图2,上述步骤s102还可以具体包含如下内容:
63.步骤s201:根据预设审计问题库中的检索关系,确定与所述审计问题的标题对应的相关查询词。
64.步骤s202:根据用户历史查询数据中点击过的其他审计问题的标题,确定与所述审计问题的标题对应的共点击审计问题的标题。
65.可选的,本技术通过预设审计问题库(即一种关系型数据库)内置的检索关系(即查询词与查询结果之间的对应关系),本技术可以确定与所述审计问题的标题对应的相关查询词,即还有哪些查询词也可以查询到该审计问题的标题,相关查询词与当前查询到的
审计问题的标题在内容上有语义相关性,因此可以用于进行标题信息拓展。
66.可选的,本技术通过查询用户历史查询数据中点击过的其他审计问题的标题,由此可以确定与当前查询到的审计问题的标题的对应的共点击审计问题的标题,共点击审计问题的标题与当前查询到的审计问题的标题在词汇上具有相关性,因此可以用于进行标题信息拓展。
67.为了能够便捷得对用户进行查询结果展示,在本技术的审计问题文本数据处理方法的一实施例中,上述步骤s103还可以具体包含如下内容:
68.将所述相关查询词和共点击审计问题的标题按照设定顺序新增至所述审计问题的标题中,并更新所述审计问题的标题。
69.可选的,扩展后的标题组合可以为:审计问题的标题 相关查询词、审计问题的标题 共点击审计问题的标题、审计问题的标题 相关查询词 共点击审计问题的标题中的任意一种。
70.为了能够提高后续聚类处理效率和准确率,在本技术的审计问题文本数据处理方法的一实施例中,上述步骤s103还可以具体包含如下内容:
71.根据预设词向量模型对经过信息拓展后的审计问题的标题进行文本预处理,得到经过文件预处理后的审计问题的标题,其中,所述文本预处理包括切词处理和特定词过滤处理中的至少一种。
72.可选的,由于后续需要进行聚类运算,因此为了提高后续聚类处理效率和准确率,本技术可以对经过信息拓展后的审计问题的标题进行文本预处理,例如通过word2vector词向量模型对文本进行表示,然后进行切词、过滤常用停用词、低频词等处理。
73.为了能够根据标题拓展结果对审计问题库进行重新整理,在本技术的审计问题文本数据处理方法的一实施例中,上述步骤s103还可以具体包含如下内容:
74.根据短文本聚类算法和长文本聚类算法对经过信息拓展后的标题进行聚类运算,确定标题的文本类别。
75.可选的,根据文本扩展结果,本技术可以应用代表性的短文本聚类算法btm(biterm topic model)和长文本聚类算法lda(latent dirichlet allocation)对经过信息拓展后的标题进行聚类运算,确定标题的文本类别(长文本或短文本)。
76.可选的,基于文本分类的结果,本技术可以重新整理审计问题库中的内容,例如按照标题文本类别的不同对审计问题库中的数据进行分类和排序。
77.为了能够丰富审计问题文本内容,增强审计问题语义信息,优化审计问题聚类效果,提高了用户对审计问题的查询效率,本技术提供一种用于实现所述审计问题文本数据处理方法的全部或部分内容的审计问题文本数据处理装置的实施例,参见图3,所述审计问题文本数据处理装置具体包含有如下内容:
78.审计问题查询模块10,用于接收用户发送的审计问题查询请求并根据所述审计问题查询请求中的查询词进行审计问题查询,得到预设审计问题库中对应的审计问题。
79.标题信息拓展模块20,用于根据所述审计问题的标题,确定对应的相关查询词和共点击审计问题的标题,其中,所述相关查询词为其他能够查询到所述审计问题的查询词,所述共点击审计问题的标题为用户历史查询数据中点击过的其他审计问题的标题。
80.标题聚类模块30,用于根据所述相关查询词和共点击审计问题的标题对所述审计
问题的标题进行信息扩展,并根据预设文本聚类算法确定经过信息拓展后的标题的文本类别。
81.从上述描述可知,本技术实施例提供的审计问题文本数据处理装置,能够通过基于用户发送的审计问题查询请求确定相应的相关查询词和共点击审计问题的标题,并由此对查询到的审计问题的标题进行拓展,据此能够丰富审计问题文本内容,增强审计问题语义信息,优化审计问题聚类效果,提高了用户对审计问题的查询效率。
82.为了能够准确对查询到的审计问题的标题进行拓展,在本技术的审计问题文本数据处理装置的一实施例中,参见图4,所述标题信息拓展模块20包括:
83.相关查询词确定单元21,用于根据预设审计问题库中的检索关系,确定与所述审计问题的标题对应的相关查询词。
84.共点击标题确定单元22,用于根据用户历史查询数据中点击过的其他审计问题的标题,确定与所述审计问题的标题对应的共点击审计问题的标题。
85.为了能够便捷得对用户进行查询结果展示,在本技术的审计问题文本数据处理装置的一实施例中,参见图5,所述标题聚类模块30包括:
86.标题更新单元31,用于将所述相关查询词和共点击审计问题的标题按照设定顺序新增至所述审计问题的标题中,并更新所述审计问题的标题。
87.为了能够提高后续聚类处理效率和准确率,在本技术的审计问题文本数据处理装置的一实施例中,参见图6,所述标题聚类模块30包括:
88.文本预处理单元32,用于根据预设词向量模型对经过信息拓展后的审计问题的标题进行文本预处理,得到经过文件预处理后的审计问题的标题,其中,所述文本预处理包括切词处理和特定词过滤处理中的至少一种。
89.为了能够根据标题拓展结果对审计问题库进行重新整理,在本技术的审计问题文本数据处理装置的一实施例中,参见图7,所述标题聚类模块30包括:
90.文本类别确定单元33,用于根据短文本聚类算法和长文本聚类算法对经过信息拓展后的标题进行聚类运算,确定标题的文本类别。
91.为了更进一步说明本方案,本技术还提供一种应用上述审计问题文本数据处理装置实现审计问题文本数据处理方法的具体应用实例,参见图8,具体包含有如下内容:
92.步骤一:获取问题库里审计问题的标题数据。
93.步骤二:利用搜索过程中的外部文本信息:相关查询词、共点击问题标题扩展对应审计问题的标题信息。
94.步骤三:获得对应文本表征向量,并进行相关的数据处理:如切词、去掉常用停用词、低频次等。
95.步骤四:应用经典的短文本和长文本聚类算法,获得对应的聚类效果。根据评价指标,获取最佳的聚类簇,得到更为精准的审计问题分布情况。
96.由此可见,本技术充分利用审计问题的外部多源信息,克服审计问题标题语义稀疏的问题,提升用户搜索体验,为后续的个性化推荐等场景提供有力支持。
97.从硬件层面来说,为了能够丰富审计问题文本内容,增强审计问题语义信息,优化审计问题聚类效果,提高了用户对审计问题的查询效率,本技术提供一种用于实现所述审计问题文本数据处理方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包
含有如下内容:
98.处理器(processor)、存储器(memory)、通信接口(communications interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现审计问题文本数据处理装置与核心业务系统、用户终端以及相关数据库等相关设备之间的信息传输;该逻辑控制器可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该逻辑控制器可以参照实施例中的审计问题文本数据处理方法的实施例,以及审计问题文本数据处理装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
99.可以理解的是,所述用户终端可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(pda)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
100.在实际应用中,审计问题文本数据处理方法的部分可以在如上述内容所述的电子设备侧执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本技术对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器。
101.上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
102.图9为本技术实施例的电子设备9600的系统构成的示意框图。如图9所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图9是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
103.一实施例中,审计问题文本数据处理方法功能可以被集成到中央处理器9100中。其中,中央处理器9100可以被配置为进行如下控制:
104.步骤s101:接收用户发送的审计问题查询请求并根据所述审计问题查询请求中的查询词进行审计问题查询,得到预设审计问题库中对应的审计问题。
105.步骤s102:根据所述审计问题的标题,确定对应的相关查询词和共点击审计问题的标题,其中,所述相关查询词为其他能够查询到所述审计问题的查询词,所述共点击审计问题的标题为用户历史查询数据中点击过的其他审计问题的标题。
106.步骤s103:根据所述相关查询词和共点击审计问题的标题对所述审计问题的标题进行信息扩展,并根据预设文本聚类算法确定经过信息拓展后的标题的文本类别。
107.从上述描述可知,本技术实施例提供的电子设备,通过基于用户发送的审计问题查询请求确定相应的相关查询词和共点击审计问题的标题,并由此对查询到的审计问题的标题进行拓展,据此能够丰富审计问题文本内容,增强审计问题语义信息,优化审计问题聚类效果,提高了用户对审计问题的查询效率。
108.在另一个实施方式中,审计问题文本数据处理装置可以与中央处理器9100分开配置,例如可以将审计问题文本数据处理装置配置为与中央处理器9100连接的芯片,通过中
央处理器的控制来实现审计问题文本数据处理方法功能。
109.如图9所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图9中所示的所有部件;此外,电子设备9600还可以包括图9中没有示出的部件,可以参考现有技术。
110.如图9所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
111.其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
112.输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为lcd显示器,但并不限于此。
113.该存储器9140可以是固态存储器,例如,只读存储器(rom)、随机存取存储器(ram)、sim卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为eprom等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
114.存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
115.通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
116.基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
117.本技术的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的审计问题文本数据处理方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的审计问题文本数据处理方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
118.步骤s101:接收用户发送的审计问题查询请求并根据所述审计问题查询请求中的查询词进行审计问题查询,得到预设审计问题库中对应的审计问题。
119.步骤s102:根据所述审计问题的标题,确定对应的相关查询词和共点击审计问题的标题,其中,所述相关查询词为其他能够查询到所述审计问题的查询词,所述共点击审计问题的标题为用户历史查询数据中点击过的其他审计问题的标题。
120.步骤s103:根据所述相关查询词和共点击审计问题的标题对所述审计问题的标题进行信息扩展,并根据预设文本聚类算法确定经过信息拓展后的标题的文本类别。
121.从上述描述可知,本技术实施例提供的计算机可读存储介质,通过基于用户发送的审计问题查询请求确定相应的相关查询词和共点击审计问题的标题,并由此对查询到的审计问题的标题进行拓展,据此能够丰富审计问题文本内容,增强审计问题语义信息,优化审计问题聚类效果,提高了用户对审计问题的查询效率。
122.本技术的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的审计问题文本数据处理方法中全部步骤的一种计算机程序产品,该计算机程序/指令被处理器执行时实现所述的审计问题文本数据处理方法的步骤,例如,所述计算机程序/指令实现下述步骤:
123.步骤s101:接收用户发送的审计问题查询请求并根据所述审计问题查询请求中的查询词进行审计问题查询,得到预设审计问题库中对应的审计问题。
124.步骤s102:根据所述审计问题的标题,确定对应的相关查询词和共点击审计问题的标题,其中,所述相关查询词为其他能够查询到所述审计问题的查询词,所述共点击审计问题的标题为用户历史查询数据中点击过的其他审计问题的标题。
125.步骤s103:根据所述相关查询词和共点击审计问题的标题对所述审计问题的标题进行信息扩展,并根据预设文本聚类算法确定经过信息拓展后的标题的文本类别。
126.从上述描述可知,本技术实施例提供的计算机程序产品,通过基于用户发送的审计问题查询请求确定相应的相关查询词和共点击审计问题的标题,并由此对查询到的审计问题的标题进行拓展,据此能够丰富审计问题文本内容,增强审计问题语义信息,优化审计问题聚类效果,提高了用户对审计问题的查询效率。
127.本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
128.本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
129.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指
令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
130.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
131.本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献