一种财政票据与非税收缴智能数据分析平台的制作方法
- 国知局
- 2024-11-21 12:09:37
本技术涉及计算机系统,更具体地,涉及一种财政票据与非税收缴智能数据分析平台。
背景技术:
1、现有的数据处理方法依赖于专业人员的深入介入,他们利用专业的sql技能来执行数据的收集、处理和分析工作。这一过程往往涉及大量的手工操作,确保数据的准确性和适用性。然而,这种方法也意味着报表生成通常是定制化的,服务于特定的、预先定义好的数据展示需求。
2、报表的固定化特点限制了数据展示的灵活性和多样性。用户在面对新的数据分析需求或希望从不同角度审视数据时,可能需要专业人员重新设计报表,这不仅增加了工作量,也延长了响应时间。
3、尽管现有的方法在特定场景下能够提供有效的数据处理支持,但随着数据量的持续增长和分析需求的日益复杂化,这一模式正面临着适应性和扩展性的挑战。未来的技术发展需要向着更高自动化、智能化的方向迈进,以提高数据处理的效率,降低对专业人员的依赖,并增强报表的灵活性和数据分析的深度
4、现有技术如专利号为“cn116089495a”的中国专利公开了一种基于大数据的自助分析平台。的技术方案为:该平台包括数据源接入单元、etl单元、自助分析引擎单元、分析建模单元、数据应用单元及权限管理单元,数据源接入单元用于多种数据源、不同数据类型文件的接入;etl单元用于将多来源的异构数据进行处理后得到具备完整性、一致性的数据模型,对各种结构化数据进行排序、去重、映射及行列合并的处理;自助分析引擎单元用于使用python扩展挖掘算法构建模型,进而使用tensorflow搭建模型,对数据进行深度学习训练,提供业务上数据预测和完善未来结果。
5、上述现有技术存在的问题有:
6、1.技术适应性方面:
7、依赖特定的技术框架如python和tensorflow搭建模型进行深度学习训练。如果这些技术框架出现更新或变动,可能会导致平台的兼容性问题,需要频繁的维护和升级。比如tensorflow版本升级后,某些原有的模型代码可能不再适用
8、2.模型准确性和可靠性方面:
9、仅使用python扩展挖掘算法和tensorflow搭建的模型,其准确性和可靠性可能受到多种因素的影响,如数据质量、特征工程的合理性、模型超参数的选择等。如果这些环节处理不当,可能导致模型的预测结果出现偏差,影响业务决策。深度学习模型往往具有黑箱性,难以解释其决策过程和结果,这在一些对决策解释性要求较高的业务场景中可能存在问题。
技术实现思路
1、为解决上述技术问题,本发明提出了一种财政票据与非税收缴智能数据分析平台。
2、本发明技术方案如下:
3、本发明提出一种财政票据与非税收缴智能数据分析平台,该平台包括:业务层、服务层、模型层和数据层;
4、所述业务层包括:业务管理功能模块,用于负责处理用户的自然语言输入,管理用户会话,确保用户查询的上下文连贯性;常见问题功能模块,用于存储和管理常见问题及其答案;数据库管理功能模块,用于数据库的及时更新和维护;提示词管理模块,用于管理大语言模型的提示词模板;
5、所述服务层包括:敏感词处理模块,用于识别处理用户输入问题的敏感词汇;统计报表模块,大语言模型基于查询结果生成统计报表;可视化模块,提供数据的可视化展示功能,包括图表生成和数据展示;数据分析模块,根据用户提出的问题对查询结果数据进行分析;
6、所述模型层包括:大语言模型,用于分析用户提出问题的语义、并将问题转化为结构化查询语言sql的查询语句及输出查询分析结果;重新排序rerank模型,对根据用户问题的检索内容进行相关性排序;向量空间映射embedding模型,将用户提出的问题与数据库中的内容转化为词向量;
7、所述数据层包括:业务数据库,用于存储财政票据与非税收缴的业务数据及用户反馈为正确的提问及解答;向量数据库,用于存储向量化的数据。
8、作为优选实施方式,所述大语言模型通过语义分析及rag2sql技术,将用户输入的自然语言转化为结构化查询语言sql的查询语句。
9、作为优选实施方式,所述重新排序rerank模型,将结构化查询语言sql的查询语句在向量数据库中的查询结果进行排序,并根据用户反馈对排序进行调整与优化。
10、作为优选实施方式,所述向量空间映射embedding模型,将用户输入的问题与向量数据库中的内容转化为向量表示,并通过向量空间距离表示语义相近程度。
11、作为优选实施方式,所述通过向量空间距离表示语义相近程度,采用欧几里得距离计算向量空间距离,具体公式如下:
12、
13、式中,ai、bi分别为两个向量在对应维度上的具体数值;i为向量索引维度,i∈n=1,2,3,…,n。
14、作为优选实施方式,所述业务数据库包括存储财政票据与非税收缴的业务数据;还用于将用户反馈为正确的查询结果及对应的问题存入业务数据库,用于查询优化和模型训练。
15、作为优选实施方式,所述向量数据库存储和管理向量化的数据包括结构化查询语言sql示例、数据库文档和数据定义语言ddl。
16、另一方面,本发明还提供一种财政票据与非税收缴智能数据分析方法,包括以下步骤:
17、步骤s1,用户提出关于财政票据或非税收缴的具体问题;敏感词处理模块检测处理输入问题中含有的敏感词汇;
18、步骤s2,根据用户提出的问题,通过向量空间映射embedding模型在向量数据库中检索最相关的内容,内容包括:结构化查询语言sql、数据库文档和数据定义语言ddl;
19、步骤s3,将最相关的结构化查询语言sql、数据库文档和数据定义语言ddl内容填充到提示词模块中预设好的提示词模板中,生成的提示词用于帮助大语言模型准确地理解用户的查询意图,并优化生成的sql查询语句;
20、步骤s4,大语言模型根据用户提出原始问题以及生成的提示词,生成用于数据检索的结构化查询语言sql查询语句;
21、步骤s5,将大语言模型生成的结构化查询语言sql查询语句输入业务数据库中执行,输出对应的查询结果返回至大语言模型;
22、步骤s6,大语言模型根据查询结果自动生成可视化展示图表,根据图表内容以及客户提出的原始问题对图表数据进行分析,输出图标和分析结果;
23、步骤s7,用户对提供的图表数据和分析结果进行反馈;将用户反馈为正确的结构化查询语言sql查询及对应的问题存入业务数据库,用于查询优化和模型训练。
24、再一方面,本发明还提供一种电子设备,其上存储有计算机程序,所述计算机程序被处理器执行时实现如本发明任一实施例所述的一种财政票据与非税收缴智能数据分析方法。
25、再一方面,本发明还提供一种计算机可读介质,用于存储一个或者多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如本发明任一实施例所述的一种财政票据与非税收缴智能数据分析方法。
26、本发明具有如下有益效果:
27、提高数据处理效率:通过自动化的自然语言处理和知识库管理,本发明显著减少了对专业人员的依赖,加快了数据处理速度。
28、灵活性和适应性:本发明能够快速响应新的数据分析需求,无需专业人员重新设计报表,提供了更加灵活和动态的数据分析服务。
29、提升用户体验:通过直观的数据可视化和自然语言交互界面,本发明改善了用户体验,使得用户能够更加容易地获取和理解数据分析结果。
30、促进决策支持:深入的数据分析和图表展示功能为决策者提供了强有力的数据支持,帮助他们做出更加精准和及时的决策。
31、持续学习和优化:知识库的不断更新和模型训练保证了系统能够随着时间推移而持续优化其性能和准确性。
本文地址:https://www.jishuxx.com/zhuanli/20241120/334598.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表