技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于大语言模型的表格数据交互式处理方法 > 正文

一种基于大语言模型的表格数据交互式处理方法

国知局
2024-07-31 23:21:26

本发明属于人工智能应用领域，尤其涉及一种基于大语言模型的表格数据交互式处理方法。

背景技术：

1、随着信息技术的迅猛发展和大数据时代的到来，microsoft excel、mac numbers、wps表格等电子表格软件作为数据管理和数据分析的核心工具，在各行各业得到了广泛的应用。传统的电子表格软件尽管功能强大，但在处理复杂的数据转换、统计分析以及高级计算任务等需求时，往往要求用户具备一定的编程技能和内部函数运用能力。这一局限性使得非技术人员在面对大量数据操作时感到力不从心，无法充分发挥电子表格的潜力。

2、与此同时，市场上的电子表格辅助工具虽然能够简化一些常见操作，但它们在处理非结构化自然语言需求与实际数据处理逻辑间的转化时仍显不足。用户通常需要花费大量时间和精力去手动输入公式、链接单元格或编写宏命令，这不仅效率低下，而且容易出错。尤其是在需求频繁变化的情况下，用户往往难以快速适应和迭代。

3、近年来，大语言模型(large language model,llm)技术在自然语言处理领域取得了显著进展。通过在大规模语料库上的训练，其深入的语义理解能力和灵活的文本生成潜能已在众多领域内得以验证和应用。然而，在电子表格这一特定场景下，尽管llm技术具有巨大的潜力，却尚未被充分整合并针对性地应用于直接响应用户以自然语言形式表述的数据处理，进而自动生成和执行相关数据处理脚本的需求。

4、基于上述背景，本发明提出了一种基于大语言模型的表格数据交互式处理方法。本方法利用llm技术的语义理解和生成能力，将用户的自然语言指令精准解析并转译为可执行的程序代码，进而实现对电子表格数据的自动化处理。该方法不仅能够显著提升数据处理的效率和准确性，减少人为错误，还将有力拓展非专业编程人员群体进行复杂数据操作的能力边界，带来更为智能化、个性化以及易于迭代的数据处理体验。

技术实现思路

1、本发明旨在解决现有电子表格处理过程中存在的操作复杂、效率低下以及非技术人员使用难度大的问题，提供一种基于大语言模型的表格数据交互式处理方法，实现用户需求的自然语言输入与电子表格数据的自动化处理之间的无缝衔接，从而提高数据处理效率，降低操作难度，拓宽用户群体，为电子表格的智能化处理提供新的解决方案。

2、为实现上述目的，本发明提供了一种基于大语言模型的表格数据交互式处理方法，包括以下步骤：

3、s1.接收用户提交的电子表格文件和用户输入的自然语言数据处理需求：系统接收用户上传的电子表格文件，并记录用户希望利用这些表格数据执行的具体操作或达成的目标；

4、s2.读取电子表格文件并提取关键信息：系统读取用户上传的电子表格文件，从中提取表头信息、数据结构以及相关描述；

5、s3.深度语义理解与计算步骤生成：系统将用户输入的自然语言处理需求传递至大语言模型进行深度语义理解，大语言模型根据用户的需求以及提供的补充说明，生成一组适用于电子表格操作的计算步骤序列；

6、s4.代码生成与自动执行：根据大语言模型解析出的计算步骤序列，系统自动生成相应的代码；随后，系统执行这些代码以完成电子表格的处理任务，并在执行过程中缓存中间结果；

7、s5.实时反馈与监控：在执行过程中，系统实时监测处理状态和结果，并将实时反馈展示给用户；用户通过界面查看处理进度、中间结果以及任何可能的错误提示；

8、s6.用户反馈与纠错调整：接收用户对处理结果和过程的反馈；当发现错误或需要进一步调整时，通过自然语言或图形界面方式进行纠错输入或任务调整；

9、s7.结果确认与处理完成：当用户确认全部步骤的结果无误后，系统完成整个处理需求；用户下载处理后的电子表格文件或查看最终的处理结果说明。

10、进一步地，所述步骤s1包括：

11、系统配置有接口或前端界面，允许用户上传各种格式兼容的电子表格文件，包括.csv、.xlsx、.xls文件；

12、用户输入的自然语言数据处理需求采用自由文本的形式，不限定特定句式或关键词，确保用户能够以日常交流方式表达复杂的操作意向；

13、系统对接收到的自然语言需求进行初步清洗和标准化处理，去除无关信息，保留关键的指令元素，确保需求的准确性和完整性；

14、在用户未严格按技术术语描述的情况下，系统通过主动询问用户得到补充说明，以正确解读用户的真实需求。

15、进一步地，所述步骤s2包括：

16、在读取过程中，系统关注并识别电子表格的前几行或指定位置的表头信息，表头信息包括列名或字段标识，所述列名和字段标识用于反映数据列的含义和用途；

17、系统解析表头中的元数据信息，包括数据类型、数据格式、数据有效性规则，为后续的数据处理提供详细的数据结构参考；

18、若电子表格中包含描述信息，包括批注、文档属性、单元格注释，系统将通过专用算法提取并整合这些信息，以辅助理解数据的业务背景和处理要求。

19、进一步地，所述专用算法具体为：首先，进行文本提取，系统通过解析电子表格文件格式，精确识别并定位各类关联描述信息；对于每一个找到的批注、文档属性或单元格注释，系统仅执行基本的文本抓取操作，即直接读取并储存其原始文本内容；然后，进行信息整合，系统按照描述信息的来源进行分类，并依据临近匹配的方式关联相应单元格位置信息，通过文本模板规则将关联的描述信息和单元格位置信息进行拼接。

20、进一步地，所述步骤s3中，生成的步骤序列包括但不限于：基于条件的数据筛选操作，跨表格或多维度的数据整合操作，复杂的数学计算和统计分析操作，以及丰富多样的数据可视化展示操作。

21、进一步地，所述步骤s4包括：

22、自动化执行引擎读取由大语言模型转化而来的代码，并在兼容的运行环境中即时执行，无需人工干预，从而实现从用户自然语言需求到实际电子表格数据处理动作的无缝对接；

23、执行过程遵循预设的安全性和容错性原则，确保在执行代码时能够防止潜在的数据错误、逻辑冲突以及其他导致数据破坏的风险；

24、完成上述流程后，系统将最终处理结果更新回电子表格中，呈现给用户。

25、进一步地，所述步骤s6包括：

26、系统执行数据时一步步反馈给用户进行检查，得到用户确认后再进行下一步操作，期间实时接收用户对电子表格处理结果及其处理过程的审查与反馈；

27、当用户在审查过程中识别出任何处理错误，包括数据不匹配、计算错误或逻辑处理不当时，用户通过自然语言方式直接向系统阐述问题所在或提出修改意见，通过直观的图形用户界面进行错误定位和修正操作；

28、用户若需要对已经执行完毕的任务进行进一步细化或调整，包括增加新的处理步骤以及改变现有步骤的参数设置，通过利用自然语言交互功能，向系统清晰表述调整意图。

29、为实现上述目的，本发明还提供了一种基于大语言模型的表格数据交互式处理装置，包括一个或多个处理器，用于实现上述的基于大语言模型的表格数据交互式处理方法。

30、为实现上述目的，本发明还提供了一种电子设备，包括存储器和处理器，所述存储器与所述处理器耦接；其中，所述存储器用于存储程序数据，所述处理器用于执行所述程序数据以实现上述的基于大语言模型的表格数据交互式处理方法。

31、为实现上述目的，本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现上述的基于大语言模型的表格数据交互式处理方法。

32、本发明的有益效果是：本发明提供了一种基于大语言模型的表格数据交互式处理方法，通过充分运用大型语言模型(llm)技术，构建了一种用户友好且高效的电子表格智能化处理方案。这种方法和系统极大地简化了用户对电子表格数据的操作流程，不仅让用户能够通过自然语言轻松表达处理需求，而且实现了从需求理解到执行指令的自动化转换。系统能够精准解读表格结构，自动生成对应操作代码，并实时反馈处理状态与结果，方便用户随时查看、验证和调整。得益于其高度的智能性和灵活性，本发明显著提升了数据处理效率，降低了非专业人士的操作难度，拓展了电子表格应用的用户范围，有力推动了电子表格处理技术向智能化、人性化方向发展。