技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种音频数据的标注方法、装置、电子设备及存储介质与流程  >  正文

一种音频数据的标注方法、装置、电子设备及存储介质与流程

  • 国知局
  • 2024-06-21 10:43:48

本技术涉及数据处理,具体而言,涉及一种音频数据的标注方法、装置、电子设备及存储介质。

背景技术:

1、ai数据标注行业的作业模式主要是在线平台作业,其中核心要素之一是提供适配不同数据类型的标注模板。这些标注模板在数据标注过程中起到了至关重要的作用,它们决定了数据如何被标注、标注后以什么样的格式被输出。

2、音频数据标注功能主要分为对音频的展示交互以及音频数据标注两块内容,而针对于音频数据标注,很多传统的音频标注仅仅只能输入标注区间的转写的内容,角色等。这种方式不能满足越来约多样化的需求,当遇到复杂的属性标注需求,比如同时需要对文本进行ner标注、比如需要增加对话的分类,语气标签,场景标签等各种需求,另外在有一些场景下,可能需要对每段区间内容做自增表格信息的维护等,这种情况下,很难用一套功能或标准,引入不同配置也会使得维护性变差。

3、目前,在对音频进行标注时,技术人员根据不同的标注需求进行软件编程生成不同的标注模板,一旦标注模板被创建并嵌入到标注平台中,对标注模板的任何修改都需要由专业技术人员来进行,需要技术人员在大量的网页代码中进行手动修改,如图1所示,不仅耗时,还容易引入错误,标注模板的维护成本较高,如何能够提高音频数据的标注效率,是目前急需解决的问题。

技术实现思路

1、本技术的一些实施例的目的在于提供一种音频数据的标注方法、装置、电子设备及存储介质,通过本技术的实施例的技术方案,通过接收用户输入的标注指令,其中,所述标注指令中至少包括目标标注需求信息;根据所述目标标注需求信息,确定与所述目标标注需求信息对应的第一标注模板,其中,所述第一标注模板是预先根据不同的标注需求信息生成的;根据所述第一标注模板对待标注的音频数据进行标注,本技术实施例中预先根据不同的标注需求信息生成标注组件,用户通过直观的方式选择组件和自定义属性,即终端设备获取标注指令,然后根据该标注指令中的标注需求信息,生成对应的标注模板,大大简化了标注模板生成流程,无需技术人员再次进行软件编程,节省了人力物力,提高了标记模板的生成效率,进而提高了音频标注效率。

2、第一方面,本技术的一些实施例提供了一种音频数据的标注方法,包括:

3、接收用户输入的标注指令,其中,所述标注指令是通过选择目标标注需求信息对应的标注组件生成的;所述标注组件是预先根据不同的标注需求信息生成的;

4、根据所述目标标注需求信息,确定与所述目标标注需求信息对应的第一标注模板;

5、根据所述第一标注模板对待标注的音频数据进行标注。

6、本技术的一些实施例预先根据不同的标注需求信息生成标注组件,用户通过直观的方式选择组件和自定义属性,即终端设备获取标注指令,然后根据该标注指令中的标注需求信息,生成对应的标注模板,大大简化了标注模板生成流程,无需技术人员再次进行软件编程,节省了人力物力,提高了标记模板的生成效率,进而提高了音频标注效率。

7、可选地,所述方法还包括:

8、在所述目标标注需求信息发生变化的情况下,接收用户输入的标注修改指令,其中,所述标注修改指令至少包括变化后的标注需求信息;

9、根据所述变化后的标注需求信息,确定与所述变化后的标注需求信息对应的第二标注模板;

10、根据所述第二标注模板对所述待标注的音频数据进行标注。

11、本技术的一些实施例在标注信息发生变化的情况下,根据变化后的标注信息重新生成标注模块,并根据重新生成的标注模板对音频数据进行标注,而无需技术人员再次进行软件编程,节省了人力物力,提高了标记模板的生成效率,进而提高了音频标注效率。

12、可选地,所述根据所述目标标注需求信息,确定与所述目标标注需求信息对应的第一标注模板,包括:

13、获取所述目标标注需求信息,其中,所述目标标注需求信息至少包括标注组件、与所述标注组件对应的配置信息;

14、根据所述配置信息,对所述标注组件进行布局和外观调整,得到调整后的配置信息,以及配置各个标注组件之间的关联信息;

15、根据所述配置信息和所述关联信息,生成与所述目标标注需求信息对应的第一标注模板。

16、本技术的一些实施例中用户能够满足不同领域和任务的多样性标注需求,除了需求适配方面,高度定制化还体现在模板的布局样式上,编辑器允许用户在编辑过程中实时预览标注模板的效果,使用户能够直观地了解模板的外观和功能,任何模板调整可在编辑过程中得到实时反馈,这有助于提升定制编辑过程中的可控性和设计质量,减少用户试错和调整的时间,提高工作效率。

17、可选地,所述根据所述第一标注模板对待标注的音频数据进行标注,包括:

18、根据所述第一标注模块,确定与所述第一标注模块对应的交换格式数据;

19、通过预先设置的编辑器,将所述交换格式数据转换成超文本标记语言的数据,使得预设标注平台根据所述超文本标记语言的数据对所述待标注的音频数据进行标注。

20、本技术的一些实施例,根据第一标注模块,在后台实时生成为标准json交换格式,以供模板信息的保存和传递,后期需要维护模板时可经json回传至编辑器,恢复编辑进度,编辑器还提供了转写后的标准html和javascript代码,通过代码可以实现将模板从编辑器嵌入到到标注平台的便捷操作。

21、第二方面,本技术的一些实施例提供了一种音频数据的标注装置,包括:

22、接收模块,用于接收用户输入的标注指令,其中,所述标注指令中至少包括目标标注需求信息;

23、确定模块,用于根据所述目标标注需求信息,确定与所述目标标注需求信息对应的第一标注模板,其中,所述第一标注模板是预先根据不同的标注需求信息生成的;

24、标注模块,用于根据所述第一标注模板对待标注的音频数据进行标注。

25、本技术的一些实施例预先根据不同的标注需求信息生成标注组件,用户通过直观的方式选择组件和自定义属性,即终端设备获取标注指令,然后根据该标注指令中的标注需求信息,生成对应的标注模板,大大简化了标注模板生成流程,无需技术人员再次进行软件编程,节省了人力物力,提高了标记模板的生成效率,进而提高了音频标注效率。

26、可选地,所述装置还包括修改模块,所述修改模块用于:

27、在所述目标标注需求信息发生变化的情况下,接收用户输入的标注修改指令,其中,所述标注修改指令至少包括变化后的标注需求信息;

28、根据所述变化后的标注需求信息,确定与所述变化后的标注需求信息对应的第二标注模板;

29、根据所述第二标注模板对所述待标注的音频数据进行标注。

30、本技术的一些实施例在标注信息发生变化的情况下,根据变化后的标注信息重新生成标注模块,并根据重新生成的标注模板对音频数据进行标注,而无需技术人员再次进行软件编程,节省了人力物力,提高了标记模板的生成效率,进而提高了音频标注效率。

31、可选地,所述确定模块用于:

32、获取所述目标标注需求信息,其中,所述目标标注需求信息至少包括标注组件、与所述标注组件对应的配置信息;

33、根据所述配置信息,对所述标注组件进行布局和外观调整,得到调整后的配置信息,以及配置各个标注组件之间的关联信息;

34、根据所述配置信息和所述关联信息,生成与所述目标标注需求信息对应的第一标注模板。

35、本技术的一些实施例中用户能够满足不同领域和任务的多样性标注需求,除了需求适配方面,高度定制化还体现在模板的布局样式上,编辑器允许用户在编辑过程中实时预览标注模板的效果,使用户能够直观地了解模板的外观和功能,任何模板调整可在编辑过程中得到实时反馈,这有助于提升定制编辑过程中的可控性和设计质量,减少用户试错和调整的时间,提高工作效率。

36、可选地,所述标注模块用于:

37、根据所述第一标注模块,确定与所述第一标注模块对应的交换格式数据;

38、通过预先设置的编辑器,将所述交换格式数据转换成超文本标记语言的数据,使得预设标注平台根据所述超文本标记语言的数据对所述待标注的音频数据进行标注。

39、本技术的一些实施例,根据第一标注模块,在后台实时生成为标准json交换格式,以供模板信息的保存和传递,后期需要维护模板时可经json回传至编辑器,恢复编辑进度,编辑器还提供了转写后的标准html和javascript代码,通过代码可以实现将模板从编辑器嵌入到到标注平台的便捷操作。

40、第三方面,本技术的一些实施例提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现如第一方面任一实施例所述的音频数据的标注方法。

41、第四方面,本技术的一些实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如第一方面任一实施例所述的音频数据的标注方法。

42、第五方面,本技术的一些实施例提供一种计算机程序产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现如第一方面任一实施例所述的音频数据的标注方法。

本文地址:https://www.jishuxx.com/zhuanli/20240618/21383.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。