技术新讯 > 信息存储应用技术 > 调整播放进度的方法、相关装置及计算机程序产品与流程  >  正文

调整播放进度的方法、相关装置及计算机程序产品与流程

  • 国知局
  • 2024-07-31 19:42:14

本公开涉及计算机,具体涉及音频处理、多媒体播放、自然语言处理等人工智能,尤其涉及调整播放进度的方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

背景技术:

1、随着计算机技术的发展,人们获取信息、娱乐的方式也逐渐丰富。例如,如果希望获取书籍中的内容,以往需要用户通过纸质书或者电子文档才能实现。但随着计算机技术的发展,用户逐渐可以通过有声书的方式,来完成对书籍的“阅读”。有声书,通常是指由一种个人或多人依据文稿并借着不同的声音表情和录音格式所录制的作品。

2、在此情况下,为了方便用户跳转播放进度、更效率地获取期望的内容,在音频被播放时,可以与播放进度相关联地提供进度调整控件(例如,播放进度条)。用户可以通过使用进度调整控件(例如,拉动进度条中的当前播放位置指示符)的方式,来跳转播放进度,以更效率地定位、获取用户所期望的内容。由此,如何方便用户执行进度跳转,提升进度调整的效率是值得关注和迫切需求的。

技术实现思路

1、本公开实施例提出了一种调整播放进度的方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

2、第一方面,本公开实施例提出了一种调整播放进度的方法,包括:响应于用户针对目标音频发送播放指令,生成目标音频的内容文本;基于内容语义完整度,将内容文本拆分为一组段落文本,其中,一组段落文本中的每个段落文本的语义完整度均满足预先确定的完整度阈值的要求;生成每个段落文本相应的梗概信息,其中,梗概信息基于相应的段落文本的语义内容被确定;为用户呈现一组段落文本中至少部分的段落文本的梗概信息;响应于用户针对目标段落文本的目标梗概信息做出跳转指示,基于目标段落文本对应的目标音频播放位置,跳转目标音频的播放进度。

3、第二方面,本公开实施例提出了一种调整播放进度的装置,包括:文本生成单元,被配置成响应于用户针对目标音频发送播放指令,生成目标音频的内容文本;段落拆分单元,被配置成基于内容语义完整度,将内容文本拆分为一组段落文本,其中,一组段落文本中的每个段落文本的语义完整度均满足预先确定的完整度阈值的要求;梗概生成单元,被配置成生成每个段落文本相应的梗概信息,其中,梗概信息基于相应的段落文本的语义内容被确定;梗概呈现单元,被配置成为用户呈现一组段落文本中至少部分的段落文本的梗概信息;第一进度跳转单元,被配置成响应于用户针对目标段落文本的目标梗概信息做出跳转指示,基于目标段落文本对应的目标音频播放位置,跳转目标音频的播放进度。

4、第三方面,本公开实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的调整播放进度的方法。

5、第四方面,本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的调整播放进度的方法。

6、第五方面,本公开实施例提供了一种包括计算机程序的计算机程序产品,该计算机程序在被处理器执行时能够实现如第一方面中任一实现方式描述的调整播放进度的方法。

7、本公开实施例提供的调整播放进度的方法、装置、电子设备、计算机可读存储介质及计算机程序产品,响应于用户针对目标音频发送播放指令,生成目标音频的内容文本;然后,基于内容语义完整度,将内容文本拆分为一组段落文本,其中,一组段落文本中的每个段落文本的语义完整度均满足预先确定的完整度阈值的要求;进一步地,生成每个段落文本相应的梗概信息,其中,梗概信息基于相应的段落文本的语义内容被确定;进一步地,为用户呈现一组段落文本中至少部分的段落文本的梗概信息;最后,响应于用户针对目标段落文本的目标梗概信息做出跳转指示,基于目标段落文本对应的目标音频播放位置,跳转目标音频的播放进度。

8、本公开不仅能够基于语义完整度将音频的文字内容拆分为多个段落后,向用户呈现至少一部分的段落的梗概信息,使得用户可以通过梗概信息快速地理解音频所包括的内容,还可以使得用户以“段落”为单位进行进度调整,方便用户整段、跨度地调整播放进度,降低用户的操作成本、提升用户的操作效率。

9、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征:

1.一种调整播放进度的方法,包括:

2.根据权利要求1所述的方法,其中,所述为所述用户呈现所述一组段落文本中至少部分的段落文本的梗概信息,包括:

3.根据权利要求2所述的方法,其中,所述基于所关联的播放时间起点距离所述当前播放位置的距离由近至远,从所述一组段落文本中确定为所述用户呈现的至少一项段落文本,包括:

4.根据权利要求2所述的方法,还包括:

5.根据权利要求1所述的方法,还包括:

6.根据权利要求5所述的方法,还包括:

7.根据权利要求1所述的方法,还包括:

8.根据权利要求1所述的方法,其中,所述为所述用户呈现所述一组段落文本中至少部分的段落文本的梗概信息,包括:

9.根据权利要求1所述的方法,还包括:

10.根据权利要求9所述的方法,其中,所述段落文本的音频播放位置,基于所述段落文本的首个字符位于所述目标音频中的播放位置被确定。

11.根据权利要求1所述的方法,还包括:

12.根据权利要求1所述的方法,还包括:

13.根据权利要求1所述的方法,还包括:

14.根据权利要求1-13中任一项所述的方法,其中,生成所述目标音频的内容文本,包括:

15.根据权利要求14所述的方法,其中,所述基于内容语义完整度,将所述内容文本拆分为一组段落文本,包括:

16.一种调整播放进度的装置,包括:

17.根据权利要求16所述的装置,其中,所述梗概呈现单元,包括:

18.根据权利要求17所述的装置,其中,段落排序子单元进一步被配置成,在所关联的播放时间起点位于所述当前播放位置之后的一组候选段落文本中,基于所关联的播放时间起点距离所述当前播放位置的距离由近至远,确定为所述用户呈现的至少一项段落文本。

19.根据权利要求17所述的装置,还包括:

20.根据权利要求16所述的装置,还包括:

21.根据权利要求20所述的装置,还包括:

22.根据权利要求16所述的装置,还包括:

23.根据权利要求16所述的装置,其中,所述梗概呈现单元,进一步被配置成,为所述用户呈现所述一组段落文本中至少部分的段落文本的梗概信息和所述至少部分的段落文本。

24.根据权利要求16所述的装置,还包括:

25.根据权利要求24所述的装置,其中,所述段落文本的音频播放位置,基于所述段落文本的首个字符位于所述目标音频中的播放位置被确定。

26.根据权利要求16所述的装置,还包括:

27.根据权利要求16所述的装置,还包括:

28.根据权利要求16所述的装置,还包括:

29.根据权利要求16-28中任一项所述的装置,其中,所述文本生成单元进一步被配置成,利用生成式模型处理所述目标音频,生成所述目标音频的文本内容。

30.根据权利要求29所述的装置,其中,所述段落拆分单元进一步被配置成,包括:

31.一种电子设备,包括:

32.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-15中任一项所述的调整播放进度的方法。

33.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-15中任一项所述的调整播放进度的方法。

技术总结本公开提供了调整播放进度的方法、相关装置及计算机程序产品,涉及音频处理、多媒体播放、自然语言处理等人工智能技术领域。该方法的一具体实施方式包括:响应于用户针对目标音频发送播放指令,生成目标音频的内容文本;基于内容语义完整度,将内容文本拆分为一组段落文本,一组段落文本中的每个段落文本的语义完整度均满足预先确定的完整度阈值的要求;基于每个段落文本的语义内容生成相应的梗概信息;为用户呈现至少部分的段落文本的梗概信息;响应于用户针对目标段落文本的目标梗概信息做出跳转指示,基于目标段落文本对应的目标音频播放位置,跳转目标音频的播放进度。由此,能够辅助用户以“段落”为单位进行进度调整,提升用户的操作效率。技术研发人员:闵媛,胡媛受保护的技术使用者:北京百度网讯科技有限公司技术研发日:技术公布日:2024/3/4

本文地址:https://www.jishuxx.com/zhuanli/20240731/183594.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。