技术新讯 > 乐器声学设备的制造及制作,分析技术 > 演示文档页面的控制方法及装置、存储介质和电子设备与流程  >  正文

演示文档页面的控制方法及装置、存储介质和电子设备与流程

  • 国知局
  • 2024-06-21 11:31:28

本技术涉及人工智能领域、金融科技领域及其他相关,具体而言,涉及一种演示文档页面的控制方法及装置、存储介质和电子设备。

背景技术:

1、现在演示文稿投屏展示已经成为称为各种会议必不可少的内容,而在现有技术中,通常是通过主持人通过鼠标点击或者使用蓝牙连接的无线控制器对演示文稿进行页面控制,这需要主持人精神高度集中,且熟记每页演示文稿的内容,一旦主持人记忆出现遗漏,将会导致对演示文档切换页面出现错误的问题。并且当在会议过程中进行讨论时,无法快速定位讨论者所讨论的演示文稿页面,导致对演示文稿页面切换效率比较低的问题。

2、针对相关技术中采用人工的方式对演示文档进行换页操作,导致对演示文档进行页面切换的准确性比较低的问题,目前尚未提出有效的解决方案。

技术实现思路

1、本技术的主要目的在于提供一种演示文档页面的控制方法及装置、存储介质和电子设备,以解决相关技术中采用人工的方式对演示文档进行换页操作,导致对演示文档进行页面切换的准确性比较低的问题。

2、为了实现上述目的,根据本技术的一个方面,提供了一种演示文档页面的控制方法。该方法包括:在目标空间内展示目标演示文档,并获取所述目标空间内的初始语音数据和图像数据,其中,所述目标空间内存在n个第一对象,n为大于1的正整数;对所述初始语音数据进行语义分析,得到所述n个第一对象中的m个第二对象对应的第一语义信息,其中,所述第二对象为所述目标空间内产生所述初始语音数据的对象,m为小于或者等于n的正整数;依据所述图像数据,计算所述n个第一对象视线的焦点信息,并依据所述第一语义信息和所述焦点信息,对所述目标演示文档的页面进行控制。

3、进一步地,对所述初始语音数据进行语义分析,得到所述n个第一对象中的m个第二对象对应的第一语义信息包括:通过目标语音分离模型,对所述初始语音数据进行分离,得到每个第二对象对应的目标语音数据;对所述目标语音数据进行文本转换,得到每个第二对象对应的第一文本数据;通过语义分析模型对所述第一文本数据进行语义分析,得到所述第一语义信息。

4、进一步地,依据所述图像数据,计算所述n个第一对象视线的焦点信息包括:依据所述图像数据,确定所述n个第一对象的眼部图像信息;依据所述眼部图像信息,计算所述n个第一对象视线的焦点信息。

5、进一步地,依据所述第一语义信息和所述焦点信息,对所述目标演示文档的页面进行控制包括:对所述目标演示文档中的页面信息与所述第二对象对应的第一语义信息与进行匹配,得到匹配结果,其中,所述匹配结果用于表征所述目标演示文档中是否存在与所述第一语义信息匹配的页面信息;在所述匹配结果表征所述目标演示文档中存在与所述第一语义信息匹配的页面信息的情况下,确定所述目标演示文档中与所述第一语义信息匹配的目标页面信息;依据所述第一语义信息和所述焦点信息,判断是否对所述目标演示文档进行页面切换,得到目标判断结果;若所述目标判断结果表征对所述目标演示文档进行页面切换,则依据所述目标页面信息,对所述目标演示文档的页面进行控制。

6、进一步地,依据所述第一语义信息和所述焦点信息,判断是否对所述目标演示文档进行页面切换,得到目标判断结果包括:判断所述第一语义信息与目标语义信息是否匹配,得到第一判断结果,其中,所述目标语义信息用于指示对所述目标演示文档进行页面切换处理;依据焦点信息,判断所述n个第一对象中视线的焦点位于所述目标演示文档的比例是否大于预设数值,得到第二判断结果;依据所述第一判断结果和所述第二判断结果,确定所述目标判断结果。

7、进一步地,依据所述第一判断结果和所述第二判断结果,确定所述目标判断结果包括:若所述第一判断结果表征所述第一语义信息与所述目标语义信息匹配,并且所述第二判断结果表征n个第一对象中视线的焦点位于所述目标演示文档的比例大于所述预设数值,则确定所述目标判断结果为对所述目标演示文档进行页面切换。

8、进一步地,对所述目标演示文档中的页面信息与所述第二对象对应的第一语义信息与进行匹配,得到匹配结果包括:对所述目标演示文档中每个页面的文本数据进行提取,得到每个页面对应的第二文本数据;对所述第二文本数据进行语义分析,得到所述目标演示文档对应的第二语义信息;依据所述第一语义信息和所述第二语义信息进行语义信息的匹配,得到所述匹配结果。

9、进一步地,在通过目标语音分离模型,对所述语音数据进行分离,得到每个第二对象对应的初始语音数据之前,所述方法还包括:获取s个训练对象的第一语音数据,其中,s为大于或者等于n的正整数;对所述第一语音数据进行标注,得到每个训练对象对应的第二语音数据;依据第二语音数据,对初始语义分离模型进行训练,得到所述目标语音分离模型。

10、为了实现上述目的,根据本技术的另一方面,提供了一种演示文档页面的控制装置。该装置包括:第一获取单元,用于在目标空间内展示目标演示文档,并获取所述目标空间内的初始语音数据和图像数据,其中,所述目标空间内存在n个第一对象,n为大于1的正整数;分析单元,用于对所述初始语音数据进行语义分析,得到所述n个第一对象中的m个第二对象对应的第一语义信息,其中,所述第二对象为所述目标空间内产生所述初始语音数据的对象,m为小于或者等于n的正整数;控制单元,用于依据所述图像数据,计算所述n个第一对象视线的焦点信息,并依据所述第一语义信息和所述焦点信息,对所述目标演示文档的页面进行控制。

11、进一步地,分析单元包括:分离子单元,用于通过目标语音分离模型,对所述初始语音数据进行分离,得到每个第二对象对应的目标语音数据;转换子单元,用于对所述目标语音数据进行文本转换,得到每个第二对象对应的第一文本数据;分析子单元,用于通过语义分析模型对所述第一文本数据进行语义分析,得到所述第一语义信息。

12、进一步地,控制单元包括:第一确定子单元,用于依据所述图像数据,确定所述n个第一对象的眼部图像信息;计算子单元,用于依据所述眼部图像信息,计算所述n个第一对象视线的焦点信息。

13、进一步地,控制单元包括:匹配子单元,用于对所述目标演示文档中的页面信息与所述第二对象对应的第一语义信息与进行匹配,得到匹配结果,其中,所述匹配结果用于表征所述目标演示文档中是否存在与所述第一语义信息匹配的页面信息;第二确定子单元,在所述匹配结果表征所述目标演示文档中存在与所述第一语义信息匹配的页面信息的情况下,确定所述目标演示文档中与所述第一语义信息匹配的目标页面信息;判断子单元,用于依据所述第一语义信息和所述焦点信息,判断是否对所述目标演示文档进行页面切换,得到目标判断结果;控制子单元,用于若所述目标判断结果表征对所述目标演示文档进行页面切换,则依据所述目标页面信息,对所述目标演示文档的页面进行控制。

14、进一步地,判断子单元包括:第一判断模块,用于判断所述第一语义信息与目标语义信息是否匹配,得到第一判断结果,其中,所述目标语义信息用于指示对所述目标演示文档进行页面切换处理;第二判断模块,用于依据焦点信息,判断所述n个第一对象中视线的焦点位于所述目标演示文档的比例是否大于预设数值,得到第二判断结果;确定模块,用于依据所述第一判断结果和所述第二判断结果,确定所述目标判断结果。

15、进一步地,确定模块包括:确定子模块,用于若所述第一判断结果表征所述第一语义信息与所述目标语义信息匹配,并且所述第二判断结果表征n个第一对象中视线的焦点位于所述目标演示文档的比例大于所述预设数值,则确定所述目标判断结果为对所述目标演示文档进行页面切换。

16、进一步地,匹配子单元包括:提取模块,用于对所述目标演示文档中每个页面的文本数据进行提取,得到每个页面对应的第二文本数据;分析模块,用于对所述第二文本数据进行语义分析,得到所述目标演示文档对应的第二语义信息;匹配模块,用于依据所述第一语义信息和所述第二语义信息进行语义信息的匹配,得到所述匹配结果。

17、进一步地,所述装置还包括:第二获取单元,用于获取s个训练对象的第一语音数据,其中,s为大于或者等于n的正整数;标注单元,用于对所述第一语音数据进行标注,得到每个训练对象对应的第二语音数据;训练单元,用于依据第二语音数据,对初始语义分离模型进行训练,得到所述目标语音分离模型。

18、为了实现上述目的,根据本技术的一方面,提供了一种计算机可读存储介质,所述存储介质存储程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述任意一项所述的演示文档页面的控制方法。

19、为了实现上述目的,根据本技术的另一个方面,还提供了一种电子设备,电子设备包括一个或多个处理器和存储器,存储器用于存储一个或多个处理器实现上述任意一项所述的演示文档页面的控制方法。

20、通过本技术,采用以下步骤:在目标空间内展示目标演示文档,并获取目标空间内的初始语音数据和图像数据,其中,目标空间内存在n个第一对象,n为大于1的正整数;对初始语音数据进行语义分析,得到n个第一对象中的m个第二对象对应的第一语义信息,其中,第二对象为目标空间内产生初始语音数据的对象,m为小于或者等于n的正整数;依据图像数据,计算n个第一对象视线的焦点信息,并依据第一语义信息和焦点信息,对目标演示文档的页面进行控制,解决了相关技术采用人工的方式对演示文档进行换页操作,导致对演示文档进行页面切换的准确性比较低的问题。在本技术中,通过获取目标空间内的初始语音数据和图像数据,确定第二对象的第一语义信息和第一对象视线的焦点信息,并根据第一语义信息和焦点信息对目标演示文档的页面进行控制,实现了对演示文档页面的智能化控制,避免了通过人工的方式对演示文档的页面进行切换,进而达到了提高控制演示文档页面准确性的效果。

本文地址:https://www.jishuxx.com/zhuanli/20240618/22040.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。