一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

目标物拍摄方法、装置、终端设备及存储介质与流程

2022-06-02 05:04:11 来源:中国专利 TAG:


1.本技术实施例涉及终端设备技术领域,尤其涉及一种目标物拍摄方法、装置、终端设备及存储介质。


背景技术:

2.目前,终端设备被广泛应用于各领域,如教学领域中,终端设备作为学习设备可以辅助学生进行学习。比如,当学生在作业本或试卷上答题时,可以对习题以及学生书写的答题内容进行拍摄,并利用人工智能技术识别答题的准确性,再如,当学生使用手指指向书本的某一处时,对该处内容进行拍摄并识别语义内容,之后,搜索相应的知识点进行讲解。
3.辅助学习的过程中,终端设备通常需要使用自身的前置摄像头。然而,终端设备的前置摄像头的拍摄范围有限,当学生使用的纸张较大时(如用户使用大于a4的纸张时),终端设备将无法拍摄完整的纸张内容,此时,需要通过交互的方式提示用户调整纸张的位置,以对纸张内容进行分区域拍摄。并且,前置摄像头通常为定焦摄像头,其只能对前端固定的区域进行清晰拍摄,而无法拍摄超出该区域的内容。
4.综上,当需要拍摄的目标物较大时,如何使前置摄像头拍摄完整的目标物,成为了亟需解决的技术问题。


技术实现要素:

5.本技术实施例提供了一种目标物拍摄方法、装置、终端设备及存储介质,以解决现有技术中当目标物较大时,无法使用前置摄像头拍摄完整目标物的技术问题。
6.第一方面,本技术实施例提供了一种目标物拍摄方法,应用于终端设备,所述终端设备包括前置拍摄部件,所述前置拍摄部件包括主摄像头,所述主摄像头对应第一拍摄区域,所述前置拍摄部件还包括位于所述主摄像头两侧的辅摄像头,每个所述辅摄像头对应至少一个第二拍摄区域,各所述辅摄像头的第二拍摄区域的并集区域大于所述第一拍摄区域且包含所述第一拍摄区域;
7.所述方法包括:
8.检测到针对目标物的书写操作时,控制所述主摄像头进行拍摄,得到定位图像;
9.根据所述定位图像以及所述主摄像头和辅摄像头的相对位置关系,确定所述主摄像头和所述辅摄像头拍摄图像间的坐标转换关系;
10.指示所述辅摄像头进行拍摄,得到多张区域图像,每张所述区域图像对应一个所述第二拍摄区域;
11.对多张所述区域图像进行拼接,并在拼接过程中使用所述坐标转换关系,以得到包含所述目标物的第一图像。
12.第二方面,本技术实施例还提供了一种目标物拍摄装置,应用于终端设备,所述终端设备包括前置拍摄部件,所述前置拍摄部件包括主摄像头,所述主摄像头对应第一拍摄区域,所述前置拍摄部件还包括位于所述主摄像头两侧的辅摄像头,每个所述辅摄像头对
应至少一个第二拍摄区域,各所述辅摄像头的第二拍摄区域的并集区域大于所述第一拍摄区域且包含所述第一拍摄区域:
13.所述装置包括:
14.第一拍摄单元,用于检测到针对目标物的书写操作时,控制所述主摄像头进行拍摄,得到定位图像;
15.定位单元,用于根据所述定位图像以及所述主摄像头和辅摄像头的相对位置关系,确定所述主摄像头和所述辅摄像头拍摄图像间的坐标转换关系;
16.第二拍摄单元,用于指示所述辅摄像头进行拍摄,得到多张区域图像,每张所述区域图像对应一个所述第二拍摄区域;
17.拼接单元,用于对多张所述区域图像进行拼接,并在拼接过程中使用所述坐标转换关系,以得到包含所述目标物的第一图像。
18.第三方面,本技术实施例还提供了一种目标物拍摄终端设备,所述终端设备包括前置拍摄部件,所述前置拍摄部件包括主摄像头,所述主摄像头对应第一拍摄区域,所述前置拍摄部件还包括位于所述主摄像头两侧的辅摄像头,每个所述辅摄像头对应至少一个第二拍摄区域,各所述辅摄像头的第二拍摄区域的并集区域大于所述第一拍摄区域且包含所述第一拍摄区域,
19.所述终端设备还包括:一个或多个处理器;
20.存储器,用于存储一个或多个程序;
21.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的目标物拍摄方法。
22.第四方面,本技术实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的目标物拍摄方法。
23.上述目标物拍摄方法、装置、终端设备及存储介质,通过在终端设备中设置前置拍摄部件,且前置拍摄部件包括主摄像头以及位于主摄像头两侧的辅摄像头,主摄像头对应第一拍摄区域,辅摄像头对应第二拍摄区域,各第二拍摄区域的并集区域大于且包含第一拍摄区域,当检测到对目标物的书写操作时,控制主摄像头拍摄定位图像,并以定位图像为基准,确定辅摄像头和主摄像头的坐标转换关系,之后,控制辅摄像头进行拍摄,并基于坐标转换关对辅摄像头拍摄的区域图像进行拼接,以得到包含完整目标物的第一图像,可以在目标物尺寸较大时,拍摄到完整的目标物。并且,将终端设备原有的前置摄像头作为主摄像头,并添加辅摄像头,可以维持主摄像头的硬件结合,实现以极小的成本代价来兼容主摄像头衍生出的服务功能,并且通过主摄像头拍摄的图像进行基准定位,可以在用户书写过程中,确定唯一的书写位置和区域。使用辅摄像头可以清晰的拍摄到第一拍摄区域的边缘,并且,每个辅摄像头只需要负责自己的拍摄区域即可,无需为其安装电机,也无需控制其旋转,降低了硬件成本。并且,拼接过程在后台执行,无需用户的交互,也提高了用户的使用体验。
附图说明
24.图1为本技术一个实施例提供的一种终端设备应用示例图;
25.图2为本技术一个实施例提供的第一拍摄区域示例图;
26.图3为本技术一个实施例提供的第二拍摄区域示例图;
27.图4为本技术一个实施例提供的一种目标物拍摄方法的流程图;
28.图5为本技术一个实施例提供的区域图像的第一示例图;
29.图6为本技术一个实施例提供的区域图像的第二示例图;
30.图7为本技术一个实施例提供的区域图像的第三示例图;
31.图8为本技术一个实施例提供的区域图像的第四示例图;
32.图9为本技术一个实施例提供的第一图像的示例图;
33.图10为本技术一个实施例提供的一种目标物拍摄方法的流程图;
34.图11为本技术一个实施例提供的一种目标物拍摄装置的结构示意图;
35.图12为本技术一个实施例提供的终端设备的结构示意图。
具体实施方式
36.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例用于解释本技术,而非对本技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本技术相关的部分而非全部结构。
37.本技术一个实施例提供了一种目标物拍摄方法,该目标物拍摄方法可以由目标物拍摄装置执行,该目标物拍摄装置可以通过软件和/或硬件的方式实现,并集成在目标物拍摄终端设备(也可记为终端设备)中。其中,目标物拍摄终端设备可以是两个或多个物理实体构成,也可以是一个物理实体构成,实施例对此不作限定。终端设备可以是手机、平板电脑、学习设备等电子设备,当前,以学习设备作为终端设备进行示例性描述。其中,学习设备作为用户学习的辅助设备,可以实现制定学习计划、显示教学课程、推荐习题、拍摄用户的学习过程或做题过程以及对用户解答的习题进行批改等功能,学习设备也可以记为学习机、学习终端等。
38.终端设备安装有至少一个操作系统,在操作系统下可以安装至少一个应用程序。其中,应用程序可以是操作系统自带的应用程序,也安装是从第三方设备或者服务器中下载的应用程序,当前不作限定。终端设备还安装有显示屏,该显示屏可带有触摸功能。终端设备还安装有通信装置,通过通信装置可与后台的服务器进行通信,还可以与其他电子设备(如终端设备、手机)进行通信。一个实施例中,终端设备还包括前置拍摄部件,前置拍摄部件可以实现前置拍摄。在终端设备的应用过程中,一个应用场景下,将终端设备固定在用户使用的书桌(也可以记为桌子、课桌等)桌面上,固定后,终端设备可以使用前置拍摄部件对桌面上对应的区域进行拍摄,用户学习时,该区域可放置纸质的学习资料(如教科书、作业本、试卷等)。其中,终端设备固定桌面时使用的固定方式不作限定。
39.一个实施例中,前置拍摄部件包括主摄像头,所述主摄像头对应第一拍摄区域,前置拍摄部件还包括位于主摄像头两侧的辅摄像头,每个辅摄像头对应至少一个第二拍摄区域,各辅摄像头的第二拍摄区域的并集区域大于第一拍摄区域且包含第一拍摄区域。
40.即前置拍摄部件由三个摄像头组成,三个摄像头中,主摄像头为定焦的摄像头,其可以是现有技术中终端设备使用的前置摄像头,维持现有技术中前置摄像头的硬件结构。两个辅摄像头为变焦的摄像头,且位于主摄像头的两侧,其中,以用户视角进行描述,在桌面固定终端设备后,两个辅摄像头位于主摄像头的左右两侧。举例来说,图1为本技术一个
实施例提供的一种终端设备应用示例图。参考图1,终端设备11固定在桌面12上,且终端设备11包括主摄像头13、辅摄像头14和辅摄像头15,其中,辅摄像头14和辅摄像头15等距的设置在主摄像头13的两端。可选的,桌面12上放置有当前需要拍摄的目标物,图1中,以桌面12上放置纸张且纸张为a3尺寸为例。可理解,实际应用中,辅摄像头的数量和安装位置也可以另做设定,主要满足辅摄像头可以拍摄到完整的纸张内容即可。
41.示例性的,主摄像头为定焦摄像头,每次拍摄时,其拍摄的范围固定,当前,将主摄像头所能拍摄到的区域记为第一拍摄区域。例如,图2为本技术一个实施例提供的第一拍摄区域示例图。参考图2,其示出了图1所处的场景下,使用主摄像头13拍摄时,桌面12中被拍摄到的第一拍摄区域17。
42.示例性的,辅摄像头为变焦摄像头,利用变焦的功能可以使辅摄像头变焦到不同的区域,进而对不同的区域进行清晰的拍摄。当前,将辅摄像头所能拍摄到的区域记为第二拍摄区域。一般而言,第二拍摄区域包含第一拍摄区域之外的边缘区域。每个辅摄像头可以对至少一个第二拍摄区域进行拍摄,其中,第二拍摄区域的数量以及位置可以根据实际需求设置。
43.一个实施例中,每个辅摄像头分别对应两个第二拍摄区域,其中一个第二拍摄区域为近景区域,另一个第二拍摄区域为远景区域,两个第二拍摄区域间存在交集区域。
44.一种可选方式,辅摄像头可以变焦到距离自身较近的区域以及距离自身较远的区域,此时,每个辅摄像头对应两个第二拍摄区域,其中一个第二拍摄区域为近景区域(即距离辅摄像头较近),另一个第二拍摄区域为远景区域(即距离辅摄像头较远)。可选的,近景区域和远景区域的大小相同,仅是距离辅摄像头的距离不同。需说明,实际应用中,辅摄像头的第二拍摄区域可以调整,如设置远、中、近三个第二拍摄区域,又或者设置更多的第二拍摄区域。
45.示例性的,同一辅摄像头对应的两个第二拍摄区域间存在交集区域,即利用辅摄像头进行拍摄时得到的各图像间会存在部分重复的内容,此时,基于重复的内容对各图像进行拼接,可以保证拼接的准确性。可选的,不同辅摄像头对应的相邻的第二拍摄区域之间也可以存在交集区域,以进一步提高拼接的准确性。一种可选方式,两个辅摄像头对应的近景区域间存在交集区域,两个辅摄像头对应的远景区域间可存在交集区域或者是无缝相邻。举例而言,图3为本技术一个实施例提供的第二拍摄区域示例图。参考图3,其示出了图1所处的场景下,使用辅摄像头14和辅摄像头15拍摄时,桌面12中被拍摄到的各第二拍摄区域。其中,辅摄像头14拍摄的近景区域为c1、远景区域为c2,辅摄像头15拍摄的近景区域为c3、远景区域为c4。c1和c2间存在交集区域,c3和c4间存在交集区域,c1和c3间存在交集区域,c2和c4无缝相邻(即两个区域间存在重合的边界线)。
46.一般而言,将终端设备固定在桌面后,第二拍摄区域组成的并集区域可以完整包含当前所需拍摄的目标物,如拍摄纸张时,包含常用的最大尺寸的纸质材料。例如,以纸质材料的最大尺寸为a3为例,参考图3,各第二拍摄区域组成的并集区域可覆盖完整的a3纸张16。
47.示例性的,第二拍摄区域可以包含部分第一拍摄区域以及第一拍摄区域之外的区域,各第二拍摄区域组成的并集区域包含完整且大于第一拍摄区域。参考图2和图3,图2中的第一拍摄区域只能覆盖部分纸张16,图3中各第二拍摄区域组成的并集区域可覆盖完整
的纸张16,此时,使用辅摄像头进行拍摄时,可以对主摄像头无法拍摄到的区域进行拍摄,以保证获取完整的纸张。
48.一个实施例中,前置拍摄部件可移动的设置在终端设备中。未使用前置拍摄部件时,前置拍摄部件隐藏在终端设备的内部,使用前置拍摄部件时,可以通过弹起或升起等方式,将前置拍摄部件暴露在终端设备的表面,并在使用结束后,继续隐藏前置拍摄部件。其中,前置拍摄部件的结构、移动方式当前不作限定。可理解,为前置拍摄部件增加移动性,可以在未使用前置拍摄部件时隐藏前置拍摄部件,进而避免外力对前置拍摄部件的损伤。需要说明的是,当前终端设备执行目标物拍摄方法时,需要使用到三个摄像头,因此,需要三个摄像头全部暴露在终端设备的表面,实际应用中,可以结合使用情况,选择其中当前使用的一个或多个摄像头暴露在终端设备的表面。
49.安装前置拍摄部件的终端设备执行目标物拍摄方法时其流程如图4所示。
50.参考图4,该方法包括:
51.步骤110、检测到针对目标物的书写操作时,控制主摄像头进行拍摄,得到定位图像。
52.示例性的,目标物是需要待拍摄的物体,当前以目标物为文本目标物为例进行描述,其中,文本目标物是可供用户学习、书写的纸张或书本,当前,文本目标物中印制有文本数据,文本数据可以包括:文字(字母、中文和/或数字等)、符号、表格等。例如,文本目标物为试卷时,其上印制有需要作答的习题题目。目标物放置在桌面上。
53.书写操作是指在目标物上进行书写时的操作。检测到针对目标物的书写操作时,可以认为用户可在目标物上进行书写。其中,检测书写操作的实现手段当前不作限定,例如,通过交互的方式在终端设备中显示是否进行书写的提示,之后,接收到用户发出的书写指令时,确定检测到书写操作。可理解,当前步骤中“检测到针对目标物的书写操作”并不是指用户在目标物上已经发出了真实的书写动作,而是使终端设备明确用户需要或可以进行书写,并对书写动作进行捕捉。
54.示例性的,检测到书写操作时,控制主摄像头对第一拍摄区域进行拍摄得到一张图像,该图像用于定位,即通过该图像可以将第一拍摄区域和第二拍摄区域所在的位置关联起来。当前,将用于定位的图像记为定位图像。
55.实际应用中,也可以先控制辅摄像头进行拍摄,并基于拍摄内容确定是否检测到书写动作,若检测到书写动作,则控制主摄像头进行拍摄,得到定位图像。
56.可选的,检测到针对目标物的书写操作时,控制主摄像头进行拍摄,得到定位图像后,还可以确定定位图像中是否包含完整的目标物(可通过图像识别或构建神经网络的方式实现),若包含完整的目标物,则直接使用主摄像头进行拍摄,若未包含完整的目标物,则执行步骤120。
57.步骤120、根据定位图像以及主摄像头和辅摄像头的相对位置关系,确定主摄像头和辅摄像头拍摄图像间的坐标转换关系。
58.示例性的,主摄像头拍摄时,使用基于主摄像头构建的三维坐标系和二维坐标系,辅摄像头拍摄时,使用基于辅摄像头构建的三维坐标系和二维坐标系。通过三维坐标系可以明确空间中的物体相对于摄像头的位置。二维坐标系是摄像头拍摄的图像所使用的像素坐标系。用户书写时,为了便于检测书写位置,需要得到主摄像头和辅摄像头的三维坐标系
或二维坐标系之间的坐标转换关系,以无论第二拍摄区域如何划分,在用户书写时,均可定位到唯一的书写坐标和拍摄区域。当前,以主摄像头和辅摄像头间二维坐标系的坐标转换关系为例,此时,该坐标转换关系也可以认为是主摄像头和辅摄像头拍摄的图像间的坐标转换关系。
59.示例性的,终端设备固定在桌面后,桌面上第一拍摄区域所在的位置和主摄像头之间的相关位置关系可知,桌面上第二拍摄区域所在的位置和辅摄像头的相对位置关系可知,并且,主摄像头和辅摄像头使用的内参也已知,此时,根据各相对位置关系和摄像头的内参,可以明确主摄像头拍摄的图像中各像素所显示的内容在桌面上的实际位置(该实际位置是像素所显示的内容相对于主摄像头的位置),以及辅摄像头拍摄的图像中各像素所显示的内容在桌面上的实际位置(该实际位置是像素所显示的内容相对于辅摄像头的位置)。并且,主摄像头和辅摄像头之间的相对位置关系是固定且已知的,因此,还可以基于相对位置关系明确主摄像头和辅摄像头之间的二维坐标系的坐标转换关系,当前,将定位图像作为基准,即通过坐标转换关系可以将辅摄像头拍摄的图像中的像素映射到主摄像头所使用的二维坐标系中。此时,辅摄像头拍摄的图像中的每个像素均可映射到定位图像所在的二维坐标系中,之后,基于该像素在定位图像所在二维坐标系中的位置还可以确定其在主摄像头使用的三维坐标系中的位置,即实现了定位。
60.此外,根据主摄像头和辅摄像头之间的二维坐标系的坐标转换关系,还可以明确主摄像头和辅摄像头之间的三维坐标系的坐标转换关系,即得到第二拍摄区域和第一拍摄区域之间的坐标转换关系,通过该坐标转换关系可以将辅摄像头拍摄时确定的实际位置变换到主摄像头的三维坐标系中。
61.无论用户在哪个区域进行书写,通过坐标转换关系,均可以确定书写位置的唯一坐标(主摄像头的三维坐标系中)以及其所在的区域。
62.步骤130、指示辅摄像头进行拍摄,得到多张区域图像,每张区域图像对应一个第二拍摄区域。
63.示例性的,定位后,控制辅摄像头进行拍摄。拍摄时,每个辅摄像头依次对其对应的第二拍摄区域进行拍摄,并在拍摄完成后,得到一张图像,当前,将辅摄像头拍摄的图像记为区域图像,可理解,每张区域图像对应一个第二拍摄区域。
64.可选的,控制辅摄像头进行拍摄时,可以设置拍摄周期,并按照拍摄周期进行拍摄。拍摄周期的持续时间当前不作限定,每个拍摄周期内,辅摄像头可以对其对应的每个第二拍摄区域进行一次拍摄。
65.步骤140、对多张区域图像进行拼接,并在拼接过程中使用坐标转换关系,以得到包含目标物的第一图像。
66.示例性的,由于每张区域图像均对应一个第二拍摄区域,因此,将各张区域拼接后,便可以得到各第二拍摄区域的并集区域所对应的图像,该图像显示有完整的目标物,当前,将基于各区域图像得到的拼接图像记为第一图像。
67.其中,对于当前使用的图像拼接方法不作限定。一个实施例中,由于区域图像中存在重叠的区域,因此,可以基于重叠的区域进行拼接。当前,以特征匹配拼接为例描述如何拼接。首先,获取两张待拼接的区域图像,可选的,两张区域图像对应相邻的第二拍摄区域,或者两张区域图像由同一辅摄像头拍摄并对应相邻的第二拍摄区域。之后,定义特征寻找
器。特征寻找器可以使用尺度不变特征变换(scale-invariant feature transform,sift)算法,实际应用中,也可以使用加速稳健特征(speeded up robust features,surf)算法或其他的算法。通过特征寻找器得到区域图像中的特征,并对两幅区域图像中的特征进行特征匹配,之后,使用光束平差法(bundle adjustment)来精确相应摄像头的参数(内参和外参),之后,确定两幅区域图像间的坐标变换关系,并进行坐标变换,之后,基于匹配的特征对坐标变换后的两幅区域图像进行拼接和融合,并对接缝区域(位于重复区域中)进行优化和处理,以得到拼接图像。上述处理过程为基于sift特征的图像匹配和拼接的基本流程,当前不另做描述。
68.一个实施例中,先对同一辅摄像头拍摄的区域图像进行拼接,之后,再对不同辅摄像头拼接后的图像进行拼接,以得到第一图像。此时,步骤140包括步骤141-步骤142:
69.步骤141、分别对每个辅摄像头所拍摄的区域图像进行拼接,以得到每个辅摄像头对应的完整图像。
70.当前,每个辅摄像头对应两个第二拍摄区域,且两个第二拍摄区域间存在交集区域。示例性的,按照前述拼接方法,先对同一辅摄像头拍摄的两张区域图像进行拼接,此时,将拼接后的图像记为完整图像。每个辅摄像头对应一张完整图像,且当前共有两张完整图像。
71.步骤142、利用坐标转换关系,对每个辅摄像头对应的完整图像进行拼接,以包含目标物的第一图像。
72.示例性的,按照前述拼接方法,对两张完整图像进行拼接。可选的,根据坐标转换关系,将拼接得到图像转到主摄像头使用的二维坐标系中,以得到第一图像,之后,通过第一图像进行书写定位。
73.举例而言,图5和图6分别为一个辅摄像头拍摄的两张区域图像,图7和图8分别为另一个辅摄像头拍摄的两张区域图像,使用前述拼接方法对四张区域图像拼接后,可以得到图9所示的第一图像。图9所示的第一图像的拼接效果较为理想,没有出现明显的拼接断裂情况,整体拼接情况非常好。可理解,图5-图9中做了不同程度的马赛克处理。
74.可理解,得到第一图像后,可以将第一图像发送至服务器,以进行后续处理,如进行文本识别以确定用户的书写内容,并在用户答题时批改用户的答题内容,再如进行指尖点读等。并且,还可以在终端设备中显示第一图像。
75.需说明,前述步骤均可在终端设备的后台运行。
76.上述,通过在终端设备中设置前置拍摄部件,且前置拍摄部件包括主摄像头以及位于主摄像头两侧的辅摄像头,主摄像头对应第一拍摄区域,辅摄像头对应第二拍摄区域,各第二拍摄区域的并集区域大于且包含第一拍摄区域,当检测到对目标物的书写操作时,控制主摄像头拍摄定位图像,并以定位图像为基准,确定辅摄像头和主摄像头的坐标转换关系,之后,控制辅摄像头进行拍摄,并基于坐标转换关对辅摄像头拍摄的区域图像进行拼接,以得到包含完整目标物的第一图像,可以在目标物尺寸较大时,拍摄到完整的文本物。并且,将终端设备原有的前置摄像头作为主摄像头,并添加辅摄像头,可以维持主摄像头的硬件结合,实现以极小的成本代价来兼容主摄像头衍生出的服务功能,并且通过主摄像头拍摄的图像进行基准定位,可以在用户书写过程中,确定唯一的书写位置和区域。使用辅摄像头可以清晰的拍摄到第一拍摄区域的边缘,并且,每个辅摄像头只需要负责自己的拍摄
区域即可,无需为其安装电机,也无需控制其旋转,降低了硬件成本。并且,拼接过程在后台执行,无需用户的交互,也提高了用户的使用体验。
77.图10为本技术一个实施例提供的一种目标物拍摄方法的流程图,本实施例是在上述实施例的基础上进行具体化。本实施例和前述实施例提供的方法由同一终端设备执行。参考图10,该方法包括:
78.步骤210、接收书写指令。
79.示例性的,书写指令用于提示终端设备检测到针对目标物的书写操作。书写指令的生成方式当前不作限定。例如,检测到执行目标物拍摄方法的应用程序启动后,确定接收到书写指令。又如,显示是否进行书写的提示,并在该提示中显示确定虚拟按键和否定虚拟按键,当检测到确定虚拟按键接收到设定操作(如点击操作),则确定接收到书写指令。
80.步骤220、响应于书写指令,开启主摄像头和辅摄像头,并确认检测到针对目标物的书写操作。
81.示例性的,接收到书写指令后,开启主摄像头和辅摄像头,此时,可以控制主摄像头和辅摄像头进行拍摄。一个实施例中,由于前置拍摄部件具有移动性,因此,响应于书写指令,开启主摄像头和辅摄像头可具体为:响应于书写指令,移动前置拍摄部件,以使前置拍摄部件暴露在终端设备的表面,并开启主摄像头和辅摄像头。即响应书写指令时,先移动前置拍摄部件,使其完全暴露在终端设备的表面,之后,再开启主摄像头和辅摄像头。
82.接收到书写指令后,还可以确认检测到针对目标物的书写操作,即通知终端设备用户将要进行书写操作。
83.步骤230、检测到针对目标物的书写操作时,控制主摄像头进行拍摄,得到定位图像。
84.步骤240、根据定位图像以及主摄像头和辅摄像头的相对位置关系,确定主摄像头和辅摄像头拍摄图像间的坐标转换关系。
85.步骤250、基于当前使用的摄像头所拍摄的图像识别目标对象,目标对象包括书写笔/或人类手部。
86.一个实施例中,在用户书写过程中,主摄像头和辅摄像头可以结合使用,以对书写过程进行拍摄。结合使用可以减小数据处理量(主摄像头拍摄的图像可直接使用无需进行拼接)。
87.示例性的,用户在目标物上进行书写时,需要发出书写动作,而目标对象与书写动作相关,即通过检测目标对象可以确定是否存在书写动作,即确定用户是否进行书写。可理解,用户进行书写时,需要使用手部握笔进行书写,因此,一个实施例中,目标对象为用户书写时使用的书写笔和/或人类手部。可选的,目标对象为用户书写时使用的书写笔时,可具体为书写笔的笔头和笔尖,笔尖是指书写笔中接触目标物以写入文本的部分,笔头是连接笔尖和笔杆的部分。可选的,目标对象为人类手部时,可具体为指尖。使用当前的摄像头(主摄像头或辅摄像头)进行拍摄后,可以对拍摄得到的图像进行识别,以确定目标对象在图像中的像素,进而得到目标对象的实际位置,当前,实际位置为主摄像头所使用三维坐标系中的唯一坐标位置。需说明,使用辅摄像头拍摄时,目标对象识别所使用的图像可以是拼接后的第一图像,也可以各辅摄像头拍摄的区域图像。
88.可理解,在拍摄的图像中识别某个对象为已经实现的技术,当前不另做描述。
89.步骤260、目标对象位于第一拍摄区域时,确定书写操作未超出第一拍摄区域,执行步骤290。目标对象未位于第一拍摄区域时,确定书写操作超出第一拍摄区域,执行步骤270。
90.示例性的,第一拍摄区域的实际位置可知,得到目标对象后,可以根据目标对象的实际位置,判断目标对象是否位于第一拍摄区域,若位于第一拍摄区域,则确定用户的书写操作未超出第一拍摄区域,之后,执行步骤290。否则,确定用户的书写操作超出第一拍摄区域,之后,执行步骤270。
91.可选的,识别目标对象后,若当前使用的摄像头为主摄像头,则可以直接确定目标对象位于第一拍摄区域中,并执行步骤290。若当前使用的摄像头为辅摄像头,则需要根据目标对象的实际位置,判断目标对象是否位于第一拍摄区域。
92.可选的,实际应用中,当前使用的摄像头所拍摄的图像中可能没有目标对象。当未识别到目标对象时,若当前使用的摄像头为主摄像头,则切换至辅摄像头进行拍摄,并继续检测目标对象。若当前使用的摄像头为辅摄像头,则确定用户当前并未书写,此时,可以继续使用辅摄像头进行拍摄,并持续检测目标对象。
93.步骤270、检测到书写操作超出第一拍摄区域时,指示辅摄像头进行拍摄,得到多张区域图像,每张区域图像对应一个第二拍摄区域。
94.示例性的,书写操作超出第一拍摄区域时,使用辅摄像头进行拍摄,以拍摄到更大的区域。
95.步骤280、对多张区域图像进行拼接,并在拼接过程中使用坐标转换关系,以得到包含目标物的第一图像。
96.可选的,基于第一图像确定用户当前进行书写的第二拍摄区域,并使用对应的辅摄像头对该第二拍摄区域进行持续拍摄,以实现对书写内容的跟中拍摄。
97.可选的,指示辅摄像头进行拍摄时,持续识别目标对象,并在确定目标对象位于第一拍摄区域时,切换至主摄像头进行拍摄。
98.步骤290、检测到书写操作未超出所述第一拍摄区域时,指示主摄像头进行拍摄,得到第二图像。
99.示例性的,书写操作未超出第一拍摄区域时,使用主摄像头进行拍摄,以减小数据处理量,此时,主摄像头对第一拍摄区域进行拍摄,并将拍摄得到的图形记为第二图像。可理解,当目标物超出第一拍摄区域时,第二图像中只有部分的目标物。
100.可选的,指示主摄像头进行拍摄时,持续识别目标对象,并在确定目标对象超出第一拍摄区域时,切换至辅摄像头进行拍摄。
101.上述,通过识别目标对象,可以在用户书写过程中,选择适合的摄像头进行拍摄,进而在保证拍摄到书写过程时,还可以减小终端设备的数据处理量。
102.图11为本技术一个实施例提供的一种目标物拍摄装置的结构示意图。该装置应用于终端设备,终端设备包括前置拍摄部件,前置拍摄部件包括主摄像头,主摄像头对应第一拍摄区域,前置拍摄部件还包括位于主摄像头两侧的辅摄像头,每个辅摄像头对应至少一个第二拍摄区域,各辅摄像头的第二拍摄区域的并集区域大于第一拍摄区域且包含第一拍摄区域,参考图11,该装置包括:第一拍摄单元301、定位单元302、第二拍摄单元303和拼接单元304。
103.其中,第一拍摄单元301,用于检测到针对目标物的书写操作时,控制所述主摄像头进行拍摄,得到定位图像;定位单元302,用于根据所述定位图像以及所述主摄像头和辅摄像头的相对位置关系,确定所述主摄像头和所述辅摄像头拍摄图像间的坐标转换关系;第二拍摄单元303,用于指示所述辅摄像头进行拍摄,得到多张区域图像,每张所述区域图像对应一个所述第二拍摄区域;拼接单元304,用于对多张所述区域图像进行拼接,并在拼接过程中使用所述坐标转换关系,以得到包含所述目标物的第一图像。
104.本技术一个实施例中,第二拍摄单元303具体用于:检测到书写操作超出第一拍摄区域时,指示辅摄像头进行拍摄,得到多张区域图像,每张所述区域图像对应一个所述第二拍摄区域。
105.本技术一个实施例中,还包括:第三拍摄单元,用于检测到书写操作未超出第一拍摄区域时,指示主摄像头进行拍摄,得到第二图像。
106.本技术一个实施例中,还包括:目标对象识别单元,用于基于当前使用的摄像头所拍摄的图像识别目标对象,目标对象包括书写笔/或人类手部;区域超出确定单元,用于所述目标对象位于所述第一拍摄区域时,确定所述书写操作未超出所述第一拍摄区域,所述目标对象未位于所述第一拍摄区域时,确定所述书写操作超出所述第一拍摄区域。
107.本技术一个实施例中,每个所述辅摄像头分别对应两个第二拍摄区域,其中一个第二拍摄区域为近景区域,另一个第二拍摄区域为远景区域,两个所述第二拍摄区域间存在交集区域。
108.本技术一个实施例中,拼接单元304包括:第一拼接子单元,用于分别对每个辅摄像头所拍摄的区域图像进行拼接,以得到每个辅摄像头对应的完整图像;第二拼接子单元,用于利用所述坐标转换关系,对每个所述辅摄像头对应的完整图像进行拼接,以得到包含所述目标物的第一图像。
109.本技术一个实施例中,还包括:指令接收单元,用于接收书写指令;摄像头启动单元,用于响应于所述书写指令,开启所述主摄像头和所述辅摄像头,并确认检测到针对目标物的书写操作。
110.本技术一个实施例中,所述前置拍摄部件可移动的设置在所述终端设备中,所述摄像头启动单元具体用于:响应于所述书写指令,移动所述前置拍摄部件,以使所述前置拍摄部件暴露在所述终端设备的表面,并开启所述主摄像头和所述辅摄像头,并确认检测到针对目标物的书写操作。
111.本实施例提供的目标物拍摄装置包含在终端设备中,用于执行上述任意实施例提供的目标物拍摄方法,具备相应的功能和有益效果。
112.值得注意的是,上述目标物拍摄装置的实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。
113.图12为本技术一个实施例提供的终端设备的结构示意图。如图12所示,该终端设备(也称为目标物拍摄终端设备)包括处理器30、存储器31、输入装置32、输出装置33、前置拍摄部件34;终端设备中处理器30的数量可以是一个或多个,图12中以一个处理器30为例;终端设备中的处理器30、存储器31、输入装置32、输出装置33、前置拍摄部件34可以通过总线或其他方式连接,图12中以通过总线连接为例。
114.存储器31作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本技术实施例中的目标物拍摄方法中的程序指令/模块(例如,目标物拍摄装置中的第一拍摄单元301、定位单元302、第二拍摄单元303和拼接单元304)。处理器30通过运行存储在存储器31中的软件程序、指令以及模块,从而执行终端设备的各种功能应用以及数据处理,即实现上述任意实施例提供的目标物拍摄方法。
115.存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器31可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器31可进一步包括相对于处理器30远程设置的存储器,这些远程存储器可以通过网络连接至终端设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
116.输入装置32可用于接收输入的数字或字符信息,以及产生与终端设备的用户设置以及功能控制有关的键信号输入。输出装置33可包括显示屏、扬声器等设备。前置拍摄部件34包括主摄像,所述主摄像头对应第一拍摄区域,所述前置拍摄部件还包括位于所述主摄像头两侧的辅摄像头,每个所述辅摄像头对应至少一个第二拍摄区域,各所述辅摄像头的第二拍摄区域的并集区域大于所述第一拍摄区域且包含所述第一拍摄区域。由处理器30对前置拍摄部件34进行控制。一个实施例中,所述辅摄像头为变焦摄像头,每个所述辅摄像头分别对应两个第二拍摄区域,其中一个第二拍摄区域为近景区域,另一个第二拍摄区域为远景区域,两个所述第二拍摄区域间存在交集区域。一个实施例中,所述前置拍摄部件可移动的设置在所述终端设备中。一个实施例中,终端设备还可以包括通信装置(图未示),可用于与其他设备进行数据通信。
117.上述终端设备包含前述实施例提供的目标物拍摄装置,可用于执行任意实施例提供的目标物拍摄方法,具备相应的功能和有益效果。
118.此外,本技术实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行本技术任意实施例所提供的目标物拍摄方法中的相关操作,且具备相应的功能和有益效果。
119.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。
120.因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置
的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
121.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
122.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
123.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
124.注意,上述仅为本技术的较佳实施例及所运用技术原理。本领域技术人员会理解,本技术不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本技术的保护范围。因此,虽然通过以上实施例对本技术进行了较为详细的说明,但是本技术不仅仅限于以上实施例,在不脱离本技术构思的情况下,还可以包括更多其他等效实施例,而本技术的范围由所附的权利要求范围决定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献