一种纯文本检测的方法和装置与流程
- 国知局
- 2024-11-19 09:37:41
本发明涉及计算机,尤其涉及一种纯文本检测的方法和装置。
背景技术:
1、业务系统在很多场景下需要接收用户输入的文本信息,例如,在商品下单页面提供文本输入框,接收用户输入的收货地址,或者在商品查询页面提供文本输入框,接收用户输入的查询条件。除文字内容以外,文本输入框中还能输入表情符号等非文本内容,业务系统难以准确识别接收到的表情符号,因此在获取文本输入框的数据时,通常对表情符号等非文本内容进行拦截,不作进一步处理。
2、在实现本发明的过程中,发明人发现现有技术至少存在如下问题:
3、对表情符号进行拦截的准确率低,无法识别全部表情符号。
技术实现思路
1、有鉴于此,本发明实施例提供一种纯文本检测的方法和装置,能够适用于多种场景,提高纯文本内容的识别准确率。
2、为实现上述目的,根据本发明实施例的第一方面,提供一种纯文本检测的方法,包括:
3、响应于接收到目标字符,确定所述目标字符的字符颜色,根据所述字符颜色得到包括所述目标字符的视图标签;
4、将所述视图标签转换为文本图片;
5、识别所述文本图片是否为纯色,在所述文本图片为纯色的情况下判定所述目标字符为纯文本。
6、可选地,根据所述字符颜色得到包括所述目标字符的视图标签,包括:
7、调用预先设置的生成方法,生成初始视图标签,所述初始视图标签包括标签文本属性、标签文本颜色属性和标签背景颜色属性;
8、将所述标签文本属性设置为所述目标字符;
9、将所述标签文本颜色属性和标签背景颜色属性设置为所述字符颜色;
10、将设置后的初始视图标签作为所述目标字符的视图标签。
11、可选地,识别所述文本图片是否为纯色,包括:
12、确定所述文本图片包括的像素点对应的色彩模式;
13、根据所述色彩模式获取所述像素点对应的色彩模式值;
14、根据所述色彩模式值判断所述文本图片是否为纯色。
15、可选地,根据所述色彩模式获取所述像素点对应的色彩模式值,包括:
16、获取所述文本图片的尺寸信息;
17、获取预先设置的像素格式参数;
18、根据所述尺寸信息和所述像素格式参数,从预设的起始像素点沿预设方向依次遍历所述文本图片包括的像素点,根据所述色彩模式获取所述像素点对应的色彩模式值。
19、可选地,根据所述色彩模式值判断所述文本图片是否为纯色,包括:
20、将所述像素点对应的色彩模式值转换为亮度值;
21、将预设的第一像素点对应的亮度值作为目标亮度值;
22、对所述目标亮度值与其余像素点对应的亮度值进行比较,在所述目标亮度值与其余像素点对应的亮度值均相等的情况下,判定所述文本图片为纯色。
23、可选地,所述色彩模式为红绿蓝色彩模式;根据所述色彩模式值判断所述文本图片是否为纯色,包括:
24、获取预设的第二像素点对应的目标色彩模式值;
25、对所述目标色彩模式值与其余像素点对应的色彩模式值进行比较,在所述目标色彩模式值与其余像素点对应的色彩模式值均相等的情况下,判定所述文本图片为纯色。
26、可选地,在确定所述目标字符的字符颜色之前,所述方法还包括:
27、判断所述目标字符是否为单个字符;
28、在所述目标字符包括多个字符的情况下,对所述多个字符进行拆分,得到包括单个字符的目标字符。
29、根据本发明实施例的第二方面,提供一种纯文本检测的装置,包括:
30、生成模块,用于响应于接收到目标字符,确定所述目标字符的字符颜色,根据所述字符颜色得到包括所述目标字符的视图标签;
31、转换模块,用于将所述视图标签转换为文本图片;
32、识别模块,用于识别所述文本图片是否为纯色,在所述文本图片为纯色的情况下判定所述目标字符为纯文本。
33、可选地,根据所述字符颜色得到包括所述目标字符的视图标签,包括:
34、调用预先设置的生成方法,生成初始视图标签,所述初始视图标签包括标签文本属性、标签文本颜色属性和标签背景颜色属性;
35、将所述标签文本属性设置为所述目标字符;
36、将所述标签文本颜色属性和标签背景颜色属性设置为所述字符颜色;
37、将设置后的初始视图标签作为所述目标字符的视图标签。
38、可选地,识别所述文本图片是否为纯色,包括:
39、确定所述文本图片包括的像素点对应的色彩模式;
40、根据所述色彩模式获取所述像素点对应的色彩模式值;
41、根据所述色彩模式值判断所述文本图片是否为纯色。
42、可选地,根据所述色彩模式获取所述像素点对应的色彩模式值,包括:
43、获取所述文本图片的尺寸信息;
44、获取预先设置的像素格式参数;
45、根据所述尺寸信息和所述像素格式参数,从预设的起始像素点沿预设方向依次遍历所述文本图片包括的像素点,根据所述色彩模式获取所述像素点对应的色彩模式值。
46、可选地,根据所述色彩模式值判断所述文本图片是否为纯色,包括:
47、将所述像素点对应的色彩模式值转换为亮度值;
48、将预设的第一像素点对应的亮度值作为目标亮度值;
49、对所述目标亮度值与其余像素点对应的亮度值进行比较,在所述目标亮度值与其余像素点对应的亮度值均相等的情况下,判定所述文本图片为纯色。
50、可选地,所述色彩模式为红绿蓝色彩模式;根据所述色彩模式值判断所述文本图片是否为纯色,包括:
51、获取预设的第二像素点对应的目标色彩模式值;
52、对所述目标色彩模式值与其余像素点对应的色彩模式值进行比较,在所述目标色彩模式值与其余像素点对应的色彩模式值均相等的情况下,判定所述文本图片为纯色。
53、可选地,所述装置还包括:
54、判定模块,用于判断所述目标字符是否为单个字符;
55、拆分模块,用于在所述目标字符包括多个字符的情况下,对所述多个字符进行拆分,得到包括单个字符的目标字符。
56、根据本发明实施例的第三方面,提供一种电子设备,包括:
57、一个或多个处理器;
58、存储装置,用于存储一个或多个程序,
59、当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现上述任一实施例所述的方法。
60、根据本发明实施例的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
61、上述发明中的一个实施例具有如下优点或有益效果:根据字符颜色得到包括目标字符的视图标签,将视图标签转换为文本图片,在文本图片为纯色的情况下判定目标字符为纯文本,能够提高纯文本检测的准确率和普遍适用性,避免因表情符号经常更新而无法识别;生成初始视图标签,根据目标字符设置标签文本属性,根据字符颜色设置标签文本颜色和标签背景颜色,能够提高目标字符的生成效率,便于后续根据颜色进行纯文本检测;获取文本图片包括的像素点对应的色彩模式值,根据色彩模式值判断文本图片是否为纯色,能够提高纯色判定的准确性,适用于多种场景下的纯色判断;根据像素格式参数和文本图片的尺寸信息获取色彩模式值,能够提高色彩模式值的获取效率和获取准确性;将色彩模式值转换为亮度值,根据亮度值判断文本图片是否为纯色,能够提高纯色判断的效率,简化纯色判断的步骤,节省网络资源;确定目标色彩模式值,将其余像素点的色彩模式值与目标色彩模式值相比较来判断文本图片是否为纯色,能够提高纯色判断的准确性,适用于多种场景下的纯色判断;在目标字段包括多个字符的情况下,对多个字符进行拆分,得到包括单个字符的目标字符,能够保证每次仅对单个字符进行纯文本检测,有效识别非纯文本内容的具体位置。
62、上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
本文地址:https://www.jishuxx.com/zhuanli/20241118/329558.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表