一种基于人工智能的短信内容分析方法和系统与流程
- 国知局
- 2024-07-31 23:23:49
本发明涉及数据处理,尤其涉及一种基于人工智能的短信内容分析方法和系统。
背景技术:
1、随着移动通信技术的飞速发展,短信作为人们日常通信的重要工具,其使用量持续增长。短信不仅用于个人之间的沟通交流,还广泛应用于企业营销、服务通知等各个领域。其次,人工智能技术的不断进步为短信内容分析提供了强大的技术支持。通过自然语言处理、机器学习等技术,可以对短信文本进行深度理解,实现自动化、智能化的内容分析。这些技术可以识别短信中的关键词、情感倾向、意图等信息,还可以用于垃圾短信的识别与过滤,通过训练模型识别出包含欺诈、恶意链接等内容的短信,保护用户的信息安全,为后续的决策提供支持。此外,随着大数据时代的到来,短信数据的积累和处理也变得越来越重要。通过对大量短信数据的处理和分析,可以发现用户的行为习惯、消费偏好等信息,为企业制定精准营销策略提供依据。因此,一种基于人工智能的短信内容分析方法和系统应运而生。
2、现有的系统通过将短信内容按照预设的类别进行划分,同时通过文本聚类方法对短信内容中的关键特征信息进行描述,然后根据机器学习算法自动识别关键特征信息并结合预设分类指标自动进行分类和分析,实现了对关键特征信息的实时分析。
3、例如公告号为:cn110633466b的发明专利公告的基于语义分析的短信犯罪识别方法、系统和可读存储介质,包括:以文本概念为维建立文本语义表示空间,同时对输入的各种短信犯罪类型的样本短信数据进行机器学习;根据机器学习的结果得到短信犯罪类型对应的语义特征和黑白样本并研判真实短信数据是否为犯罪短信数据,若判定真实短信数据为犯罪短信数据,则输出研判结果信息。
4、例如公开号为:cn115983248a的专利公开申请的一种基于手机短信的行为分析方法和装置,包括:提取手机短信信息并进行关键词比对、规则比对和短信行为分析,得到对应的短信信息分析结果;将短信信息分析结果进行融合并构建短信分析模型,同时根据构建的短信分析模型输出短信行为分析刻画结果。
5、但本技术在实现本技术实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
6、现有技术中,对于复杂、隐晦和特定领域的语义理解不全面,导致对短信内容的关键词识别不够准确,存在短信内容关键词识别效率低的问题。
技术实现思路
1、本技术实施例通过提供一种基于人工智能的短信内容分析方法和系统,解决了现有技术中短信内容关键词识别效率低的问题,实现了短信内容关键词识别效率的提高。
2、本技术实施例提供了一种基于人工智能的短信内容分析方法,包括以下步骤:s1,对待分析用户提供的初始短信数据进行分析得到短信数据并进行预处理,同时利用正则化表达式对待分析用户提供的短信内容进行二次处理后提取关键信息数据;s2,根据提取的关键信息数据建立关键词比对库,同时根据关键词匹配度指标将预处理后的短信数据与关键词比对库进行对比校验,所述关键词匹配度指标用于衡量待分析用户提供的短信内容中的关键词数据与关键词比对库中关键词数据之间的匹配程度;s3,根据对比校验的结果构建短信分类模型,同时对关键信息数据进行编码后作为训练数据集输入至短信分类模型中以对短信分类模型进行模型优化;s4,结合模型优化的结果对待分析用户提供的短信内容进行事件分析并以图表形式可视化事件分析的过程;所述将预处理后的短信数据与关键词比对库进行对比校验的具体流程为:根据关键词比对库的数据结构设置与预处理后的短信数据相对应的匹配数据结构;根据待分析用户提供的短信内容的预设匹配度条件并结合匹配数据结构设定匹配度阈值,同时结合匹配度条件评估因子进行数据测试并实时监测数据测试的过程;获取实时监测过程中待分析用户提供的短信内容与预设匹配度条件之间的短信内容匹配率和短信内容误报率,同时结合对应的平均值得到关键词匹配度指标,并判断关键词匹配度指标是否等于预设的关键词匹配度指标,若是,则停止数据测试,否则根据对匹配度阈值进行动态调整并重新进行数据测试直至满足预设的关键词匹配度指标。
3、进一步的,所述关键信息数据的具体提取流程为:对待分析用户提供的短信内容进行分词处理并根据待分析用户的预设需求设计正则表达式模式;通过正则匹配度将待分析用户提供的短信内容与关键词数据进行匹配以提取出符合正则表达式模式的关键信息;结合正则匹配度识别关键信息中的实体信息和时间信息以提取关键信息数据。
4、进一步的,所述正则匹配度的具体获取方法为:将提取的关键信息与预设的关键信息进行比对,同时结合关键词数据获取关键匹配项并进行编码,所述关键匹配项包括相似度匹配项和格式匹配项;根据获取的关键匹配项并结合正则表达式模式复杂度获取对应的相似度得分和格式正确性得分;结合相似度得分和格式正确性得分得到正则匹配度,所述正则匹配度通过以下公式进行计算:
5、,
6、式中,m为待分析用户提供的短信内容的编号,,m为待分析用户提供的短信内容的总数量,表示第m个待分析用户提供的短信内容对应的正则匹配度,e为自然常数,表示第m个待分析用户提供的短信内容对应的相似度得分,表示相似度参考得分,表示相似度得分参考偏差,表示第m个待分析用户提供的短信内容对应的格式正确性得分,表示格式正确性参考得分,表示格式正确性得分参考偏差,表示第m个待分析用户提供的短信内容对应的正则表达式模式复杂度,表示正则表达式模式参考复杂度,表示正则表达式模式复杂度参考偏差。
7、进一步的,所述关键词匹配度指标通过如下公式进行计算:
8、,
9、式中,m为待分析用户提供的短信内容的编号,,m为待分析用户提供的短信内容的总数量,j为数据测试次数的编号,,j为数据测试的总次数,表示第m个待分析用户提供的短信内容在第j次数据测试中的关键词匹配度指标,e为自然常数,表示第m个待分析用户提供的短信内容在第j次数据测试中的短信内容误报率,表示短信内容参考误报率,表示短信内容平均误报率,表示第m个待分析用户提供的短信内容在第j次数据测试中的短信内容匹配率,表示短信内容参考匹配率,表示短信内容平均匹配率,表示第m个待分析用户提供的短信内容在第j次数据测试中的匹配度条件评估因子。
10、进一步的,所述短信分类模型的具体构建步骤包括:去除关键信息数据中的停用词并采用预设的编码策略对关键信息数据进行编码,同时将编码的结果转化为二进制形式;从编码后的关键信息数据中提取出优先级信息并结合关联性分类指标构建短信分类模型,所述关联性分类指标用于衡量优先级信息和预设事件之间的关联程度。
11、进一步的,所述对短信分类模型进行模型优化的具体步骤包括:将编码后的关键信息数据作为训练数据集输入至构建的短信分类模型中,同时采用与关键信息数据相同的编码方式对待分析用户提供的短信内容进行编码处理;根据训练数据集和编码处理后待分析用户提供的短信内容并结合优先级信息和预设的模型性能指标对短信分类模型进行优化,同时实时监测并记录短信分类模型在优化过程中的性能表现直至达到预设的模型性能指标。
12、本技术实施例提供了一种基于人工智能的短信内容分析系统,包括:关键信息数据提取模块、对比校验模块、短信分类模型构建与优化模块和事件分析模块;其中,所述关键信息数据提取模块用于对待分析用户提供的初始短信数据进行分析得到短信数据并进行预处理,同时利用正则化表达式对待分析用户提供的短信内容进行二次处理后提取关键信息数据;所述对比校验模块用于根据提取的关键信息数据建立关键词比对库,同时根据关键词匹配度指标将预处理后的短信数据与关键词比对库进行对比校验,所述关键词匹配度指标用于衡量待分析用户提供的短信内容中的关键词数据与关键词比对库中关键词数据之间的匹配程度;所述短信分类模型构建与优化模块用于根据对比校验的结果构建短信分类模型,同时对关键信息数据进行编码后作为训练数据集输入至短信分类模型中以对短信分类模型进行模型优化;所述事件分析模块用于结合模型优化的结果对待分析用户提供的短信内容进行事件分析并以图表形式可视化事件分析的过程;所述将预处理后的短信数据与关键词比对库进行对比校验的具体流程为:根据关键词比对库的数据结构设置与预处理后的短信数据相对应的匹配数据结构;根据待分析用户提供的短信内容的预设匹配度条件并结合匹配数据结构设定匹配度阈值,同时结合匹配度条件评估因子进行数据测试并实时监测数据测试的过程;获取实时监测过程中待分析用户提供的短信内容与预设匹配度条件之间的短信内容匹配率和短信内容误报率,同时结合对应的平均值得到关键词匹配度指标,并判断关键词匹配度指标是否等于预设的关键词匹配度指标,若是,则停止数据测试,否则根据对匹配度阈值进行动态调整并重新进行数据测试直至满足预设的关键词匹配度指标。
13、本技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
14、1、通过对待分析用户提供的初始短信数据进行分析得到短信数据并进行预处理,同时对待分析用户提供的短信内容进行二次处理后提取关键信息数据并建立关键词比对库,然后根据关键词匹配度指标将预处理后的短信数据与关键词比对库进行对比校验,最后根据对比校验的结果构建短信分类模型并进行模型优化,同时对待分析用户提供的短信内容进行事件分析,从而实现了关键信息数据的更准确提取,进而实现了短信内容关键词识别效率的提高,有效解决了现有技术中短信内容关键词识别效率低的问题。
15、2、通过关键词比对库的数据结构设置与预处理后的短信数据相对应的匹配数据结构,然后根据待分析用户提供的短信内容的预设匹配度条件并结合匹配数据结构设定匹配度阈值,同时结合匹配度条件评估因子进行数据测试并实时监测数据测试的过程,最后获取实时监测过程中待分析用户提供的短信内容与预设匹配度条件之间的短信内容匹配率和短信内容误报率,同时结合对应的平均值得到关键词匹配度指标,从而数据测试准确性的提高,进而实现了关键词匹配度指标的更精准获取。
16、3、通过将编码后的关键信息数据作为训练数据集输入至构建的短信分类模型中,同时采用与关键信息数据相同的编码方式对待分析用户提供的短信内容进行编码处理,然后根据训练数据集和编码处理后待分析用户提供的短信内容并结合优先级信息和预设的模型性能指标对短信分类模型进行优化,同时实时监测并记录短信分类模型在优化过程中的性能表现直至达到预设的模型性能指标,从而实现了短信分类模型的更精准优化,进而实现了短信内容分类效果的提高。
本文地址:https://www.jishuxx.com/zhuanli/20240730/197349.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。