技术新讯 > 电子通信装置的制造及其应用技术 > 基于人工智能的旅游服务信息推送方法及系统与流程  >  正文

基于人工智能的旅游服务信息推送方法及系统与流程

  • 国知局
  • 2024-10-09 16:35:00

本发明涉及人工智能,特别涉及基于人工智能的旅游服务信息推送方法及系统。

背景技术:

1、在当今社会,旅游已经成为人们生活的重要组成部分。随着互联网和人工智能技术的发展,获取旅游服务信息变得更加便捷,各种旅游服务机构通过向用户推送旅游产品信息、宣传视频等服务信息来提高用户的旅游兴趣和体验。同时,自媒体的发展使得视频分享成为旅游服务信息的重要来源。通过其他用户分享的视频信息,观看者可以直观的了解相应的旅游景点的情况,作为自己旅游计划的参考。

2、但是,如何将视频推送给合适的用户,并且保证推送视频具有参考价值,是各个旅游服务机构需要考虑的问题;在用户匹配上,常见的方法是通过构建用户画像的方式来匹配相应的视频内容;但是有些视频的内容经过剪辑、拼接后,很难判断其真实性,降低了视频的参考价值。

技术实现思路

1、本发明使用人工智能模型构建用户的人物画像,并且为其匹配相应的推送信息,对推送信息进行进一步的筛选,将原创信息推送给用户,以解决背景技术中提出的问题。

2、本发明提供的技术方案为:基于人工智能的旅游服务信息推送方法,其特征在于,所述方法包括:

3、收集用户信息,并基于收集到的用户信息构建用户画像;

4、获取待推荐信息,从待推荐信息中提取关键特征,与用户画像进行匹配,将与用户画像匹配的待推荐信息构成原始信息库;

5、筛选原始信息库,将原始信息库分为有效信息集和多个无效信息集,将有效信息集内的待推荐信息,推送到用户终端,并接收反馈;

6、所述待推荐信息包括视频信息、文字信息和音频信息中的一种或者多种,所述有效信息集包括原创视频、原创文字和原创音频中的一种或者多种,所述无效信息集包括非原创视频、非原创文字、非原创音频中的一种或者多种。

7、优选的,所述收集用户信息,并基于收集到的用户信息构建用户画像,包括:

8、通过api调用或爬虫技术收集用户的个人信息、浏览历史数据和购买历史数据;

9、对收集到的个人信息、浏览历史和购买历史数据进行数据清洗和预处理,构成原始用户信息库;

10、从原始用户信息库中提取用户关键特征,构成用户关键特征集;具体为:

11、从浏览历史数据中提取用户浏览的文本数据,使用tf-idf算法提取关键词,以获取用户浏览偏好的关键特征;

12、利用apriori算法,从用户浏览历史数据中分析频繁出现的景点关键词,从而推测用户的旅游景点偏好,以获取用户旅游景点偏好的关键特征;

13、将用户浏览偏好的关键特征和用户旅游景点偏好的关键特征组成用户关键特征集;

14、使用机器学习算法对用户关键特征进行聚类分析,将用户划分为不同用户群体,并为用户构建用户画像;

15、所述个人信息包括姓名、年龄、职业,所述浏览历史数据为用户在旅游网站上的浏览行为,包括浏览时间、旅游地点、浏览时长;所述购买历史为用户在旅游网站上的购买记录,包括旅游套餐信息、预定的机票信息。

16、优选的,还包括构建旅游偏好特征集,具体包括以下步骤:

17、提取浏览时间特征;

18、从浏览历史提取用户的历史浏览时间戳;

19、使用pandas库将浏览时间戳转换为时间格式,提取小时、星期和月份特征,并分别转换为整数,将小时特征作为时间特征;

20、获取多个时间特征的平均时间特征;其中:

21、,其中为浏览次数;

22、提取旅游地点特征;

23、从浏览历史数据中提取用户的旅游地点的文本数据;

24、通过独热编码将旅游地点转换为数值型特征,具体为:

25、通过词袋模型或tf-idf将文本数据转换为数值型特征;

26、提取浏览时长特征:

27、从浏览历史数据中提取浏览时长;

28、将浏览时长转换为分钟单位;

29、检查异常值,并将异常值去除;所述异常值为浏览时长小于0或大于10000分钟;

30、将浏览时间特征、旅游地点特征和平均时间特征组成旅游偏好特征集a。

31、优选的,所述获取待推荐信息,从待推荐信息中提取关键特征,包括:

32、使用爬虫技术从网络中获取其他用户分享的旅游视频信息;

33、从旅游视频中提取视频关键特征,所述视频关键特征包括:视频主题、版权声明、景点、拍摄时间;具体为:

34、通过预训练的yolov3模型循环读取旅游视频的视频帧,检测视频中物体,通过预添加类别名称映射,使yolov3模型输出物体名称;

35、使用ocr技术提取视频中的文字,并将检测到的文字生成文本格式数据;

36、通过关键词算法从文本格式数据中提取景点名称、版权声明、时间关键词;

37、将提取到的关键词构成关键词数据库,并将关键词数据库发送到云端存储。

38、优选的,所述从待推荐信息中提取关键特征,与用户画像进行匹配,将与用户画像匹配的待推荐信息构成原始信息库,包括:

39、使用tf-idf向量化关键词和用户关键特征;

40、通过pandas库计算用户关键特征向量与关键词向量间的相似度,输出相似度分数,并对相似度分数进行升序排列;

41、根据相似度分数排序对视频进行降序排序,选出前个旅游视频,为每个旅游视频提交相似度分数标签,将选出的个旅游视频构成原始信息库。

42、优选的,所述筛选原始信息库,将原始信息库分为有效信息集和无效信息集,包括:

43、从原始信息库中获取旅游视频信息;

44、通过滑动窗口从旅游视频中提取多个视频帧;

45、将视频帧输入到训练好的cnn模型中,通过cnn模型将视频帧与原创视频库中的图像进行比较,识别旅游视频是否是原创视频;

46、将识别为原创视频的旅游视频归类为有效信息集;将非原创视频的旅游视频归类为无效信息集。

47、优选的,所述将视频帧输入到训练好的cnn模型中,通过cnn模型将视频帧与原创视频库中的图像进行比较,识别旅游视频是否是原创视频,包括以下步骤:

48、使用tensorflow或pytorch构建一个cnn模型;所述cnn模型包括多个卷积层、池化层和全连接层;

49、从原创视频库中获取多个原创图像数据;

50、从网络上获取多个对应的非原创视频的图像数据;

51、将原创图像数据进而非原创视频的图像数据构成图像样本集,并将图像样本集分为训练集和验证集;

52、使用训练集训练cnn模型,使用交叉熵损失函数和优化器来最小化cnn模型的损失,cnn模型的输出为图像为原创视频的概率值;

53、设定比较阈值,当|-|≥0,则判断是原创视频;

54、将获取到的多个视频帧输入到训练好的cnn模型内,判断是否是原创视频。

55、优选的,所述将有效信息集内的待推荐信息,推送到用户终端,并接收反馈,包括:

56、将有效信息集内的待推荐信息按照相似度分数降序排列,构成推荐信息序列;

57、设定推荐阈值、推送时间段(,)、推送时间间隔,,表示推送起始时间点,表示推送结束时间点;

58、选择个相似度分数大于的待推荐信息,当推送起始时间大于时,将待推荐信息送给用户,并接收反馈信息,将接收到反馈信息发送到云端存储;其中,其中,,为时间参数,;如果,,则将第个视频信息,返回到有效信息集中,插入推荐信息序列的首位,保证在下次优先推荐。

59、本发明还提供基于人工智能的旅游服务信息推送系统,所述系统用于执行所述的基于人工智能的旅游服务信息推送方法。

60、本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现所述的基于人工智能的旅游服务信息推送方法。

61、本发明的有益效果:

62、1、本发明中,对收集到的个人信息、浏览历史和购买历史数据进行数据清洗和预处理,构成原始用户信息库;从原始信息库中提取旅游视频信息;利用滑动窗口从旅游视频中提取多个视频帧;将视频帧导入到训练好的cnn模型中,利用cnn模型将视频帧与原创视频库中的图像进行比较,识别旅游视频是否为原创视频;将识别为原创的旅游视频划分为有效信息集;将非原创的旅游视频划分为无效信息集,在信息推送时,只筛选有效信息集内的视频数据,保质推送视频的参考价值。

63、2、本发明,将有效信息集内的待推荐信息按照相似度分数降序排列,构成推荐信息序列;以确定优先推送哪些信息;设定推荐阈值、推送时间段(,)、推送时间间隔,,设定合理的推送间隔,避免频繁打扰用户,过于频繁的推送可能会导致用户感到烦恼,从而减少对平台的使用;分析用户过去的浏览数据确定其活跃时间段,这些时段内推送信息,以提高用户的关注度和接受度。

本文地址:https://www.jishuxx.com/zhuanli/20240929/313447.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。