技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于人工智能的旅游服务信息推送方法及系统  >  正文

一种基于人工智能的旅游服务信息推送方法及系统

  • 国知局
  • 2024-08-05 12:05:22

本发明涉及人工智能领域,尤其涉及一种基于人工智能的旅游服务信息推送方法及系统。

背景技术:

1、旅游业是全球范围内一个蓬勃发展的行业,每年都吸引着数以亿计的游客前往各地探索和体验。随着互联网技术的普及和发展,旅游服务已经逐渐从传统的线下预订向线上转移,用户可以通过网络平台获取各种旅游信息,包括目的地介绍、交通路线、酒店预订、景点门票等。然而,随着信息量的急剧增加,用户往往面临着信息过载的困扰,如何从海量的旅游信息中找到符合自己需求的内容成为了一大挑战。传统的旅游服务通常是基于用户的搜索关键词或浏览历史进行推送,但这种方法往往忽视了用户的个性化需求和实时变化的偏好。同时,由于旅游服务涉及的信息种类繁多,如文字、图片、视频等,传统方法往往难以综合利用这些信息进行精准推送。因此,如何利用先进的人工智能技术对旅游服务进行个性化推送成为了当前亟待解决的问题。

2、经检索,中国专利号cn115935076a公开了基于人工智能的旅游服务信息推送方法及系统,该发明虽然提高了在线语音数据的识别准确率,进而提高了对目标老年游客的旅游服务需求分析的准确率,提高了旅游服务信息推送和派单的准确率,但是无法为用户提供更加丰富多样的推送内容,降低用户对旅游目的地的理解和期待,且用户对目的地信息的了解门槛较高;而且现有的旅游服务信息推送方法及系统无法发现用户可能感兴趣但尚未探索的内容,旅游体验单一,降低用户对旅游服务的信任和依赖;此外,现有的旅游服务信息推送方法及系统推荐的准确度和质量低下,对用户行为的理解和反馈能力较差,无法满足用户的个性化需求;为此,我们提出一种基于人工智能的旅游服务信息推送方法及系统。

技术实现思路

1、本发明的目的是为了解决现有技术中存在的缺陷,而提出的一种基于人工智能的旅游服务信息推送方法及系统。

2、为了实现上述目的,本发明采用了如下技术方案:

3、一种基于人工智能的旅游服务信息推送方法,该推送方法具体步骤如下:

4、s1、采集处理旅游信息并识别理解景点图像;

5、s2、建立用户画像并将采集到旅游信息进行关联组织;

6、s3、根据用户画像以及关联结果对用户进行个性化推荐;

7、s4、对各类数据进行多级数据缓存并实时更新系统数据;

8、s5、收集用户反馈和评价并对用户反馈进行情感分析;

9、s6、通过加密技术和权限管理机制对各环节数据进行加密;

10、s7、持续收集用户反馈和市场变化以实时更新系统功能。

11、作为本发明的进一步方案,s1所述旅游信息采集处理具体步骤如下:

12、步骤一:旅游服务信息推送系统确定需要采集数据的来源以及需要采集的具体旅游信息,通过python编程语言编写爬虫程序,再利用爬虫框架或库模拟浏览器行为,向目标网站发起http请求,获取网页内容;

13、步骤二:使用html解析器处理网页标签,并通过xpath或css选择器定位目标数据,对检测出的目标数据进行爬取,再将从不同数据源收集到的旅游信息整合为旅游数据集,并将其中的重复信息进行筛除,将剩余数据按照不同数据格式进行分类;

14、步骤三:使用html解析器检测各类数据中的html标签和特殊字符,并根据检测结果,将数据中的html标签和特殊字符替换为空格或删除,再利用pandas数据处理库检测数据集中的缺失值,并使用插值法填充缺失值;

15、步骤四:初始化isolation forest模型,并将处理后的旅游数据集输入到isolation forest模型中,调用isolation forest模型的fit方法构建多棵决策树,对数据集进行划分,并识别异常值所在的区域,同时模型学习旅游数据集的特征和分布;

16、步骤五:使用拟合好的模型对旅游数据集中的每个样本进行异常得分计算,输出异常得分,将异常得分与预先设置的阈值进行比较,并将超过阈值的样本作为异常值,之后删除异常值所在的行或列,并重新检测是否清理完全;

17、步骤六:计算旅游数据集均值以及标准差,基于计算出的均值以及标准差,对于数据集中的每组数据,进行z-score标准化处理,以消除不同特征之间的量纲差异。

18、作为本发明的进一步方案,步骤五中异常得分具体计算公式如下:

19、

20、

21、式中,s(x,t)代表样本x的异常得分;t代表isolation forest模型;h(x)代表样本x在树中的路径长度的平均值;e(h(x))代表平均路径长度;c(n)代表树的平均路径长度的期望值;h(n-1)代表调和数;

22、步骤六中所述z-score标准化处理具体计算公式如下:

23、

24、

25、

26、式中,μ代表均值;σ代表标准差;xi代表第i个样本的特征值;n代表样本数量;z代表标准化后的值。

27、作为本发明的进一步方案,s1所述景点图像识别理解具体步骤如下:

28、步骤1:从处理后的旅游数据集中收集景点图像数据,若有与图像数据对应的标签信息,则将各标签信息与该图像数据关联,之后使用opencv图像处理库对各组图像数据进行尺寸调整和裁剪;

29、步骤2:确定cnn网络层级结构和参数设置,对图像数据集进行归一化处理,并按照4:1的比例划分为训练集与验证集,将训练集输入到cnn网络中;

30、步骤3:cnn网络逐层传递训练集中的图像数据,并获取输出层输出结果,将模型的输出与标签进行比较,计算损失函数,之后链式法则,通过反向传播算法计算损失函数对网络参数的梯度,并对各组梯度信息进行裁剪后,使用adam优化器更新网络参数;

31、步骤4:当一轮训练周期结束后,将验证集中的图片数据输入到训练好的cnn网络中,并根据模型输出与标签的比较计算性能指标,当模型性能不再提升,或开始恶化时,提前终止训练,否则,继续训练模型,直至达到预设迭代次数,根据验证集的性能指标调整网络结构和参数;

32、步骤5:使用已经训练好的cnn网络提取景点图像的特征向量,再使用特征向量之间的余弦相似度或欧氏距离计算图片之间的相似度,对于每对图片特征向量,根据相似度指标进行排序,找出与当前图片最相似的图片,根据匹配结果,找出不同相机拍摄的同一景点图片;

33、步骤6:基于cnn网络识别出的景点图片内容和跨相机匹配结果,获取各景点图像的一组综合景点识别结果,若cnn网络识别的景点名称与跨相机匹配的结果一致,则直接采用该景点识别结果,若两者结果不一致,则选择采用置信度更高的景点识别结果;

34、步骤7:使用自然语言处理技术对每组景点识别结果,进行分析和理解,提取景点各关键信息,并可视化展示提取出的景点信息。

35、作为本发明的进一步方案,步骤3中所述损失函数具体计算公式如下:

36、

37、式中,y代表真实标签;代表模型预测的标签;n代表样本数量。

38、作为本发明的进一步方案,s2所述用户画像建立具体步骤如下:

39、步骤ⅰ:通过api或网络爬虫方式收集用户在社交媒体、搜索引擎和旅游应用中的行为数据和偏好数据,将收集到的数据进行整合和清洗,建立用户行为数据库;

40、步骤ⅱ:分析用户在社交媒体上的操作行为,分析用户的兴趣爱好和社交圈子,分析用户在搜索引擎上的搜索关键词以及浏览历史,了解用户的需求和偏好,分析用户在旅游应用上的浏览记录、收藏夹以及预订记录,获取用户的旅游偏好和行为习惯;

41、步骤ⅲ:综合用户在社交媒体、搜索引擎和旅游应用中的行为特征和偏好特征,建立用户画像,根据预先设定的聚类数量,从各用户画像中随机选择k组数据点作为初始聚类中心;

42、步骤ⅳ:对于每组用户画像,计算其与每个聚类中心之间的欧氏距离,并根据计算出的欧式距离,将各用户画像分别分配到距离最近的聚类中心所代表的类别中,形成初始的聚类结果,对于每组聚类,计算其包含的用户画像的均值作为新的聚类中心的位置;

43、步骤ⅴ:重复进行聚类以及更新聚类中心位置,在每次迭代中,根据当前的聚类结果更新聚类中心,并重新分配数据点到最近的聚类中心,直至聚类中心不再发生变化或达到预定的迭代次数后停止,以完成对各组用户画像的分类。

44、作为本发明的进一步方案,步骤ⅳ中所述欧氏距离具体计算公式如下:

45、

46、式中,x和y分别代表两个数据点;n代表数据点的维度;

47、步骤ⅳ中所述聚类中心具体计算公式如下:

48、

49、式中,μi代表第j个聚类的新中心sj;代表属于第j个聚类的所有数据点的集合。

50、作为本发明的进一步方案,s2所述旅游信息关联组织具体步骤如下:

51、步骤①:从处理后的各组旅游信息中提取景点信息、地理位置信息以及用户评论,根据旅游信息的特点,定义旅游图谱的实体以及它们之间的关系;

52、步骤②:将提取到的旅游信息组织成旅游图谱的节点和边,节点表示实体,边表示实体之间的关系,将构建好的旅游图谱存储到neo4j图数据库中,并设计查询接口,支持对旅游图谱的查询操作,同时定期收集新的旅游信息并对知识图片进行更新。

53、一种基于人工智能的旅游服务信息推送系统,包括采集处理模块、用户分析模块、景点信息管理模块、识别分析模块、个性化推荐模块、交互反馈模块、位置服务模块、数据缓存模块、系统数据更新模块、推送通知模块以及隐私保护模块;

54、所述采集处理模块用于从多个来源采集并预处理各旅游数据;

55、所述用户分析模块用于分析用户在社交媒体、搜索引擎和旅游应用中的行为和偏好,建立用户画像;

56、所述景点信息管理模块用于构建旅游图谱将景点信息进行关联和组织,为用户提供全面的景点信息服务;

57、所述识别分析模块用于对景点图片和用户评论等内容进行分析和理解;

58、所述个性化推荐模块用于为用户推荐个性化的旅游服务信息;

59、所述交互反馈模块用于与用户进行交互,并收集用户的反馈信息,根据用户的需求和反馈进行调整优化;

60、所述位置服务模块用于为用户提供基于地理位置的定制化服务;

61、所述数据缓存模块用于通过多级数据缓存策略存储热门的旅游信息和用户数据;

62、所述系统数据更新模块用于持续监测各种数据源的变化,并实时更新系统数据;

63、所述推送通知模块用于向用户推送实时信息和个性化通知;

64、所述隐私保护模块用于通过加密技术和权限管理机制对各环境数据进行安全保护。

65、作为本发明的进一步方案,所述个性化推荐模块旅游服务信息推荐具体步骤如下:

66、第一步:个性化推荐模块收集用户画像以及旅游图谱,将用户画像中记录的用户信息映射为搜索空间中的启发信息,将旅游图谱中的节点和边映射为搜索空间中的节点和边;

67、第二步:初始化每只蚂蚁的起始节点,并设置蚂蚁的初始状态,再将每只蚂蚁放置在搜索空间中的随机节点上,每只蚂蚁根据信息素浓度和启发信息,计算每个相邻节点的选择概率;

68、第三步:根据计算出的各节点选择概率选择下一个节点后,更新蚂蚁的当前节点,并将该节点标记为已访问,当蚂蚁经过路径后,根据路径上的信息素浓度更新信息素,同时调整信息素挥发率,控制信息素的挥发速度,重复进行节点选择与信息素更新,直至达到预先设定的最大迭代次数后停止;

69、第四步:记录每只蚂蚁的搜索路径和路径上的信息素浓度,对收集到的搜索结果进行分析,并通过各路径上的信息素浓度来衡量每条路径的优劣,再根据用户画像和知识图谱,评估每条路径的质量,筛选出与用户兴趣相关的路径;

70、第五步:根据筛选的结果,将搜索结果中符合用户兴趣的路径或解作为推荐结果,通过界面展示或推送通知向用户推荐感兴趣的景点或旅游路线,收集用户对推荐结果的反馈信息,并根据用户反馈,对推荐结果进行进一步调整和优化。

71、作为本发明的进一步方案,第二步中所述选择概率具体计算公式如下:

72、

73、式中,代表蚂蚁k在节点i选择下一个节点j的概率;τij代表路径i到j的信息素的浓度;ηij代表启发信息,α和β分贝代表信息素浓度和启发信息的权重;allowed代表蚂蚁k可以选择的节点集合;

74、第三步中所述信息素具体更新公式如下:

75、

76、式中,ρ代表信息素的挥发系数;代表第k只蚂蚁在路径i到j上释放的信息素增量。

77、作为本发明的进一步方案,所述数据缓存模块多级数据缓存具体步骤如下:

78、第1步:数据缓存模块通过统计分析或实时监测,收集旅游信息和用户数据的访问频率和热度,根据访问频率和热度评估数据的热度,检测出各组数据中的热门数据并标记;

79、第2步:分析系统中的数据访问模式,根据数据的访问频率和重要性,划分出多个级别的缓存,同时每个级别的缓存用于缓存不同频率和重要性的数据,并根据系统的内存资源、性能要求、数据访问模式和需求,确定每个级别缓存的大小;

80、第3步:通过数据库触发器、消息队列以及发布订阅系统建立数据更新监听机制,监听旅游信息和用户数据的更新事件,当监听到数据源中发生更新事件时,捕获并记录该事件;

81、第4步:提取更新事件中更新的数据id、类型以及更新的内容,之后根据更新事件中的信息,确定需要更新的缓存数据,通过直接替换原有缓存数据或进行增量更新更新缓存中的数据,并向其他系统发送更新通知。

82、作为本发明的进一步方案,所述系统数据更新模块实时更新具体步骤如下:

83、第①步:系统数据更新模块实时监测各组数据源,并根据系统需求和数据结构确定dfs搜索的起始节点,将起始节点的访问状态初始化为“未访问”,之后从起始节点开始遍历所有节点,将它们的访问状态初始化为“未访问”,并构建一组栈结构的数据库存储各组节点;

84、第②步:将起始节点放入待访问节点的栈中,且将其压入栈顶,并标记起始节点为已访问,再从栈中弹出一个节点作为当前节点,检查其访问状态;

85、第③步:若节点未被访问过,则访问当前节点,检查其对应的数据源是否发生变化,并标记为已访问,遍历当前节点的未访问相邻节点,再将其压入栈中,若节点已被访问,则跳过该节点,继续遍历下一个节点;

86、第④:若数据源发生变化,则更新系统数据,并标记节点为已更新,若数据源未发生变化,则不进行任何操作,继续深度优先搜索,同时在每次遍历节点时,检测栈是否为空,若栈为空,则搜索结束,若存在未访问的节点,则继续深度优先搜索,直至所有节点均访问完毕后,终止搜索。

87、相比于现有技术,本发明的有益效果在于:

88、1、本发明从处理后的旅游数据集中收集景点图像数据,若有与图像数据对应的标签信息,则将各标签信息与该图像数据关联,之后使用opencv图像处理库对各组图像数据进行尺寸调整和裁剪,确定cnn网络层级结构和参数设置,对图像数据集进行归一化处理,并按照4:1的比例划分为训练集与验证集,使用训练集与验证集对cnn网络进行训练验证,之后使用已经训练好的cnn网络提取景点图像的特征向量,再使用特征向量之间的余弦相似度或欧氏距离计算图片之间的相似度,对于每对图片特征向量,根据相似度指标进行排序,找出与当前图片最相似的图片,根据匹配结果,找出不同相机拍摄的同一景点图片,基于cnn网络识别出的景点图片内容和跨相机匹配结果,获取各景点图像的一组综合景点识别结果,若cnn网络识别的景点名称与跨相机匹配的结果一致,则直接采用该景点识别结果,若两者结果不一致,则选择采用置信度更高的景点识别结果,使用自然语言处理技术对每组景点识别结果,进行分析和理解,提取景点各关键信息,并可视化展示提取出的景点信息,能够为用户提供更加丰富多样的推送内容,提升用户对旅游目的地的理解和期待,增强旅游体验,降低用户对目的地信息的了解门槛。

89、2、该基于人工智能的旅游服务信息推送方法通过建立用户行为数据库,分析用户在社交媒体、搜索引擎以及旅游应用上的各类信息,综合用户在社交媒体、搜索引擎和旅游应用中的行为特征和偏好特征,建立用户画像,根据预先设定的聚类数量,从各用户画像中随机选择k组数据点作为初始聚类中心,对于每组用户画像,计算其与每个聚类中心之间的欧氏距离,并根据计算出的欧式距离,将各用户画像分别分配到距离最近的聚类中心所代表的类别中,形成初始的聚类结果,对于每组聚类,计算其包含的用户画像的均值作为新的聚类中心的位置,重复进行聚类以及更新聚类中心位置,在每次迭代中,根据当前的聚类结果更新聚类中心,并重新分配数据点到最近的聚类中心,直至聚类中心不再发生变化或达到预定的迭代次数后停止,以完成对各组用户画像的分类,能够发现用户可能感兴趣但尚未探索的内容,丰富用户的旅游体验,增强用户对旅游服务的信任和依赖,提高营销效果和用户转化率,为旅游服务商带来更多的商业价值。

90、3、该基于人工智能的旅游服务信息推送系统通过个性化推荐模块收集用户画像以及旅游图谱,以构建搜索空间,初始化每只蚂蚁的起始节点以及初始状态,再将每只蚂蚁放置在搜索空间中的随机节点上,每只蚂蚁根据信息素浓度和启发信息,计算每个相邻节点的选择概率,以选择下一个节点,同时更新蚂蚁的当前节点,并将该节点标记为已访问,当蚂蚁经过路径后,根据路径上的信息素浓度更新信息素,同时调整信息素挥发率,控制信息素的挥发速度,重复进行节点选择与信息素更新,直至达到预先设定的最大迭代次数后停止,记录每只蚂蚁的搜索路径和路径上的信息素浓度,对收集到的搜索结果进行分析,并通过各路径上的信息素浓度来衡量每条路径的优劣,再根据用户画像和知识图谱,评估每条路径的质量,筛选出与用户兴趣相关的路径,根据筛选的结果,将搜索结果中符合用户兴趣的路径或解作为推荐结果,通过界面展示或推送通知向用户推荐感兴趣的景点或旅游路线,收集用户对推荐结果的反馈信息,并根据用户反馈,对推荐结果进行进一步调整和优化,能够使提供的个性化推荐更贴近用户当前状态,提高推荐的准确度和质量,增强系统对用户行为的理解和反馈能力,减少推荐的盲目性,更好地满足用户的个性化需求。

本文地址:https://www.jishuxx.com/zhuanli/20240802/261033.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。