技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种数据当量分类方法及其应用与流程 > 正文

一种数据当量分类方法及其应用与流程

国知局
2024-08-05 11:52:51

本发明涉及旅游和旅游大数据等领域，具体是指一种数据当量分类方法及其应用。

背景技术：

1、数字时代的旅游业、旅游数据行业和旅游大数据行业分类及分类方法和应用问题，是一个世界性的大数据科学和数据科学难题。联合国《所有经济活动的国际标准产业分类》(isicrer·4)，与中国《国民经济行业分类》(gb/t4754--2017)中均没有单列旅游业。虽然，联合国世界旅游组织、欧盟统计处在(isicrer·4)的基础上，制定了旅游卫星帐户核算框架，中国国家统计局亦颁布了《国家旅游及相关产业统计分类》；加之世界旅游组织140多个成员国家和地区的科学家和科研人员亦经过近50年的不懈努力科研；但是，至今世界各国仍不能及时可持续的量化诠释旅游对gdp、税收、就业、居民可支配收入、元宇宙、商业(产业)模式创新、全球价值链、可持续发展、乡村振兴、数字经济……的贡献，致使世界各国：政府的旅游管理、企业的旅游营销、游客的旅游消费长期处于欠科学、不精准、难满意的状态。

技术实现思路

1、为解决上述技术问题，本发明提供的技术方案为：一种数据当量分类方法，包括以下步骤：

2、(1)定义目标分类方法：是将固定的分类本体元数据集作为根数据集，水平耦合目标分类叶子元数据集；采用多级树型执行过程和列式数据结构模式，应用数据当量方法，将创新生态即未知或未来生态目标分类，从传统生态固定的分类本体中挖掘、分析或学习出来的分类方法；是解决大数据应用分类与传统数据应用分类之间如何转换、集成数据问题的数据当量分类方法；

3、(2)定义目标分类特征属性数据当量乘数元数据集：设x是固定的分类本体根元数据集，则目标分类特征属性数据当量乘数叶子元数据集是x中每个分类元数据映射到[0,1]子集的函数：

4、a＝{<x,μa(x)>|x∈x}，μa(x)＝f(gm/sm)，gm＝μa(x)sm

5、其中，μa(x)是[0,1]中的一些数值的集合，表示固定的分类本体根数据x关于目标分类特征属性数据当量乘数叶子数据集合a的一些可能的分类数据，sm为特定或约定俗成的数值，m表示目标分类数据的m个特征属性分类，称gm为目标分类特征属性数据当量、μ＝μa(x)为目标分类特征属性数据当量乘数：

6、

7、(3)构建数据当量目标分类数据系统detcds：设tcds＝(u,c,v,f)为一个目标分类数据系统，其中u＝{x1,x2,…,xn}表示固定的分类本体根元数据集中n个分类的集合，称作分类本体根元数据集(论域)；

8、c＝{a1,a2,…,am}表示目标分类特征属性数据当量乘数叶子元数据集中m个分类特征属性的集合(定义域)；

9、v表示目标分类叶子元数据集的值域，即v＝{y1,y2,…,yn}表示目标分类叶子元数据集中n个分类元数据的集合；

10、f：u×c→v是一个映射，是把每个分类本体根元数据集的xij映射到一个预先定义的目标分类叶子元数据集yij中；

11、若将目标分类特征属性的数据当量乘数值μt进行集合描述，即：

12、fij(xi)＝{μ1,μ2,…,μt}，其中，μt＝(0,1)或μt∈[0,1]，t＝1,2,…,m

13、则称该数据系统detcds＝(u,μ,c,v,f)为数据当量目标分类数据系统；

14、(4)评价目标分类方法：

15、(4.1)在数据分析语境下，分类是表示数据元素关系的语义元数据，是根据原始数据，经过整个数据生命周期过程，依据目标分类原则、凭借经验、基于固定的分类本体根元数据集定性判别后的选择；

16、模型定义为：

17、yi,j＝{<xi,j,μij>|xi,j∈u}＝μijxi,ji＝j＝1,2,…,n；

18、μij＝f(μt)＝{μ1,μ2,…,μt}，μt＝(0,1),t＝1,2,…,m；

19、其中：y表示目标分类特征属性数据当量乘数叶子元数据集，x表示固定的分类本体根元数据集；μ表示目标分类特征属性的数据当量乘数：依据目标分类原则、凭借经验、基于固定的分类本体根元数据集定性判别后的选择，判别为是则μ＝1；判别为不是则μ＝0；

20、下标i表示固定的分类本体根元数据集、目标分类叶子元数据集、目标分类特征属性的数据当量乘数行标；j表示相应的列标。μt＝(0,1)表示目标分类特征属性的数据当量乘数的定义域；

21、t＝1,2,…,m表示目标分类的m个特征属性分类：其中1表示…，2表示…,m表示…；

22、是践行“数据当量分类范式”的必要条件，表示目标分类叶子元数据集包含在固定的分类本体根元数据集中。

23、(4.2)在数据挖掘语境下，分类是描述和区分数据类或概念模型的过程，模型定义为：

24、yi,j＝{<xi,j,μij>|xi,j∈u}＝μijxi,ji＝j＝1,2,…,n

25、μij＝f(μt)＝{μ1,μ2,…,μt}，μt∈〔0,1〕,t＝1,2,…,m；

26、(4.3)在深度学习语境下，分类是一种重要的数据分析形式，是提取刻画重要数据的模型；

27、(4.3a)在固定的分类总体中抽选部分样本，按μt＝(0,1)时，依据目标分类原则、凭借经验、基于固定的分类本体根元数据集定性判别后选择得到的目标分类特征属性数据当量乘数元数据集，作为训练集，模型定义为：

28、yi,j＝{<xi,j,μij>|xi,j∈u}＝μijxi,ji＝j＝1,2,…,n

29、μij＝f(μt)＝{μ1,μ2,…,μt}，μt＝(0,1),t＝1,2,…,m；

30、(4.3b)将固定的分类总体中抽选训练集样本后剩余部分样本，按μt∈〔0,1〕时，通过数据挖掘得到的目标分类特征属性数据当量乘数元数据集，作为测试集，模型定义为：

31、yi,j＝{<xi,j,μij>|xi,j∈u}＝μijxi,ji＝j＝1,2,…,n

32、μij＝f(μt)＝{μ1,μ2,…,μt}，μt∈〔0,1〕,t＝1,2,…,m；

33、(4.3c)在测试集上测试训练集目标分类特征属性数据当量乘数面对训练集之外的测试集的表现,通过深度学习得到目标分类最优解；

34、(4.4)评价:目标分类方法：

35、(4.4a)定义目标分类损失函数：

36、设y＊是数据分析、数据挖掘、深度学习这三种语境下目标分类特征属性数据当量乘数值的平均值y是数据分析、数据挖掘、深度学习这三种语境下目标分类特征属性数据当量乘数值则目标分类损失函数为：

37、

38、(4.4b)定义目标分类损失函数评价方法：

39、在数据分析、数据挖掘、深度学习这三种语境模式的目标分类损失函数中评价出，损失函数最小：w^＝argminloss(w)的语境模式；

40、(5)选择目标分类方法：

41、根据不同语境模式的目标分类损失函数选择：损失函数最小w^＝argminloss(w)的数据分析语境、数据挖掘语境、深度学习语境模式作为目标分类方法。并定义模型：

42、模型定义为：

43、yi,j＝{<xi,j,μij>|xi,j∈u}＝μijxi,ji＝j＝1,2,…,n

44、μij＝f(μt)＝{μ1,μ2,…,μt}，μt＝(0,1)或μt∈〔0,1〕,t＝1,2,…,m；

45、其中：y表示目标分类特征属性数据当量乘数叶子元数据集，x表示固定的分类本体根元数据集；

46、μ表示目标分类特征属性的数据当量乘数；μt＝(0,1)或μt∈〔0,1〕表示目标分类特征属性的数据当量乘数的定义域；

47、t＝1,2,…,m表示目标分类的m个特征属性分类：其中1表示…，2表示…,m表示…；

48、是践行“数据当量分类范式”的必要条件，表示目标分类叶子元数据集包含在固定的分类本体根元数据集中。

49、本发明还公开了上述方法在旅游业、旅游数据行业和旅游大数据行业中的应用。

50、本发明与现有技术相比的优点在于：本发明通过设计数据当量分类方法以及旅游业、旅游数据行业和旅游大数据行业分类方法和应用，解决世界各国：政府的旅游精细管理、企业的旅游精准营销、游客的满意消费问题。解决大数据应用分类与传统数据应用分类之间如何转换、集成数据问题。解决“跨界、异构、非同质性”事务之间“不确定性、非因果关系”的度量问题。