一种基于文本的最小化信息单元的知识系统建构方法与流程

2022-02-19 02:52:00 来源：中国专利 TAG：

1.本发明涉及数字化图书技术领域，特别涉及一种基于文本的最小化信息单元的知识系统建构方法。

背景技术：

2.目前，面对互联网时代的海量的信息内容以及图书文本，如何将其转化为可以快速学习的数字化知识，业界并没有借助现代科技提出高效的知识管理办法。
3.与此同时，不断增加的数字出版物，和日益被挤占的阅读时间的矛盾日趋尖锐，急待一个阅读转化为数字化知识的创新方法和工具。
4.在通过阅读进行学习的场景中，用户阅读文本，往往是按照文本的行文逻辑以及排版方式顺序浏览，即所谓线性阅读方式。用户做的笔记也是以文本的原有顺序进行记录和总结。但是，这并不符合眼球跳跃式搜索那些能引起大脑兴奋的事物的习惯。为此，一个旨在提高学习效率的离散式点状记录的学习方法更适应新时代的需要。

技术实现要素：

5.本发明提供一种基于文本的最小化信息单元的知识系统建构方法，用以解决现有时常缺乏高效的知识管理的方法的情况。
6.一种基于文本的最小化信息单元的知识系统建构方法，包括：
7.基于全栈全文搜索技术对文本进行关键词排序，并将排序后的关键词通过文本源审核规则进行审核，确定文本词条库；
8.根据所述文本词条库，判断词条之间的关联性，并基于所述关联性，建立词条节点网络；
9.根据所述词条节点网络，建立多文本网络，并生成网状知识系统。
10.在本发明的一种实施例中：所述基于全栈全文搜索技术对文本进行关键词排序，包括：
11.获取目标文本，并通过所述全栈全文搜索技术，确定目标文本的关键词；
12.根据所述关键词，确定对应的关键词段落；
13.根据所述关键词段落，确定段落内的关键词条；
14.根据所述关键词条，确定关键词排序。
15.在本发明的一种实施例中：所述将排序后的关键词通过文本源审核规则进行审核，确定文本词条库，包括：
16.获取排序后的关键词，并确定对应的关键词条；
17.根据所述关键词条，确定每个关键词条的关键定义，并确定关键定义；
18.基于预设的审核编辑规则，对所述关键定义进行审核，确定每个关键定义对应的原始文本；
19.获取所述原始文本的出版时间，并进行出版排序；
20.根据所述出版排序，建立文本词条库。
21.在本发明的一种实施例中：所述将排序后的关键词通过文本源审核规则进行审核，确定文本词条库，还包括：
22.获取用户搜索目标文本的请求信息，并反馈请求结果；
23.根据所述请求结果，获取目标文本的文本内容；
24.根据所述文本内容，接收用户的编辑需求；
25.根据所述编辑需求，向用户授权编辑权限；
26.根据所述编辑权限，接收用户向目标文本添加的用户词条，并将所述用户词条添加至文本词条库。
27.在本发明的一种实施例中：所述根据所述文本词条库，判断词条之间的关联性，包括：
28.根据所述文本词条库，确定每个文本对应的词条子集合；
29.根据所述词条子集合，获取词条子集合内每个词条的关键定义；
30.根据所述关键定义，基于相关性计算，判断所述词条子集合内不同词条的关联性；
31.根据所述不同词条的关联性，确定不同文本的关联性；
32.根据所述不同文本的关联性，确定所述文本词条库中不同词条之间的关联性。
33.在本发明的一种实施例中：所述并基于所述关联性，建立词条节点网络，包括：
34.根据所述关联性，判断所述文本词条库内不同词条之间定义距离；
35.根据所述定义距离，分别对所述文本词条库中的不同词条进行连接，确定连接关系；
36.根据所述连接关系，构建词条节点网络；其中，
37.所述词条节点网络包括：单一文本词条节点网络和多文本词条节点网络。
38.在本发明的一种实施例中：所述并基于所述关联性，建立词条节点网络，还包括：
39.根据所述文本词条库，确定由多个文本的词条构建的词条母群；
40.判断所述词条母群中是否存在不同文本关联的相同词条；其中，
41.当所述不同文本存在相同词条时，删除所述相同词条；
42.当所述不同文本不存在相同词条时，根据所述词条母群，生成词条云。
43.在本发明的一种实施例中：所述并基于所述关联性，建立词条节点网络，还包括：
44.根据所述关联性，判断不同词条之间的相关关系；其中，
45.所述相关关系包括：双向强相关、单向强相关，双向弱相关和单向弱相关。
46.在本发明的一种实施例中：所述并基于所述关联性，建立词条节点网络，还包括：
47.根据所述文本词条库，分别基于预设的审核规则对词条进行审核；其中，
48.所述审核规则包括：客观定义审核和学术价值审核；
49.获取审核后的审核结果，并根据所述审核结果和关联性，判断词条间的合法性。
50.在本发明的一种实施例中：所述根据所述词条节点网络，建立多文本网络，并生成网状知识系统，包括：
51.根据所述词条节点网络，建立词条和文本之间调用关系；
52.根据所述调用关系，建立词条和文本之间的关系图谱和目录图谱，并设置词条间的个性化非常规连接关系；
53.根据所述关系图谱、目录图谱和个性化非常规连接关系，确定多文本网络；
54.通过所述多文本网络，建立不同文本的网状知识系统。
55.本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
56.下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。
附图说明
57.附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。
58.在附图中：
59.图1为本发明实施例中一种基于文本的最小化信息单元的知识系统建构方法的方法流程图；
60.图2为本发明实施例中网状知识关联图；
61.图3为本发明实施例中不同词条关联的星云图；
62.图4为本发明全栈全文搜索技术对文本进行关键词排序的步骤图；
63.图5为本发明建立词条文本库的步骤图
64.图6为本发明的图书搜索的界面图。
具体实施方式
65.以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。
66.本发明时针对目前信息泛滥的现状而针对性研发的一种解决方案，因为文本语言的多性化融合的同质化，高效提炼文本的核心内容，通过简化文本为知识最小单元，并连接成集合，通过整合不同文本间的相同类似词条，将所有词条连成一个统一网络。知识互联，从而建立知识系统。
67.名词定义：
68.词条：词条也叫词目、条目、辞条，是辞书学用语，指词典编辑所收集的辞目、词语及其释文。词条可以是字、词，也可以由字、词等组成。
69.词条母群：由多个不同书籍的词条组成的词条集合就叫词条母群。
70.词条云：又多个不同书籍的词条组成的词条集合，并且没有重复词条。
71.关键词：特指单个媒体在制作使用索引时，所用到的词汇。是图书馆学中的词汇。关键词搜索是网络搜索索引主要方法之一，就是访问者希望了解的产品、服务和公司等的具体名称用语。
72.文本词条库：多个文本的词条组合形成的数据库。
73.全文检索技术：就是以数据诸如文字，声音，图像等为主要内容，以检索文献资料的内容而不是外表特征的一种检索技术，主要全文检索系统有trs系统、天宇系统等。
74.最小信息单元：最小信息单元就是词条，每一个词条表示一个最小信息单元。
75.如附图1所示，本发明是一种基于文本的最小化信息单元的知识系统建构方法，包
括：
76.基于全栈全文搜索技术对文本进行关键词排序，并将排序后的关键词通过文本源审核规则进行审核，确定文本词条库；
77.根据所述文本词条库，判断词条之间的关联性，并基于所述关联性，建立词条节点网络；
78.根据所述词条节点网络，建立多文本网络，并生成网状知识系统。
79.上述技术方案的原理在于：本发明是通过将文本(包括图书、期刊、文献和其它文本来读物，当然发明也涉及视频、声音和图片等技术领域，通过图片中的重点元素或者图片上的文字、声音中的重点文字词条和视频中的字幕词条)通过基于关键字的词条进行连接，构成一个便于进行图书快速查询和通过词条阅读可以提高用户阅读速度的辅助性知识系统。本发明的全栈全文搜索技术是通过基于全文检索技术，就是以数据诸如文字，声音，图像等为主要内容，以检索文献资料的内容而不是外表特征的一种检索技术，本发明通过这种方式西安查找具有关键字的段落，然后通过段落实现关键词的顺序排序，也就是阅读的前后顺序排序，最后词条还需要通过文本源审核，也就是对应的原始文本作为词条源进行审核，审核通过了才能作为词条，构成文本的词条数据库。而判断词条之间的关联性，是因为文本会有很多词条，通过这些词条的关联性，能辅助进行快速阅读，这个阅读是基于不同词条之间进行阅读引导，同时，因为相关的关系，也能够实现快速的文本查找。最后本发明通过这些词条的关联性构建词条节点网络，这是通过将同一个文本作为一个词条集合，通过多个文本作为词条母群，实现综合所有的文本，进而实现构成一个以词条为基础、网状关联架构的知识系统。
80.上述技术方案的有益效果在于：本发明用户可以将词条作为搜索关键词，利用一般文本全栈搜索技术，获得目标文本；同时也可以利用目标词条的搜索，找到有关联的词条，从而找到所关联的图书。本发明模仿大脑认知机制，允许用户根据自己的认知建立词条间的连接，由于词条与文本(图书)的连接是严肃理性的，由此，用户也获得了个性化的知识索引。搜索语旬的相关程度向用户进行搜索意图推荐，并且支持多维度、搜索语旬模糊/精确匹配等功能。这种基于词条间跨文本跨领域的关联，为用户个体创造出新知识提供了可能。该知识管理方法对于个体的知识建构具有启发性，创造性。思考是非线性，网状的。符合大脑习惯的重述方式，才能更高效地重新组织信息。根据罗伯特
·
比约克的“必要难度理论”，记忆难度与记忆的时间成正比。记忆难度正式体现在主动重组信息的过程上。现有文本的线性呈现连接方式——遵循语法结构(树状结构)，排列字符串(线性顺序的)，这种以文字为载体的数据呈现方式不适应现代社会的快节奏，高密度的阅读要求。一个非线性的笔记可视化工具能够体现这一理论。帮助用户有效调用笔记，加强记忆，快速搭建基本知识框架。
81.在本发明的一种实施例中：所述基于全栈全文搜索技术对文本进行关键词排序，包括：
82.获取目标文本，并通过所述全栈全文搜索技术，确定目标文本的关键词；
83.根据所述关键词，确定对应的关键词段落；
84.根据所述关键词段落，确定段落内的关键词条；
85.根据所述关键词条，确定关键词排序。
86.上述技术方案的原理和有益效果在于：
87.在一个实际的场景中：如附图4所示，本发明在实际实施的时候，会先通过一个文本，基于全栈全文搜索技术确定目标文本的关键词，也就是说通过一种标记方式将关键词标记出来，然后在确定这个关键词所在的段落，可能关键词存在不同的段落，但是存在相同的关键词。然后在这些段落中，每个关键词都有对应的词条，例如：“就在他职业生涯第二阶段重返国际舞台之前，当时和现在世界上最著名的艺术电影导演让
‑
吕克
·
戈达尔(jean
‑
luc godard)在蒙特利尔的concordia大学即兴创作了一系列14个小时的演讲，作为电影录像历史的一部分。”其内部关键词为职业生涯、国际舞台、导演、著名、创作。在明确关键词之后，我们就能定位到这个段落。然后采集词条，例如：职业生涯第二阶段，艺术电影导演、蒙特利尔的concordia大学即兴创作，14小时演讲。因为词条包含关键词，通过词条就可以实现直接的阅读，所以，通过词条，也能够确定关键词的顺序。图6为本发明在进行搜书时的界面图。
88.首先本发明的全栈全文搜索技术，适用于查找文本关键词的对应段落，然后再段落之间可以通过关键词条实现关键词的排序，这也是一种文本阅读顺序的排序。全栈全文搜索技术具有两方面的作用，不仅可以通过文本确定关键词段落和关键词条，也可以通过关键词条实现图书检索，一种技术存在两方面的应用。
89.在本发明的一种实施例中：所述将排序后的关键词通过文本源审核规则进行审核，确定文本词条库，包括：
90.获取排序后的关键词，并确定对应的关键词条；
91.根据所述关键词条，确定每个关键词条的关键定义，并确定关键定义；
92.基于预设的审核编辑规则，对所述关键定义进行审核，确定每个关键定义对应的原始文本；
93.获取所述原始文本的出版时间，并进行出版排序；
94.根据所述出版排序，建立文本词条库。
95.上述技术方案的原理和有益效果在于：
96.在一个实际的场景中：如图5所示，本发明在进行实施的基础不仅是要对目标文本的关键词进行识别，还需要去根据文本实现词条库的扩充，本发明是预先设置有词条数据库，文本源在确定之后，就能根据文本源的内容确定对应的词条数据库，例如：艺术类，有艺术类数据数据库，计算机类有计算机类数据库。在确定文本数据库之前，每一个关键词都有其必要的关键定义，这个定义例如：电脑，其就有计算机的定义，属于计算机类数据库。预审的审核编辑规则是一种人工加电脑的审核规则，电脑负责对词性进行输出，并确定这个词条属于那本书籍，进而确定这个词条所在书籍，书籍的原始文本在是么时候进行的发售，也就是出版时间，当有多本书的出版时间确定后，出版顺序就确定了。
97.本发明再进行文本词条库的过程中，也就是进行词条获取，词条审核的过程将关键词条和文本相对应，这是一种基于文本源的审核机制，主要是保证词条的正确率；其次，文本词条库也是知识系统的基础，它包含所有文本的词条，便于进行词条间的关联性计算和判定。
98.在本发明的一种实施例中：所述将排序后的关键词通过文本源审核规则进行审核，确定文本词条库，还包括：
99.获取用户搜索目标文本的请求信息，并反馈请求结果；
100.根据所述请求结果，获取目标文本的文本内容；
101.根据所述文本内容，接收用户的编辑需求；
102.根据所述编辑需求，向用户授权编辑权限；
103.根据所述编辑权限，接收用户向目标文本添加的用户词条，并将所述用户词条添加至文本词条库。
104.上述技术方案的原理和有益效果在于：
105.在一个实际的场景中：在本发明的微信小程序或者系统收集到用户以语音或者文字形式的请求，例如“查找水浒传”；然后系统会反馈在反馈界面上就显示对应的书籍。在书籍确定之后，书籍的文本具体的内容会以电子本本的形式出现，如果这个文本上还需要进行编辑，也就是添加一些词条，用户会获得编辑的权限，在具有权限之后直接写出或书籍中的选择某几个词，将其作为词条。
106.本发明的词条不仅仅是基于系统自身的审核机制确定词条，还能够通过用户编辑需求，设置用户独有的个性化词条，这个个性化词条如果相对于系统来说，更好，也会替换系统中的词条。不过再添加词条的时候需要对用户开启词条的编辑权限。关键词条是描述文本内容的重要最小单元。通常，科学论文专著及科普读物中的词条，表现为概念形式。本系统的关键词条也是沿用这一学术习惯，是用户根据目标文本(图书)的实际内容，客观总结出提出的。为保证客观严肃，词条必须来自目标文本(图书)，并引用原文作为定义。
107.在本发明的一种实施例中：所述根据所述文本词条库，判断词条之间的关联性，包括：
108.根据所述文本词条库，确定每个文本对应的词条子集合；
109.根据所述词条子集合，获取词条子集合内每个词条的关键定义；
110.根据所述关键定义，基于相关性计算，判断所述词条子集合内不同词条的关联性；
111.根据所述不同词条的关联性，确定不同文本的关联性；
112.根据所述不同文本的关联性，确定所述文本词条库中不同词条之间的关联性。
113.上述技术方案的原理和有益效果在于：
114.在一个实际的场景中：一个文本词条库，会存在多个文本的词条，每个文本你都有其对应的词条子集合，例如：小说书籍数据库中会存在：三国演义里有其对应的词条子集合，水浒传里有对应的词条子集合。而词条的关联性，主要是能够通过一个词条引出下一个词条，或者两者都属于同一个文本，就表示有关联性，两个词条越接近关联性越强。例如：
115.《噪声》是诺贝尔经济学奖得主、“行为经济学之父”丹尼尔
·
卡尼曼携手决策领域专家奥利维耶
·
西博尼和卡斯
·
桑斯坦共同推出的重磅新作，也是卡尼曼继畅销书《思考，快与慢》之后酝酿10年思考的全球瞩目里程碑式巨作，行为科学领域又一重大发现。几十年来，大家都认为，偏差是导致人类判断出错的关键。但是今天，卡尼曼系统性地指出：噪声，才是影响人类判断的黑洞。《噪声》一书通过系统性研究，通过两个公式揭开了“判断出错”的本质量。
116.上述案例中：奥利维耶
·
西博尼和卡斯
·
桑斯坦两个名字的词条关联性就比较高。
117.本发明在判断词条的关联性的过程中，因为一个文本会存在多个关键词条，而且
词条越多，文本也越精确，本发明通过相关性计算判断的词条间的关联性，在计算过程中，会引入先惯性参数例如：阅读的顺序参数，语义参数和重要性参数等等，当然，不同文明文本之间也有相同的词条，本发明也会通过更高等级的相关性计算，确定不同文本之间的相关性。
118.在一个具体的实施例中，重要性参数通过如下方案确定：
119.步骤1：根据文本，确定每个文本的语义参数：
[0120][0121]
其中，z
i
表示第i个词条的含义特征；δ表示类型系数；w
i
表示第i个词条的顺序参数；ρ
i
表示第i个词条的字数；q
i
表示第i个词条在文本中的权重；表示第i个词条第ε个字的含义特征；e
j
表示第j个文本特征参数；i＝1,2,3，
……
n，n表示词条的总个数；j＝1,2,3，
……
m，m表示文本的总个数；
[0122]
在本发明中是用于根据词条确定词条的语义参数；是用于确定当前文本的具体内容总量，而除以ρ
i
是用于提取当前词条字数和文本总字数的比值；而通过累加确定了在这个文本内每个词条字数和文本总字数的比值的和，确定这个学科文本总体的容量参数；而是用于计算每个词条每个字与文本特征的乘积，通过可以确定每个词条的相对于文本的内容参数；文本的字数参数和内容参数之和设定为学科参数。
[0123]
步骤2：根据所述文本中每个词条的特征，确定词条内容特征：
[0124][0125]
其中，r
·
表示词条的类型系数差值；r表示词条的类型系数；d
i
表示第i个词条的涉及知识在文本中的范围参数；d表示同类词条的涉及知识的范围均值；表示第i个词条属于第j个文本是内容总范围；
[0126]
文本内容特征的计算本发明引入了词条的类型系数差值，通过r
·
(d
i
‑
d
i
)计算出当前类型的词条的涉及内容的范围系数；确定了计算出当前类型的词条的涉及知识的总范围系数；根据范围系数的比值和词条内容的乘积确定词条的当前词条的内容特征，在通过累加计算，确定了词条的内容特征；
[0127]
步骤3：根据所述词条的类型参数和词条内容特征，确定所述词条在所有词条中的重要程度：
[0128][0129]
其中，y表示词条的重要程度。
[0130]
在计算文本的重要程度上，本发明在确定了内容特征和类型参数之后，通过x*h*z
i
计算出每个词条的主要内容的具体内容系数和文本的总内容的比值，确定重要程度。
[0131]
上述技术方案的工作原理为：内容参数的计算是为了判断每个词条的类型属性，在进行查找文本的时候本发明通过词条可以在题库中只查找任何相关的文本。
[0132]
在本发明的一种实施例中：所述并基于所述关联性，建立词条节点网络，包括：
[0133]
根据所述关联性，判断所述文本词条库内不同词条之间定义距离；
[0134]
根据所述定义距离，分别对所述文本词条库中的不同词条进行连接，确定连接关系；
[0135]
根据所述连接关系，构建词条节点网络；其中，
[0136]
所述词条节点网络包括：单一文本词条节点网络和多文本词条节点网络。
[0137]
上述技术方案的原理和有益效果在于：
[0138]
在一个实际的场景中：本发明根据关联性判断不同词条之间定义距离，这个定义距离采用了马氏距离算法、曼哈顿距离或切比雪夫距离等，主要是确定不同词条之间的关联度，而通过相互之间的距离，构建节点网络，如图3所示。
[0139]
本发明建立词条节点网络的过程中，主要是通过不同词条之间的定义距离，也就是从含义上的距离，通过这个距离可以实现词条之间的连接，最终构成词条的节点网络，实现词条的节点网络搭建，最终也可以判断每个词条和其它所有词条之间的关系，从而实现网状知识系统的搭建。在这个过程中，词条节点的分布如图3所示，本系统会预先设定一个(词条)圆点距离分级表。圆点间的距离与其对应词条间的相关性强弱成反比。比如圆点“法国
‑‑
法语”间距离最小，“法国
‑
诗歌”距离其次，“法国
‑
橄榄球”最远。但是，这里说的距离与连接线无关。只是目的是实现词条“星云”的疏密感。
[0140]
在本发明的一种实施例中：所述并基于所述关联性，建立词条节点网络，还包括：
[0141]
根据所述文本词条库，确定由多个文本的词条构建的词条母群；
[0142]
判断所述词条母群中是否存在不同文本关联的相同词条；其中，
[0143]
当所述不同文本存在相同词条时，删除所述相同词条；
[0144]
当所述不同文本不存在相同词条时，根据所述词条母群，生成词条云。
[0145]
上述技术方案的原理和有益效果在于：
[0146]
在一个实际的场景中：词条母群是由多个文本的词条子集合组成，也就是多个书本的词条子集合组成，在这个词条母群中，可能会存在重复的词条，这些词条占用的空间内存，但是其在多个文本都有，因此本发明才会删除这些词条。例如：电工基础和电力电缆设计这个数据中同时都存在斩波电路这个词条，我们就可以只留下一个斩波电路的词条。
[0147]
本发明将不同的多个文本的词条以词条云的方式在云端进行词条的调用，在这个过程中词条会通过新加入的文本实现词条云的扩大，新的文本也随之扩大，所以词条母群是不同文本，实现词条母群的扩大。
[0148]
在本发明的一种实施例中：所述并基于所述关联性，建立词条节点网络，还包括：
[0149]
根据所述关联性，判断不同词条之间的相关关系；其中，
[0150]
所述相关关系包括：双向强相关、单向强相关，双向弱相关和单向弱相关。
[0151]
上述技术方案的原理和有益效果在于：本发明再建立节点网络的过程中，词条关联性的判断包括多种相关关系。a.双向强相关(是指符合大多数人的联想习惯的关联，例如：法国——巴黎)；b.单向强相关(是指因果关系，由a推导出b的单向关系，例如：种子——幼苗)；c.双向弱关联(是指间接的非普遍关联关系，是产生创意性和新知识成为可能)；d.单向弱相关(是指间接的非常规的单向推导关系，是产生创意性和新知识成为可能)。通过上述方式可以实现词条相关性的最终判断，而也可以精确实现相关关系的划分，确定以网状形式连接的词条之间如何进行连接。
[0152]
在本发明的一种实施例中：所述并基于所述关联性，建立词条节点网络，还包括：
[0153]
根据所述文本词条库，分别基于预设的审核规则对词条进行审核；其中，
[0154]
所述审核规则包括：客观定义审核和学术价值审核；
[0155]
获取审核后的审核结果，并根据所述审核结果和关联性，判断词条间的合法性。
[0156]
上述技术方案的原理和有益效果在于：
[0157]
在一个实际的场景中：客观定义审核就是在客观方面词条表达的含义是什么？学术价值审核就是词条在对应的文本书籍中的价值有多高。
[0158]
例如：交流电，客观定义上就是电流，电流方向随时间作周期性变化的电流，在一个周期内的平均电流为零。
[0159]
学术价值，就是这个交流电在书籍内有多少部分提到了，其在应用上有多少个关键知识的部分都会用到交流电，然后计算其在文本中的权重，作为学术价值。
[0160]
本发明还会对词条进行合法性审核，这个审核是基于词条的客观定义和学术价值，从两个方面，这样不仅可以实现词条合法性判断，还可以实现词条的相似性判断，实现对相似词条的合并。
[0161]
在本发明的一种实施例中：所述根据所述词条节点网络，建立多文本网络，并生成网状知识系统，包括：
[0162]
根据所述词条节点网络，建立词条和文本之间调用关系；
[0163]
根据所述调用关系，建立词条和文本之间的关系图谱和目录图谱，并设置词条间的个性化非常规连接关系；
[0164]
根据所述关系图谱、目录图谱和个性化非常规连接关系，确定多文本网络；
[0165]
上述技术方案的原理和有益效果在于：在一个实际的场景中：本发明最终实现的知识存在关系图谱和目录图谱的，在实际实施时，如下附图2所示，：图示区域(graphical zone)：以圆点形态代表词条单元。其大小与索引的图书数量直接关联，词条的关联分别以：a.实线双向箭头代表双向强相关；.实线单向箭头代表单向强相关；c.虚线双向箭头代表双向弱相关；d.虚线单向箭头代表单向弱相关。圆点与连线构成了整个词条群的“星云”形态。文本(图书)被归属于20类科目，并分别以20种中国传统色彩体现(具体分类及色彩名录会设置附录)。圆点的颜色是体现的是所关联的书的类型颜色。搜索词条的呈现方式：搜索结果会以目标词条对应的圆点的放大形态呈现出来，它会自动移动到屏幕中心位置，随之移动的是与之关联的其它词条圆点。系统会以动画效果来呈现上述行为；系统要求它们自动变换坐标位置以达到最佳视觉效果，即图形的自适应功能。
[0166]
面对互联网时代的海量的信息内容以及图书文本，如何将其转化为知识，业界并
没有借助现代科技提出高效的知识管理办法。与此同时，不断增加的数字出版物，和日益被挤占的阅读时间的矛盾日趋尖锐，急待一个阅读转化为知识的创新方法和工具。在通过阅读进行学习的场景中，用户阅读文本，往往是按照文本的行文逻辑以及排版方式顺序浏览，即所谓线性阅读方式。用户做的笔记也是以文本的原有顺序进行记录和总结。但是，这并不符合眼球跳跃式搜索那些能引起大脑兴奋的事物的习惯。为此，本发明的出现，对目前信息泛滥的现状，文本语言的多性化融合的同质化，高效提炼文本的核心内容，通过简化文本为知识最小单元，并连接成集合，通过整合不同文本间的相同类似词条，将所有词条连成一个统一网络。知识互联，从而建立知识系统。本方案基于对眼球观察事物，以及人类大脑认知模式的工作原理。首先，是阅读的视觉特征。我发现，眼球对于熟悉的有充分认知度的词语更能刺激大脑兴奋，由此，捕捉关键词条的跳跃式阅读方式更为高效。其次是大脑的认知特点：大脑的对于概念的非线性连接方式决定了被存储概念的重复调用，产生持久记忆：由此，我认为，被阅读的文本中的词条与大脑内已有的概念之间非线性连接，会被更加有效地记忆。
[0167]
显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于路径扩展的非连续实体识别方法与流程

一种基于文本的最小化信息单元的知识系统建构方法与流程

相关文献

最热文献