计算机研究与发展
JOURNAL OF COMPUTER RESEARCH
AND DEVELOPMENT
1999年 第36卷 第12期 Vol.36 No.12 1999



超文本学习状态空间模型与学习控制
高　尚　常桂然　赵　宏
摘　要　超文本教学材料的路径控制是超文本教育应用中存在的一个重要问题.文中以知识空间理论和一般的关系型超文本数学模型为基础，引入超文本学习状态空间的概念；通过定义学习状态空间的数学模型和学习状态跃迁阈值，实现对状态空间学习路径的控制,避免学生“走弯路”,提高了超文本的教学效果.在这种控制方式下，学生在学习状态内部有充分的自由浏览各个知识点；在学习状态之间学生的浏览则受到合理的控制，从而达到了自由与控制的统一.
关键词　知识空间理论，超文本学习状态空间，超文本数学模型，学习路径，状态跃迁阈值
中图法分类号　TP18
A HYPERTEXT LEARNING STATE SPACE MODEL
AND LEARNING CONTROL
GAO Shang, CHANG Gui-Ran, and ZHAO Hong
（National Engineering Research Center for Computer Software，
Northeastern University，Shenyang 110006）
Abstract　One of the important problems for the hypertext education applications is to control the learning paths in hypertext learning materials. The concept of hypertext learning state space based on knowledge space theory and normal relative hypertext mathematical model is introduced in this paper. The learning paths are controlled in the space by using the mathematical model of learning state space and the learning-state-transition threshold. This helps the students avoid getting lost and improve the teaching effect of hypertext. So, in a learning state, the students have sufficient freedom to browse every knowledge point; but among learning states, students' browsing is under well control. Thus the unity of freedom and control is achieved.
Key words　knowledge space theory，hypertext learning state space，hypertext mathematical model，learning path，state-transition threshold
1　引　　言
　　超文本是一种理想的教学工具，它揭示了概念间的内部联系和复杂的依赖关系.作为教材，超文本的缺点是打破了线性结构，使我们不能再使用浏览线性文本时所采用的策略，而且教师也不能认定学生已经按一定顺序读完了材料.而这种顺序性在传授基础知识时是至关重要的［1］.
　　为了防止用户在超文本材料中“迷失方向”，超文本系统提供了一些导航工具，如回溯（backtracking）、加亮链接（highlighting links）、历史列表（history list）、鱼眼视图（fish-eye views）、书签（bookmarks）和指导教学（guided tours）等.
　　这些工具在超文本导航方面起到了一定的作用.但是，它们不能对学生学习超文本教材的过程（即超文本的学习路径）进行控制，如控制学生掌握了某个知识点的所有预备知识点后，才能访问该知识点.为此，我们在知识空间理论和超文本结构的关系模型基础上，引入了超文本学习状态空间的概念.通过定义状态空间的数学模型和学习状态跃迁阈值，超文本学习状态空间能够实现对学生学习路径的控制，避免学生“走弯路”，提高超文本的教学效果.
2　知识空间理论
　　Dietrich Albert等人提出的知识空间理论［2］提供了一种描述给定知识域结构的方法.其基本思想是对学生的知识描述可表示为一个集合，集合元素是学生所能解决的一组问题.知识状态集受问题之间的必要关系约束.
　　在知识空间中，知识域由一个有限问题集合表示，即学生能或不能解决的问题.每个学生可由一个知识状态描述，即学生所能解决问题的集合.约束知识状态集的必要关系≤是问题集合Q上的拟序（quasi-orders）关系.它可以解释为：如果能够正确解决问题q′，则可推测出能够正确解决问题q,表示为q≤q′.也可以说，解决q是解决q′的前提条件.
　　由于问题间存在必要关系约束，并不是所有的问题子集都是知识状态.由所有的知识状态构成的集合称为知识空间κ.该知识空间包括一个空集和一个全集Q，且对于任何两个知识状态K，K′∈κ，它们的并集也属于κ.
　　超文本的结构与知识空间的结构相类似.超文本节点间的必要关系可以表示为必要链接.这些必要链接构筑了与知识空间类似的结构.
3　超文本结构的关系数学模型
　　参照Dexter参考模型［3］，Albert等人提出了超文本结构的关系数学模型［2］.在Dexter模型中，一个超文本由一组元素和元素间的一组链接组成.一个元素包括一个基本信息单元和基本信息单元中与链接相关的信息（源锚和目标锚）.链接由源锚、目标锚及其所在的元素表示.Albert的超文本结构的数学模型可形式化描述如下：
　　定义1.不可根据链接结构再分且能够独立地表达一定信息的最小单元，叫做超文本的一个基本信息单元.　　
　　定义2.由基本信息单元的所有链接头部信息构成的集合，叫做源锚集.
　　定义3.由基本信息单元的所有链接尾部信息构成的集合，叫做目标锚集.
　　设B，S，D分别表示超文本的基本信息单元集、源锚集和目标锚集.
　　定义4.一个超文本的元素是一个三元组，它由一个基本信息单元及该基本信息单元所涉及的源锚子集、目标锚子集组成.元素集合C={c|c=(b,Sc,Dc)∈(B×2S×2D)}，其中基本信息单元b∈B，源锚子集，目标锚子集
　　定义5.集合称为超文本的链接集.其中，一个链接l=((c,sc),(c′,dc′))连接元素c中的源锚sc和元素c′中的目标锚dc′.
　　定义6.二元组H=(C,L)称为一个超文本.其中C为元素集，L为链接集.
　　为了表达元素间的有向链接关系，文献［2］引入了一个二元关系
　　定义7.对于一个超文本可得到当且仅当l=((c,s),(c′,d))∈L.元素集上的链接关系
4　基于知识空间理论的超文本学习状态空间数学模型
　　一个用于教学的超文本可由特定领域的一组知识点（如超文本学习材料中的节点）及相互关系（如节点间的链接）连接组成.由众多知识点构成的超文本学习空间结构复杂，链接纵横交错，不仅增加了学生的认知开销，还有可能使学生遗漏一些知识点.为了能够控制学生对超文本中知识点的学习路径，我们在知识空间理论和Albert的超文本结构的数学模型基础上，提出了超文本学习状态空间的数学模型.
　　该模型将超文本中的知识点组织为学习状态，这些学习状态通过状态内、外部的链接构成超文本学习状态空间.但是，并不是每一个知识点均代表一个学习状态，有可能是几个知识点构成一个复合知识点，代表一个学习状态.学习状态的确定需要教学专家的帮助.
　　在一个用于教学的超文本中，基本信息单元表达一定的教学信息，又叫做知识点.知识点所涉及的链接其它知识点的信息组成了教学超文本的源锚与目标锚.
　　设B，S，D分别表示超文本的知识点集、源锚集和目标锚集.
　　定义8.一个超文本学习状态是一个三元组.它由一个知识点子集及该知识点子集所涉及的源锚子集、目标锚子集组成.学习状态集合P={p|p=(Bp,Sp,Dp)∈(2B×2S×2D)}，其中，学习状态p的知识点子集源锚子集目标锚子集
　　定义9.一个外部链接lout=((p,sp),(p′,dp′))连接学习状态p中的源锚sp和另一个学习状态p′中的目标锚dp′.
　　定义10.一个内部链接lin=((p,sp),(p,dp))连接学习状态p中的源锚sp和p中的目标锚dp.
　　内部链接将同一学习状态的各个知识点紧密地连接在一起.
　　定义11.由学习状态集合P的所有内部链接和外部链接组成的集合，称为链接集L.
　　链接集表达了知识点间、学习状态间的相互联系.
　　定义12.二元组HS=(P,L)称为一个超文本学习状态空间，如果它满足如下3个条件：
　　(1)有且仅有一个学习状态p0，使即没有射入p0的外部链接lout.
　　(2)状态集合其中的学习状态没有射出的外部链接lout.
　　(3)无回路，即一个学习状态不能成为自身的前提状态，它在学习过程中只能出现一次.
　　定义13.集合称为学习状态空间HS的外部链接集.
　　定义14.集合Lin={lin|lin=((p,sp),(p′,d)),s∈Sp,d∈Dp′,Bp=Bp′}称为学习状态空间HS的内部链接集.
　　性质1.集合L=Lin∪Lout.
　　在一个学习状态空间HS=(P,L)中，二元关系描述学习状态空间的链接关系，关系
　　定义15.二元关系in称为学习状态的内部链接关系，如果该链接l=((p,s),(p′,d))∈Lin.
　　定义16.二元关系out称为学习状态的外部链接关系，如果该链接l=((p,s),(p′,d))∈Lout.
　　定义17.如果对任意p,p′∈P,bk∈Bp以及l=((p,sbk),(p′,d))∈Lout，则将bk称为p关键知识点.
　　在一个学习状态中，只有关键知识点具有指向其它学习状态的外部链接.它们是进入下一个学习状态的“门户”.因此，对关键知识点的访问是学习状态转移的前提条件.
　　定义18.在超文本学习状态空间中，学习状态序列pm,pm+1,…,pi,…,pn称为从pm到pn的学习路径，如果满足如下两个条件：
　　(1)如果则b′∈Bpi,i=m,m+1,…,n;
　　(2)
　　条件(1)保证了具有in关系的知识点都封装在同一个学习状态中.条件(2)保证了学习状态的连续性，即两个相邻的学习状态pi和pi+1之间至少存在一条外部链接lout，使得pi能够通过这个out关系找到pi+1.
　　定义19.从初始状态p0到目标状态pend(pend∈Pend)的学习路径称为超文本学习状态空间的学习路径.
　　定理1.在超文本学习状态空间HS=(P,L)中，总存在一条从初始状态p0到目标状态pend的学习路径.　　
　　根据学习状态空间不包含回路的性质可证明该定理，它保证了学习路径的存在.
　　证明.从状态空间的唯一一个初始状态p0出发，沿着外部链接lout到达状态pi.根据学习状态空间不包含回路的性质可知p0≠pi，如果pi无外部链接指向其它状态，根据状态空间定义(2)，pi为目标状态.如果pi指向其它状态，按照以上推导，最后总能找到一个状态pj∈Pend，它无法进行状态转移，且由p0到pj经过的各个学习状态互不相等.由此，定理得证.
5　学习控制模型
　　如上所述，超文本学习状态空间各个状态间通过外部链接组成了相互关联的一个状态链.而内部链接构成状态内部各个知识点的联系网络.我们认为，这个内部知识点的联系网络表达了一个完整的学习状态，这些知识点互相支持、补充.不同学习状态间的转移依赖关键知识点的外部链接.为了简化问题，我们假设状态之间链接关系R均为必要关系.例如，一个由4个状态｛p0,p1，p2，p3｝组成的有关有限自动机理论的超文本学习状态空间.初始状态p0,目标状态Pend=p3.状态p0(有限自动机的概念)包括独异半群知识点、有限自动机定义知识点、mealy机与moore机知识点和基本概念测试知识点等.假设p0与其它状态相链接的关键知识点是有限自动机定义知识点和基本概念测试知识点.有限自动机定义知识点连向另一个状态p1(有限自动机的分析)中的非确定性FA知识点，基本概念测试知识点连向状态p2(有限自动机的简化)中的最小自动机的定义及性质知识点.如图1所示.

图1　学习状态空间结构图
　　如果不对学习路径进行控制，从p0到p3(有限自动机的综合)的路径有｛p0，p1，p3｝，｛p0，p2，p3｝和｛p0，p1，p2，p3｝.而p3的知识点涉及两个外部链接关系out，分别是l13out=((p1,sp1),(p3,dp3))和l23out=((p2,sp2)，(p3,dp3)).这两个外部链接关系表明学习p3的知识点需要两个前提状态p1和p2.缺少任何一个都将导致p3的学习条件不足.因此路径｛p0，p1，p3｝和｛p0，p2，p3｝不可取.为了使学生在超文本学习空间中的状态跃迁受到控制，我们引入跃迁阈值vtrans的概念.
　　定义20.在超文本学习状态空间HS=(P,L)中，从状态pi跃迁到状态pj，当且仅当且满足状态pj的跃迁阈值vjtrans.
　　可按不同的学习控制方式决定跃迁，例如，①与状态pj有外部链接关系的各状态pi中设置测试知识点，以测试知识点的难易程度作为权值，计算它们的加权平均成绩，如果达到或超过跃迁阈值，则允许跃迁；②pi中关键知识点与重要知识点(由教师确定的涉及重要概念、信息的知识点)的访问数据统计.对学习状态中不同重要程度的知识点赋予不同的点数，根据使用者的访问记录，统计使用者在当前状态中达到的点数，并与跃迁阈值比较；③pj外部链接关系运算结果.方法①基于学习质量进行判断，方法②、③基于学习范围进行判断.本文采用方法③pj外部链接关系的AND运算控制方法.
　　算法1.计算超文本学习状态pi到pj跃迁阈值算法.
　　①计算状态集
　　②如果提示无法跃迁信息，转⑤.否则转③；
　　③计算
　　④如果vjtrans=1,允许跃迁.如果vjtrans=0，提示尚未访问的状态集；
　　⑤返回.
　　在上例所示的学习状态空间中，根据跃迁阈值，从p0跃迁到p2，需要事先访问p1.从p1跃迁到p3，需要事先访问p2.因此，只可能存在一种最为合理的学习路径｛p0，p1，p2，p3｝.通过计算跃迁阈值，可以实现对学习路径的控制.上述模型与算法同样适用于复杂的学习状态空间.
6　结　　论
　　本文将超文本学习空间划分为若干个互相关联的学习状态，每个状态由紧密相连的一组知识点组成.通过计算状态跃迁的阈值，实现了对学习空间中各学习状态的访问控制，从而达到了控制超文本知识点学习路径的目的.为了简化问题，我们认为状态内部各个知识点间的内部链接作用比较紧密，理想地认为它们之间的链接能够提供必要的学习导航.这样，在学习状态内部，使用者有充分的自由浏览各个知识点；在学习状态之间，使用者的浏览受到了合理的控制，从而达到了自由与控制的统一.
　　对于状态复杂的学习空间，合理地定义知识点之间的链接和划分学习状态有助于简化学习路径的控制.其中，学习状态的划分类似于超文本节点的聚类［4，5］，可以利用有向图中节点间的连通关系［4］或自适应聚类算法，如遗传算法和神经元网络［5］.在路径的控制模型研究中，还可以结合有限状态自动机理论，对状态跃迁的条件进行控制.以上想法也是我们下一步的研究方向.
本课题得到国家“九五”攻关项目(项目编号96-743-01-06-08)基金资助.
作者简介：高尚，女，1972年11月生，博士研究生，主要研究领域为远程教育、超文本技术.
　　　　　常桂然，1946年5月生，教授，主要研究领域为计算机网络、多媒体技术和软件工程.
　　　　　赵宏，1954年2月生，博士生导师，主要研究领域为分布式多媒体及其支撑环境.
作者单位：东北大学计算机软件国家工程研究中心　沈阳　110006
参考文献
　1　Andreas D. Learning in the age of information. Http://www.lcc.gatech.edu/~ dieberger/constructivism.ntml
　2　Dietrich A et al. Adaptive and dynamic hypertext tutoring systems based on knowledge space theory. In: Artificial Intelligence in Education: Knowledge and Media in Learning Systems, Amsterdam: IOS Press, 1997
　3　Halasz F et al. The dexter hypertext reference model, Communications of the ACM, 1994, 37(2): 30～39
　4　Botafogo R A et al. Identifying aggregates in hypertext structures. In: ACM Proceedings of the Hyptertext'91 Conference, San Antonio, Texas, USA: ACM Press, 1991. 63～74
　5　Johnson A et al. Adaptive clustering of scientific data. In: Proceedings of the 13th IEEE International Phoenix Conference on Computers and Computers and Communication, Tempe, Arizona: IEEE Press, 1994. 241～247
原稿收到日期：1999-02-03；修改稿收到日期：1999-05-12.
