计算机研究与发展
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
1999年　第36卷　第10期　Vol.36　No.10　1999



适用于Agent非正规模态算子的一种语义解释
胡山立　石纯一
　　摘　要　文中提出了适用于Agent非正规模态算子的一种语义解释.这种解释是基于正规可能世界的，不存在“逻辑全知” 问题和由此带来的副作用等问题.与基于非正规可能世界的传统方法相比，不必增加可能世界的种类，比较自然、合理.文中方法同样适用于多数非正规模态逻辑系统.
　　关键词　Agent,非正规模态算子，语义解释，可能世界
　　中图法分类号　TP18
A SEMANTIC INTERPRETATION FOR AGENT'S
NON-NORMAL MODAL OPERATORS
HU Shan-Li and SHI Chun-Yi
(Department of Computer Science, Fuzhou University, Fuzhou 350002)
(Department of Computer Science and Technology, Tsinghua University, Beijing 100084)
　　Abstract　A semantic interpretation based on normal possible worlds is presented in this paper. It is satisfactory for agent's non-normal modal operators, and there are no logical omniscience problem, side-effect problem, etc. Comparing with the method based on non-normal possible worlds, this method is more natural and reasonable, and no additional non-normal possible worlds are needed. It is also satisfactory for many non-normal modal logic systems.
　　Key words　agent, non-normal modal operator, semantic interpretation, possible world
1　Agent-BDI结构中的信念、目标、意图等不宜是正规模态算子
　　在理性Agent BDI结构的形式化研究中，一般采用正规模态逻辑为工具［1,2］.由于采用K公理和N规则，正规模态逻辑在逻辑蕴涵下是封闭的：给定一个正规模态算子□，命题α，β，如果□α是真的,且|=α→β，那么□β是真的.当□代表Agent的信念时，由于Agent系统是有限系统，知识和推理能力不完备且资源有限，封闭性对Agent是不现实的.特别，逻辑蕴涵的封闭性假设对意图是不合理的［3，4］.例如一个意图拔牙的患者不会意图享受拔牙时的疼痛，尽管他知道拔牙引起疼痛是不可避免的.因此，某些技巧被用于避免这类副作用问题［1,2］，但没有满意的结果.其根本原因在于逻辑全知以及由此带来的副作用等问题是正规模态算子的固有性质.
　　因此，Agent的BDI理论应该采用非正规模态逻辑作为一种形式化工具，信念、意图等都应该是非正规模态算子.当然还应说明信念、意图等作为非正规模态算子能有效地避免逻辑全知问题并能满足对它们的性质要求.
2　非正规模态算子的语义解释
　　正规模态逻辑系统应有K公理和必然化规则N.对一般非正规模态逻辑系统，K也是系统的定理(特别是对于Agent思维状态的形式化，信念、意图等都应有K作为公理或定理)，因此正规模态逻辑系统与非正规模态逻辑系统的区别是有无规则N.设□是非正规模态算子，规则N对应的语义解释是：如果α有效，则□α也有效.说规则N不成立，即要证明存在公式α，α有效但□α非有效.按关于必然性的莱布尼茨式的解释，例如一个模型M=〈W，R，V〉，对任一公式α，α在M上有效，指α在任一w∈W上都真，根据□α的赋值定义，即根据关于必然性的莱布尼茨式的解释，□α在任一w∈W上都真，从而□α有效，达不到我们的目的.也就是说，原有的语义解释已不适用于非正规模态算子.
2.1　非正规模态算子的传统语义解释
　　为了给出非正规模态算子的语义解释，通常引入新种类的可能世界［5］，称为非正规可能世界，原有的适于莱布尼茨式解释的可能世界称为正规可能世界.非正规可能世界一般有以下两种：
　　(1) 对任意公式α，□α在其中均为假；
　　(2) 对任意公式α，□α在其中可真可假，不受α本身真值的影响.
　　在这两种可能世界上，假如我们定义◇α＝df□α可以得到◇α的真值.在第1种非正规可能世界中，◇α均为真，在第2种非正规可能世界中，◇α也可真可假.第1种非正规可能世界称为可能型世界，记为P，第2种非正规可能世界称为任意型世界，记为A.
　　在非正规可能世界w里，□α和◇α的真值仅由所在w本身的性质决定，与w同其他世界的关系以及α在那些世界中的真值无关.这使得w无需可及其他世界，即可及其他世界对非正规可能世界已失去它的逻辑作用(决定α在w中的真值).因此，若正规可能世界的集合仍记为W，那么可及关系R是W×(W∪P∪A)的子集.
　　另一方面，由于非正规可能世界的加入，有效性的取值范围不得不有所改变.例如，非正规模态逻辑系统S2有定理□T，其中T =df(P→P),而S2的解释中又必须有非正规可能世界(因为规则N在S2中不成立)，解决的办法只有限制有效性的取值范围，比如限定在正规可能世界中.这是非正规模态逻辑系统语义解释的一个特点.这一取值范围是全体可能世界的一个子集，记为X.这样，适于解释一些非正规模态逻辑系统的框架可记为三元组〈W∪P∪A，R，X〉，其中W是正规可能世界集，P是可能型世界集，A是任意型世界集，R是满足RW×(W∪P∪A)的任意二元关系，X是W∪P∪A的任意子集.再加上满足公式□α在w上的真值

2.2　传统的语义解释存在的问题
　　上述基于非正规可能世界的语义解释直观上不够合理、自然，是对世界部分的、乃至不一致的认识和刻画.例如，在正规可能世界中一直遵循的组合原则遭到破坏.组合原则用在真值方面是说：公式的真值由其子公式的真值以及相应的复合方式组合而得.□α在正规模态逻辑系统语义解释下仍遵守这一原则，例如□α在w里的真值便是由α在w的可及世界里的真值组合而得的.但在非正规世界中则不然，□α的真值依赖的是所在的非正规世界本身的性质，与公式α的复合方式无关，也与α本身的真值无关.对□α和◇α来说，由于非正规可能世界的存在，组合原则已不存在.
3　一种适用于Agent的基于正规可能世界的语义解释
3.1　非正规模态算子的一种新的语义解释
　　我们给出非正规模态逻辑系统一种基于正规可能世界的语义解释.
　　设Lpm为通常模态命题逻辑系统所用的语言.
　　定义1. F=〈W,Rt,Rf,X〉是一个框架，当且仅当其中W是任一非空集，Rt,Rf是W×W的任意两个子集, 且Rf≠,X是W的任意非空子集.
　　定义2. 设F=〈W,Rt,Rf,X〉是任一框架，V是框架F上对Lpm-公式的一个PM-赋值，当且仅当 V：Form(Lpm)×W→｛1，0｝，且对任意的Lpm-公式α，β，和w∈W，满足
　　〔Vp〕　若α是命题变元，则V(α,w)=1，或V(α,w)=0 二者必居其一,且只居其一.
　　〔V〕

　　〔V→〕

　　〔V□〕

　　根据以上定义和∧，∨，，◇的语法定义，不难得到相应的赋值规则〔V∧〕，〔V∨〕,〔V〕和〔V◇〕.
　　定义3. M=〈W,Rt,Rf,X,V〉是一个模型，当且仅当F=〈W,Rt,Rf,X〉是一个框架，V是F上的一个PM-赋值.
　　定义4. 设M=〈W,Rt,Rf,X,V〉是任意模型，α是任意Lpm-公式.
　　(1) 对任意w∈W,若V(α,w)=1,记为Mwα，称α在w上是真的；
若V(α,w)=0,记为M|≠wα，称α在w上是假的；
　　(2) 若存在w∈X，使得Mwα，称α在M上可满足；
　　(3) 若对任意w∈X，都有Mwα，则称α在模型M上有效，记作Mα.
3.2　新的语义解释的优点和适用性
　　(1) 和基于增加非正规可能世界的传统的语义解释相比，上述语义解释不必增加非正规可能世界，比较自然、合理，显然组合原则仍然成立.
　　(2) 上述语义解释，当Rf =且X=W时，退化为正规模态系统的莱布尼茨式的解释，即在新的语义解释下，正规模态算子可看成是非正规模态算子当Rf=且X=W时的退化情况.
　　(3) 下面将证明，在上述语义解释下公理K成立而规则N不成立，因此，它适用于解释有公理K，没有规则N的系统.由于规则N不成立，从而不存在“逻辑全知”问题和由此带来的副作用等问题.故适用于Agent的理论研究，可作为Agent-BDI结构的形式化工具.
　　下面证明，在上述语义解释下公理K成立而规则N不成立.
　　对w∈W，定义Rt(w)=df｛w′∈W｜Rt ww′｝，Rf(w)=df｛w′∈W｜Rfww′｝，下面区分W中的可能世界为两类：
　　① w∈W,若Rf (w)=，这样的w称为第1类可能世界，并令
Wt=df｛w∈W｜Rf (w)=｝.
　　② w∈W,若Rf(w)≠φ，这样的w称为第2类可能世界，并令Wf=df｛w∈W｜Rf(w)≠｝.
　　显然Wt∪Wf=W.
　　定理1. 规则N(├α├□α)对模型M=〈W,Rt,Rf,X,V〉(其中Rf≠)不有效.
　　证明. 对X=W,由于Rf≠,所以W\-f≠，对任一w∈W\-f，w′,使得 Rf ww′
　　因为　├α，所以V(α，w′)=1 从而V(□α,w)=0 即□α在w为假，所以规则N不有效.为了适用于更多的系统，进一步证明，即使缩小有效性的取值范围为X=Wt，规则N也不成立.为此我们构造模型
　　M=〈W,Rt,Rf,X,V〉,其中W={w1,w2,w3,w4}, Rt={〈w1,w2〉,〈w2,w3〉}, Rf={〈w2,w4〉},从而Wt={w1,w3,w4}, Wf={w2}, 取X=Wt，如图1所示.


图　1
　　图1中，用实线箭头表示Rt，用虚线箭头表示Rf.
　　令V(p,wi)=1,i=1,2,3,4.这样有V(□p,wi)=1,i=1,3,4，而V(□p,w2)=0,从而V(□□p,w1)=0，这样，□p 在X上(即在Wt上)成立，然而V(□□p,w1)=0,故├□□p在X上不成立，这就证明了即使缩小有效性的取值范围为X=Wt，规则N也不成立.
　　定理2. 公理K(□(p→q) →(□p→□q)) 对模型M=〈W,Rt,Rf,X,V〉 (其中Rf≠)有效.
　　证明. 取X=W，即有效性的取值范围为全体可能世界，要证明：对w∈W均有□(p→q)→(□p→□q) 为真.下面分两种情形：
　　① 当w∈Wt时，假设□(p→q) 和□p在w均为真，
由□(p→q)(w)=1 有：对w′∈Rt(w)，（p→q)(w′)=1，
由□p(w)=1 有：对w′∈Rt(w)，p(w′)=1，
从而，对w′∈Rt(w)，q(w′)=1，即□q(w)=1,所以□(p→q)→(□p→□q)为真.
　　② 当w∈Wf时，假设□(p→q) 和□p均在w为真，
由□(p→q)(w)=1有：对w′∈Rf(w)，（p→q)(w′)=0，
由□p(w)=1 有：对w′∈Rf(w)，p(w′)=0，
上面两式矛盾，这说明当w∈Wf时，□(p→q) 和□p不能同时在w为真，即□(p→q)和□p总有一个在w为假，这也就证明了□(p→q)→(□p→□q)在w为真.
　　所以，对任意w∈W，均有□(p→q)→(□p→□q)为真，公理K成立.
4　系统实例
　　上面已给出了非正规模态逻辑系统基于正规可能世界的一种语义解释，并说明了它适用于Agent BDI结构的形式化研究.下面以非正规模态逻辑系统S0.5为例，说明如何通过限制可及关系R和有效性取值范围，使其适用于一般非正规模态逻辑系统.本文未涉及完备性问题.
　　S0.5系统是古典命题逻辑系统P增加公理K，公理T和规则NP的真扩张，S0.5=P+K+T+NP.其中
　　公理K：□(p→q) →(□p→□q)
　　公理T：□p→p
　　规则NP：α是重言式├□α
　　规则NP可以看成是一种弱形式的必然化规则，注意其中α是命题逻辑中的重言式，例如不能是□(p→p).
　　设模型M=〈W,Rt,Rf,X,V〉，其中Rt自反(即w∈W, Rtww)，Rf≠,X=Wt.我们证明，M是一个S0.5模型.即证明公理K，公理T和规则NP在M上均有效.另外规则N不有效.
　　定理3. 模型M=〈W,Rt,Rf,X,V〉，其中Rt自反，Rf≠ ,X=Wt，是一个S0.5-模型.
　　证明. 为简便计，若V(α,w)=1,记为α(w)=1，在明确是在哪个w上时，也可记为α=1. α(w)=0, α=0类似.
　　(1) 公理K对模型M有效
　　在定理2中，取有效性取值范围为X=W时，已经证明了公理K有效，这里是要求对X=Wt证明公理K有效.即我们要证明：
　　对w∈Wt ,均有□(p→q)→(□p→□q) 为真.这实际上是定理2证明中的情况(1)，故公理K对模型M有效.
　　(2) 公理T对模型M有效
　　对任一w∈X ,由□p(w)=1，有：对w′∈Rt(w)：p(w′)=1，由于Rt自反，故w∈Rt(w)，所以p(w)=1，由w∈X的任意性，公理T对模型M有效.另外，从证明中可见，取X=W，公理T也有效.
　　(3) NP规则对模型M有效
　　上节定理1已经证明，只要模型M中，Rf≠，必然化规则N不有效.下面我们证明，靠缩小有效性的取值范围X=Wt，规则NP(而不是规则N)可以对模型M有效.假设：α是重言式├□α不有效，即存在w∈X，使得□α(w)=0，也就是w′∈Rt(w)，使得α（w′）=0，这与α是重言式矛盾，所以NP规则对M有效.
　　定理3证毕.从证明中可以看出，如果不需要NP规则有效，则可取X=W.另外，由于规则N不有效，S0.5是非正规模态逻辑系统.
5　结语
　　本文提出了适用于多数非正规模态逻辑系统的一种语义解释，这种解释是基于正规可能世界的.由于在该解释下，公理K有效而规则N不有效，因此特别适用于Agent的形式化研究.与文献［1］、［2］相比，由于规则N不有效，从而不存在“逻辑全知”问题和由此带来的副作用等问题，与基于非正规可能世界的传统语义解释相比，不必增加可能世界的种类，比较自然、合理，且组合原则仍然成立.
本课题得到国家自然科学基金资助(项目编号69773026，69733020).
作者简介：胡山立，男，1944年2月生，副教授，清华大学访问学者，主要研究方向为人工智能应用基础、多Agent系统.
　　　　　石纯一，男，1935年8月生，教授，博士生导师，主要研究方向为人工智能应用基础.
作者单位：胡山立　福州大学计算机系　福州　350002
　　　　　石纯一　清华大学计算机科学与技术系　北京　100084
参考文献
　1　　Cohen P R, Levesque H J. Intention is choice with commitment. Artificial Intelligence, 1990, 42(3): 213～261
　2　　Rao A S, Georgeff M P. Modeling rational agents within a BDI-architecture. In: Proc KR-91, San Mateo, CA: Morgan Kaufmann Publishers, 1991. 473～484
　3　　Bratman M E. Intentions, Plans and Practical Reason. Cambridge MA: Harvard University Press, 1987
　4　　Konolige K, Pollack M E. A representational theory of intention. In: Proc IJCAI-93, San Mateo, CA: Morgan Kaufmann Publishers, 1993. 390～395
　5　　周北海.模态逻辑导论. 北京：北京大学出版社，1997
　　　(Zhou Beihai. Introduction to Modal Logic(in Chinese). Beijing: Beijing University Press, 1997) 
原稿收到日期：1999-01-13；
修改稿收到日期：1999-06-08.
