8.5 基于案例的推理
k-近邻算法和局部加权回归都是基于实例的方法,它们具有三个共同的关键特性。第 1,
它们是消极学习方法,都把在训练数据上的泛化推迟至遇到一个新的查询实例时。第 2,它
们通过分析相似的实例来分类新的查询实例,而忽略与查询极其不同的实例。第 3,它们把
实例表示为 n维欧氏空间中的实数点。基于案例的推理(Case-based reasoning,CBR)这种
学习范型基于前两个原则,但不包括第 3个。在 CBR中,一般使用更丰富的符号描述来表
示实例;相应地,用来检索实例的方法也更加复杂。CBR已被应用于解决很多问题,比如,
根据数据库中存储的以前的设计图纸,来进行机械设备的总体设计(Sycara et al. 1992);根
据以前的裁决来对新的法律案件进行推理(Ashley 1990);通过对以前的相似问题的解决方
案的复用或合并,来解决规划和调度问题(Veloso 1992)。
作为以后讨论的基础,让我们考虑基于案例的推理系统的一个例子。CADET 系统
(Sycara et al. 1992)采用基于案例的推理来辅助简单机械设备(例如水龙头)的总体设计。
它使用一个数据库,其中包含大约 75个以前的设计或设计片断,来推荐符合新的设计规格
的总体设计。内存中每一个实例是通过它的结构和定性的功能来表示的。相应的,新的设计
问题是通过所要求的功能和结构来表示的。图 8-3画出了这个问题。图的上半部分显示了一
个典型的存储案例,被称为 T 型接头管。它的功能被表示为输入和输出点的流量和温度间
的定性关系。在右侧的功能描述中,标有“+”的箭头表明箭头头部的变量随着箭头尾部的
变量上升。例如,输出流量 Q3随着输入流量 Q1增长。类似地,“-”标记表明箭头头部的变
量随着箭头尾部的变量下降。这幅图的下半部分画出了一个新的设计问题,它通过新设计中
所要求的功能来描述。这个功能描绘了一种水龙头的行为特征。这里 Qc指进入龙头的冷水
流量,Qh指热水的输入流量,Qm指流出龙头的单一混合流量。类似地,Tc、Th和 Tm分别指
1