[基于概率的归纳推理模型]概率归纳推理

  摘要:归纳推理是指从个别前提推出一般结论的推理,它是人的一项基本认知能力,也是心理学研究需要解释的重要现象。在模拟归纳推理时,不能排除先验知识对归纳推理结论力度的影响,贝叶斯理论可以结合条件对先验概率进行修正,能够很好地将先验知识引入到归纳推理中来。文章重点介绍了基于记忆的贝叶斯模型,相似性概率模型和结构统计模型对归纳推理的解释。
  关键词:归纳推理;贝叶斯理论;概率模型;结构统计模型
  中图分类号:B842.5文献标识码:A文章编号:1003-5184(2012)06-0508-06
  1引言
  归纳推理是指从个别性前提推出一般性结论的推理。归纳推理的结论不是确定正确的,具有或然性。归纳推理是日常生活中的一项基本认知能力,也是心理学研究需要解释的重要部分。涉及归纳推理的主题有很多,例如类比推理、归类、判断和决策、因果推理等,文章主要介绍对属性归纳(property induction)的模拟。个体观察少数客体具有某一属性,推论多数或全体客体也具有此属性的过程,就是属性归纳的过程。
  可见,属性归纳研究的基本形式是:Pi,…,Pn→C(属性)。其中Pi是第i个前提,C是结论,属性指的是推理中使用的特征属性(Sakamoto et al.,2007;Kemp & Tenenbaum,2009)。
  第32卷第6期邢强等基于概率的归纳推理模型心理学探新2012年在属性归纳研究中,所使用的属性一般都是空白属性(blank property)。当使用动物进行归纳推理时,空白属性是人们都没有听说过的生物性属性,例如,“具有酶X132”(Kemp & Tenenbaum,2009)。属性影响论证的力度,主要体现在两个方面:第一,归纳背景(inductive context)不变而使用不同的属性进行推理可以改变论证力度。例如,由兔子向老虎归纳,属性有24条染色体就比属性多于20条染色体的力度弱。因为有24条染色体的可能性要小于多于20条染色体。第二,改变属性通常会改变归纳背景。例如,将属性具有籽骨从羚羊推论到狮子的力度要弱于属性巴贝斯焦虫病,因为巴贝斯焦虫病听起来像疟疾之类的传染病。研究者也提出,当前提和结论的类别改变时,相同的属性会激活不同的归纳背景。Rosch(1978)认为即使没有背景的时候人们也会假设一个默认的背景。也就是说虽然使用的是空白属性,但它们仍然会激活一些默认的背景知识。由此可见,归纳推理离不开背景知识。
  Marr(1982)指出理解信息加工过程的三个水平,分别是计算理论(computational theory)、表征和算法(representation and algorithm)与硬件实现(hardware implementation)。计算模拟方法处于第二层次,是认知心理学研究的一个重要手段。贝叶斯概率是一个条件概率,它计算的是在一个事件已经发生的条件下,另一个与之相关的事件也发生的条件概率。它模拟归纳推理时就是将前提看做证据,来修正对结论概率的看法。贝叶斯方法在模拟归纳推理中知识的作用时具有一定的优越性。贝叶斯概率从引入归纳推理到现在,已经发展了几个方法来模拟先验知识的作用,文章将对之做一介绍和评价。
  2基于记忆的贝叶斯模型
  2.1模型的基本形式
  为了能够将知识结合到归纳推理中来,Heit(1998)使用贝叶斯分析来模拟归纳推理。此模型基于3个假设。第一,评定归纳论证的力度就是评定属性的范围,属性的范围指的是哪些类别具有属性而哪些类别不具有属性。第二,在学习新的属性时,人们会有一系列关于属性的范围的假设。人们假定新属性像已知属性一样已经分布好了。第三,归纳论证中的前提可以被看做证据,它们被用来加强或者减弱对属性的假设。归纳的目标就是要对属性的范围做一个良好的估计,这个目标可以通过使用贝叶斯理论对假设做修正来实现。
  对于使用贝叶斯推理来模拟归纳推理,Heit考虑了两个问题:先验是如何产生的?先验的精确值是否重要?对于先验产生的问题,Heit认为先验的产生主要是基于记忆的,在归纳论证时,先验由大脑中的已知属性决定。对新特征的先验信念可能是通过某些基于已知属性的可得启发式方法来获得。在推理动物的新属性时,人们会从记忆中提取熟悉动物的属性。因此,Heit的模型被称作基于记忆的归纳推理。Heit认为先验的值不一定要非常精确。
  2.2贝叶斯模型对归纳现象的解释
  贝叶斯模型可以解释很多现象。在解释相似性效应时,相似的动物更有可能具有属性是因为新属性被认为与熟悉属性有相同的分布。例如,属性从牛泛化到羊的可能性较大,因为许多已知属性对两个类别来说都是共享的。而属性从牛泛化到老鼠的可能性就小一些,因为先验知识表明这两种动物有较少的共同属性。在解释典型性时,此模型认为关于典型类别的先验信念可能表明它和其他类别共享许多属性,因此典型类别的新属性能更好地泛化到其它类别。
  2.3基于记忆的贝叶斯模型的评价
  贝叶斯解释具有很大的灵活性,它不仅能解释对基于相似性效应的预测,也能解释相似性不促进归纳的现象。这个简单的模型还为各种现象之间提供了一个连接。人们不愿意将德国短毛猎犬的属性投射到其它狗身上,因为他们有德国短毛猎犬在其它方面很特殊的先验信念。贝叶斯模型遇到的一个主要批评就是它过度依赖于先验信念分布的假设。Heit虽然将贝叶斯模型引入到归纳推理,但是他没有为先验的产生提出一个合适的方法。而且贝叶斯模型只是一种计算模型,只说明了输入和输出的正确函数关系,没有说明归纳推理在心理上的算法实现过程。此外,由于基于记忆的贝叶斯模型实质上是基于特征分布相似性的,没有考虑特征之间联系强度知识对归纳推理的影响,所以它不能预测关联强度效应(尹静,王墨耘,2009)。
  3相似性覆盖模型及相似性概率模型   3.1相似性覆盖模型
  由于这个模型将相似性和覆盖有效的结合起来,所以它能够很好地解释归纳推理现象,特别是将多个前提的信息整合起来。虽然这个模型包含了类别和相似性的信息,能够模拟对空白属性的推理,但是它不能够扩展到非空白属性和熟悉属性的预测,也就是不能解释背景知识效应。
  3.2相似性概率模型基本原理
  针对相似性覆盖模型受到的批评,为了能够解释先验知识的影响,Blok等(2007)提出相似性概率模型(SimProb model)。这个模型将相似性评定与先验概率结合起来。模型的目标就是要预测结论的条件概率,在给出前提的情况下,结论的条件概率可以通过一个代数函数计算出来(Weber,in press)。拿单前提的论证来说,狐狸具有夜视能力推出狼具有夜视能力的可能性是多大。为了预测结论的条件概率,给出前提,只需要知道“狐狸具有夜视能力和狼具有夜视能力”的先验概率,以及狐狸和狼的相似性就可以预测结论的条件概率。
  3.3两种相似性表征知识模型的比较
  SCM有一些优点,它可以对一般的生物属性进行准确的预测,它使用一个带最小自由参数的简单等式来预测许多不同的判断。但SCM模型也有局限,首先,它只使用成对相似性的形式来表示领域知识,因此当归纳的背景知识不能以这种形式来表示的时候,SCM就不能解释了。其次,SCM缺乏数学基础,它的预测的准确性取决于模型数学形式的武断选择(Tenenbaum et al.,2007)。SimProb模型是相似性覆盖模型的改进,这两个模型都能很好地解释归纳推理的部分现象,并且SimProb模型还将先验知识对推理的影响计算在内。此模型不用计算任何自由参数,只需要被试的先验概率和相似性评定。因此,这个模型的优点之一就是形式和检验的简单化。另外一个优点是这个模型很容易将理论扩展到解决反向的和混合的证据。但是它也有局限,首先,它还是使用相似性来解释推理。使用相似性来解释归纳推理的力度很久以前就受到了质疑。相似性怎样代表关联性呢?任何物体都可以是相似的,这取决于比较的维度。其次,这个模型没有提供先验概率来源的解释,它的先验只是一些条件性的。再次,这个模型并没有解释推理的过程,它的结果只是与推理过程的输出相似。
  4结构统计模型
  4.1模型的基本原理
  归纳推理的结构统计模型(structured statistical models of inductive reasoning)使用贝叶斯公式作为核心的推理过程,并且使用一个专门的框架来模拟先验知识的获得。先验的获得主要取决于两种背景知识:一种是关于领域内类别之间关系的知识,另一种是这些关系是如何决定属性分配的知识。类别之间的关系是使用结构S来获得的,例如,树形结构可以获得类别之间的分类关系,多维空间能获得临近关系,曲线图可以获得指向关系等。关于属性是如何分布在这些结构上的知识通过定义在这个结构上的随机过程T来获得。扩散过程(Diffusion process)获取了属性是平滑的分布在潜在结构上的设想。漂移过程(Drift process)获取了在潜在结构一端的类别比另一端更可能具有某属性。传递过程(Transmission process)获取了疾病可能是从食物网的下层向上层传播的思想。通过将结构和随机过程结合起来,可以获得不同的知识,从而在各种知识背景下解释归纳推理。将这个框架得出的先验概率的值代入贝叶斯公式,就可以得出给定前提条件下的后验概率。
  4.2用模型模拟实际的推理
  不同的背景知识需要使用不同的结构来表征,结构统计模型将表征知识的结构和决定属性分配的随机过程相结合模拟了四种推理:归类推理(taxonomic reasoning),空间推理(spatial reasoning),阈限推理(threshold reasoning)和因果推理(casual reasoning)。
  4.2.1归类推理
  此模型在模拟默认生物背景时,使用的是归类推理,它由树形结构(tree structure)和扩散过程组成的。使用树形结构主要是因为生物知识都是通过树形结构表征的,物种处在不同的枝杈上,树上距离近的物种具有相似属性的可能性更大。即使是在树上距离较远的物种也可以共享一个属性,因此,属性应该是平滑的分布在树枝上,这种分布使用漂移过程来实现。
  空间推理模型适合对某些隐含维度的生物属性进行推理,如重量或者大小。归类模型仅对生物知识的模拟效果较好,而空间模型仅能较好地模拟空间知识。这表明不同的归纳背景需要不同的先验分布,恰当的结构先验能使贝叶斯结构框架对依赖于背景的人类推理作出解释。
  归类模型和空间模型虽然使用了不同的结构,但是它们都可以看成是对相似性的表征。两个模型所使用的漂移过程也是与基于相似性的途径相一致的,因为它假定结构中距离近的类别具有相似的属性。虽然基于相似性的推理在心理学研究中是一个热点,但是有些归纳推理使用相似性很难解释。
  4.2.3阈限推理
  在给出信息之前,维度上具有较高数值的类别更有可能具有新的属性。当观察到类别具有某个属性时,阈限发生转变。阈限模型仅对从高向低推理时有距离效应。从低到高推理时有一个反距离效应:随着前提和结论距离的增加,论证的强度增加。漂移过程没有像扩散过程一样导致对单前提论证的对称性预测。
  4.2.4因果推理
  Shafto等(2008)使用基于理论的贝叶斯推理模拟了因果传递属性的归纳推理。结构获取的是一组生物之间捕食关系的知识,这种知识被表示为食物网或者指向图形。随机过程表示的是疾病是如何在食物网上传播的知识,传递过程获取了疾病是从食物网的下层向上层传播的思想,处在食物网上层的生物更有可能得病,被捕食者更有可能将疾病传播给捕食者。
  传递过程有两个参数。b表示背景比率(background rate),t表示传播概率(transmission probability)。第一个参数获取的是生物从食物网外部感染疾病的知识。对于食物网上任何物种,以偏差b投硬币来决定物种是否因为外部原因产生疾病。第二个参数获取疾病能从被捕食者传递向捕食者的知识。对图形上的每条边,以偏差t投硬币来决定这条边是否被激活。模型规定,与生病动物相联系的那条边被激活的动物一定得病。   这个模型满足了两个直觉理论。第一,在食物网上相联系的物种比没有直接联系的物种更有可能共享某个属性。第二,属性覆盖是不对称的,捕食的动物有更多的几率共享被捕食动物的属性,反之则不然。
  4.3对结构统计模型的评价
  概率推理的贝叶斯结构为理解人类归纳问题提供了一个综合的方法(Griffiths et al.,2008)。Kemp所提出的不仅仅是一个单一的归纳推理模型,而是一个模型结构,这个结构可以用来构建许多特殊的模型。通过不同的组合可以获得各种基础的知识,在某些情况下,使用结构来计算会很简单(Kemp et al.,2010)。结构统计模型结合了两类研究者的观点。一类是基于理论的途径,这类研究者认为归纳推理通常都是源自直觉理论或者是丰富而系统的概念知识,在归纳推理时不同的属性会激活不同的直觉理论,这类研究者很少尝试将直觉理论形式化,所以不能精确地解释这些理论是如何应用于归纳推理的。另一类是基于相似性或者说基于统计的途径。他们总是给出一个正式的模型,但是对知识作用的解释有很大的局限性。结构统计模型结合了这两种传统研究者的优点。由于结构统计模型所使用的贝叶斯推理是一个一般领域的推理,也受到和Heit的贝叶斯模型相同的批评,即过度依赖于先验。但在模拟归纳推理时,对先验知识的敏感却成为一个明显的优点(Kemp & Tenenbaum,2009)。虽然结构和随机过程的组合可以产生各种知识,但人类可以根据少量的观察产生许多结构,而结构又会决定不同的关系,由于背景知识的复杂性,结构统计模型产生先验知识的结构可能不能获取最合适的知识。为了获得背景知识,需要发展一个比图形结构表征和贝叶斯神经网络更加丰富和抽象的表征方法(Griffiths & Tenenbaum,2009)。
  5总结及展望
  在归纳推理研究中,已经发展了许多模型来对归纳现象进行解释。在这些模型中,概率模型有其独特的优势,那就是它可以将先验知识的影响纳入到模型当中来。不同的概率模型使用不同的方法把先验知识引入模型,如相似性概率模型是以相似性评定的形式,而结构统计模型则是使用不同的结构来产生先验概率。对于归纳推理,已经发展出了足够多的模型来解释各种现象。使用框架对归纳现象进行解释,是一个新颖的方法,它可以对不同背景下的归纳推理进行解释。但模拟心理的最终模型应该是一个单独的模型,这个单独的模型可以表征各种知识,在不同的背景下结合各种归纳偏差来成功学习。实现这种单独模型的方法就是找到一种语言可以表征所有的知识结构,谓词逻辑有可能实现这种方法(Kemp & Tenenbaum,2009)。
  建立模型的最终目标是模拟人类的行为。验证模型好坏的方法就是将模型模拟的数据与人类实验的数据相比较。已有的归纳推理模型能够很好地与人类实验的数据相匹配,但这些模型模拟的都是机能,只是在推理过程的输出上与人类推理接近,还没有模型能够模拟归纳推理的内部机制,即推理的过程。在后面的研究中,应该对归纳推理的内部机制进行研究,从而揭示人类归纳推理的本质。