探求真理 發展學術 服務社會
        歡迎訪問深圳市社會科學網 今天是

        深圳市哲學社會科學規劃課題

        《對<孫子兵法>的博弈論分析》課題成果簡介

         日期:2011-07-11   來源:深圳市社會科學院

         

        《對<孫子兵法>的博弈論分析》

        課題成果簡介

           陶一桃

        《孫子兵法》是一部以戰爭為研究對象,包括對策智慧、對策原則、對策類型、對策方法在內的系統而完整的對策及策略全書。從戰爭的特質來看,它必定存在著相互對立的兩方。而從“對策”的產生和功能上來看,它不僅是一個單方的戰略方針和策略的決定問題,同時更是作戰雙方相互制約、相互作用的一種策略選擇問題。因此,《孫子兵法》作為一部對策及策略全書,不僅具有“博弈”的某些基本特征,而且還構成了單方完全信息下的零和動態博弈模型。

        如果從博弈的思維方式出發,《孫子兵法》是以“智”為基礎,以“計”為核心,以“謀”為最高境界(最優化),在“計”與“謀”的應用中來完成單人博弈的最優化過程的。所謂的“計”可以理解為“對策”,它包括了各種不同環境和條件下的“對策”選擇;所謂的“謀”可以理解為一種最優化的境界或狀態。它既是“計”的結果,而又是高于“計”的選擇,是最高的,也是最完美的戰略目標和戰爭境界。然而“計”并非憑空產生的,作為“對策”的計,它不僅僅是客觀條件與環境的產物,具有鮮明的客觀性和針對性,而且還蘊涵著《孫子兵法》中“變”與“奇”的全部真諦。

        (一)“智”與信息不對稱

        博弈中,最重要的信息之一就是關于得益的信息。在許多博弈中,每個博弈方除了對自己的得益情況完全清楚以外,對其他博弈方在各種結果下的相應得益也都完全清楚,如“囚犯的兩難”中的甲、乙雙方。由于甲、乙兩囚犯,即博弈各方所處的地位是相同的,因此每個博弈方對雙方在每種情況下的得益都十分清楚。但是,并不是所有博弈中的各博弈方都如“囚犯兩難”博弈那樣都有關于得益或了解得益所需要的全部信息,最典型的例子就是投標、拍賣活動中所構成的博弈。在博弈論中,通常把博弈中各博弈方都完全了解所有博弈方各種情況下得益的博弈,稱為“具有完全信息的博弈”,而將在博弈中至少存在部分博弈方不完全了解其他博弈方得益情況的博弈,則被稱為“具有不完全信息的博弈”。

        之所以將《孫子兵法》定義為完全信息的博弈模型,是因為在《孫子兵法》中,依據戰爭的規律,憑借對戰爭的經驗和準確的判斷力,已清楚地說明了各種對策下的敵我雙方,或者說各博弈方的得益情況。換句話說,《孫子兵法》告訴我們的是不同得益對策的掌握與使用,而非在博弈中去尋找得益對策出現的機會和可能。

        信息是決策的前提,不僅不同的信息及不同的信息擁有量影響決策的結果,而且信息完全與否及完美與否也影響決策的選擇。尤其在單人博弈的模型中,信息就是決策。因為在一個單人博弈的框架中,信息越多,即對決策的環境了解的越多越充分,決策的正確性就越高(“計”的針對性就越強),得益也就越好(“計”的效果就越好)。因此,信息的數量和準確性,就成了“決策”(計)的關鍵。盡管《孫子兵法》中并沒有信息的字樣,但作為兵法中精髓的“知己知彼,百戰不殆”的含義就是:對自己和他方的信息掌握,是取得戰爭勝利的保障。盡管“知己知彼”并不必然帶來“百戰不殆”的結果,但是不“知己知彼”卻必敗無疑。因此,在任何情況下,信息和對信息的把握是取得戰爭勝利的前提和保障。

        然而,獲取信息是需要支付成本的,在經濟學中人們把這種成本的支付稱為交易費用,它通常是以價值的形態表現出來的。但在《孫子兵法》中,包含準確判斷力和豐富經驗的“智”,就成為獲得信息,從而克服信息不對稱,甚至制造信息不對稱的無形支付——成本。因此我們不妨把兵法中的“多算勝,少算不勝”中的“算”理解為“智”或“智慧判斷”。即多動用智慧以獲取更多的信息,是取得戰爭勝利的保障(“多算勝”)。而信息缺乏或不對稱,從而無法正確地制定、選擇對策,則是戰爭失敗的根本原因(“少算不勝”)。

        《孫子兵法》中不僅用大量的文字談到智慧與信息的獲得和把握及對策的選擇之間的關系,而且同樣以相當的文字闡述了智慧在制造信息不對稱及影像敵人對策選擇的神奇作用。以“智”來制造信息不對稱,可謂“兵者,詭道也”體現,可謂“兵不厭詐”之“詐”的幾乎全部內涵。即制造虛的信息就是“詭道”,而虛假的信息本身,即是“詐”的重要內容。

        孫子云:“兵者,詭道也。故能而示之不能,用而示之不用,近而示之遠,遠而示之近。”即用兵是一種詭詐之術,能打,卻裝作不能打;要打,卻裝作不想打;明明要向近處進攻,卻裝作要打遠處;即將進攻遠處,卻裝作要攻近處。可見,以“智”制造信息錯覺,就是“詭道”。

        《孫子兵法》的《兵勢》篇還從反證的角度論證了“詭道”之妙——信息不對稱中的哲學之美感。“亂生于治,怯生于勇,弱生于強,治亂,數也;勇怯,勢也;強弱,形也。故善動敵者,形之,敵必從之。”這段話是說,向敵人詐示混亂,是由于己方組織編制的嚴整,向敵詐示怯懦,是由于己方具備了勇敢的素質;向敵方詐示弱小,是由于己方已擁有強大兵力。嚴整或者混亂,是由組織編制的好壞所決定的。勇敢或怯懦,是由作戰的態勢的優劣所決定的。強大或弱小是由雙方實力大小的對比所顯現的。所以善于調動敵人,偽裝假象迷惑敵人,敵人便會聽從調動。“敵必從之”,就是使敵人在信息不對稱的情形下,按照我方提供的虛假的或錯誤的信息決策。

        可以說,兵法中以“智”制造信息不對稱的思想,具有一種哲學的思辯之美感,而且與道家的“大成若缺,大盈若沖,大直若屈,大巧若拙,大辨若納”;“曲則全,枉則直,洼則盈,敝則新,少則得,多則惑”等思想有著“神似”之奇妙。所以,《孫子兵法》雖不像《論語》那樣,在兩千多年的歷史進程中成為中國傳統文化乃至意識形態的“藍本”,但是卻蘊含儒(家)、道(家),張揚名(家)、法(家),既閃耀著哲學思辨的火花,滲透著老莊智慧的美感,又展示了兵家機敏從容的境界和中華民族人文睿智的無限的感染力。

        (二)“計”與動態博弈中的“策略”和“行為”

        “計”是智慧的精髓,力量的源泉,也是《孫子兵法》的核心。如果在完全信息的零和博弈的框架中研究《孫子兵法》中的“計”,“計”也就無疑具有了“對策”的含義。完全信息假設意味著孫子在其關于戰爭的分析中,完全了解敵我雙方(各博弈方)在不同條件和情況下的勝與敗(各種情況下的得益)的對策選擇,因此,如何“得益”,即如何取得戰爭的勝利,就是對策(“計”)選擇的目標。

        在博弈論中,把所有博弈方同時或可看作同時選擇策略的博弈,被稱為“靜態博弈”。然而事實上,有些有決策活動構成的博弈中,博弈中的各博弈方策略選擇和行動不僅有先后次序,而且后選擇、后行動的博弈方在自己進行選擇、行動之前,可以看到在他之先選擇、行動的博弈方的選擇和行動。這種博弈通常被稱為“動態博弈”。

        由于動態博弈中各博弈方的行為有先有后,因此,在博弈方之間肯定會存在某種不對稱性。后行為博弈方可根據先行為博弈方的行為作針對性的選擇,而先行為的博弈方卻是在自己的決策選擇時,非但不能看到在他后面行為博弈方的選擇,而且還要顧慮、考慮到后繼行為博弈方的反應。

        《孫子兵法》只是在理論分析上構成了動態博弈,而非現實生活中的動態博弈。之所以這樣說是因為《孫子兵法》是一個典型的單人博弈模型,不存在另一博弈方,因而也就不存在博弈中的次序問題,即不存在同時決策或是先后決策的問題,從而也就無所謂“動態”之說了。然而在《孫子兵法》的對策選擇中又的確有一個敵方(博弈方)的對策選擇,而且我方(博弈方)的對策,又往往表現為對方決策后的結果。因此在理論分析上,《孫子兵法》的確構成了動態博弈模式。

        通常在動態博弈中,一個博弈方的一次行為稱為一個“階段”。如上所述,由于每個博弈方在動態博弈中可能不止一次行動,因此每個博弈方在一個動態博弈中就可能有數個甚至許多個無限個博弈階段,這正如一場戰爭要有許多戰役一樣。由于人們所關心的博弈結果并不是取決于博弈方某一個階段的行為;而是取決于整個博弈過程中的行為,因此對動態博弈分析有意義的是各博弈方在這些動態博弈中決策的全部內容,即各博弈方在每次輪到行為時,針對每種可能的情況如何選擇的完整的行動計劃,這種行動計劃,就是博弈的“策略”。在靜態博弈中,“策略”和“行為”之間是沒有區別的,因為一個“策略”就是一種“行為”。而在動態博弈中,一般“策略”與“行動”之間不再等價或相等了。在三國演義中,諸葛亮給劉備的三個錦蘘,甚至還要加上讓劉備過江招親等全部之和,才能構成諸葛孔明宇周瑜“博弈”采用的策略。從上述分析中我們似乎可以得出這樣的結論:“計”總是具體的,通常會是一事一計,這種對“計”的解釋,也正是在單人博弈中“計”作為“對策”的含義。但是,在動態博弈中,作為“對策”的“計”則表現為博弈全過程中的每一博弈階段中的具體行動。如果說“對策”是具體的,那么“策略”則可以是原則的,在動態博弈中它既包括了許多具體的對策和行動,即是一個完整的計劃體系,同時又通過這些對策和行動來實現自己。因此,本文中所談的“計”既代表單人博弈中的“對策”,又代表動態博弈中的“策略”。作為“策略”的“計”它是“母計”,而作為“對策”的“計”它是“子計”,一個“母計”下會有許多“子計”,“子計”不僅表現為實現“母計”的每一次行動,而且反映并實現著“母計”的目標。即“母權子”。

        《孫子兵法》十三篇作為一部軍事百科,蘊含著許多戰爭策略思想。如“上兵伐謀”、“兵貴勝,而不貴久”、“擇人而任勢”、“避實而擊虛”、“以迂為直”等等。這些戰爭策略都從不同的側面體現著“速”、“奇”、“神”的戰術原則。如果說“速”、“奇”、“神”是貫穿始終的戰術原則,那么作為“母計”的“上兵伐謀”、“兵貴勝,而不貴久”、“擇人而任勢”、“避實而擊虛”、“以迂為直”則是從不同側面體現戰術原則的策略,而為完成策略,實現策略目標的一切具體行動就是“子計”。

        (三)“謀”與單人博弈中的最優化的實現

        如果從戰爭必須要有敵我雙方的角度來看,把《孫子兵法》看作單人博弈似乎有點不合邏輯。但是,就《孫子兵法》一書而言,它是一部敘事而言理,包括戰爭觀、戰略思想、軍事理論和治軍理念在內的,論戰而非實際作戰的教科書。因此,《孫子兵法》說到底是孫子本人作為一個戰略家和軍事家和謀略家,憑借自身高深的人文睿智、在軍事方面的異乎尋常的天分、豐富的戰爭經驗和敏銳的觀察力和判斷力,告訴人們如何在那些已知的和可以預見到的環境與條件下用兵用計,從而達到在“慎戰”中“全勝”的最佳的戰爭境界。所以,在《孫子兵法》十三篇,單人博弈的最優化問題表現為圍繞打勝仗的一系列最佳政策、策略、戰術、途徑、作戰方式和方法的選擇上。

        同時,本文又是在零和博弈的框架中研究《孫子兵法》。將《孫子兵法》看作是零和博弈的理由,基于對戰爭的一般的價值判斷。零和博弈的定義,是從各博弈方策略選擇的結果出發而厘定的。當一方的收益必定是另一方的損失時,各博弈方無論如何決策,最終的社會總得益,即各博弈方得益結果之和為零時,博弈就進入了零和博弈的狀態。而戰爭的結果,尤其是傳統的古老的戰爭形式,正是具備了零和博弈的這種特征。盡管人類在進入文明的漫長歷程中不斷經歷戰爭,盡管戰爭本身有勝利方和戰敗方之分,但從人類文明的角度來看,戰爭畢竟是對人類文明和人的生命的踐踏,從而也是社會資源的損失與浪費。因此,戰敗的不僅僅是戰敗方,而是人類自己。從社會效用和福利的角度來講,戰爭是沒有贏家的,哪怕是正義的戰爭。因為戰爭本身的正義性,并不代表社會財富和福利的正相關性增長。可以說《孫子兵法》中的“慎戰”思想和“不戰而屈人之兵”的境界正是企圖改變或避免零和博弈的一種智慧的策略選擇。

        “上兵伐謀”是《孫子兵法》中所描述的最佳的戰爭狀態,也是一系列戰爭對策選擇中的最好的策略選擇。因此,它具有選擇中的最優化的含義。“上兵伐謀”與其說是一種戰爭策略,不如說是一種戰爭境界,它源于孫子對戰爭的認識和正確的戰爭觀,也是孫子“知武而非好”的軍事文化智慧的體現。

        1、“慎戰”——避免零和博弈的戰爭觀。相對于戰爭,和平是最佳的選擇;相對于好戰,“慎戰”是最佳的選擇;相對于曠日持久之戰,速戰是最佳的選擇。因此,孫子關于“慎戰”、“速戰”的戰爭觀,是在一定條件下(戰爭是無法避免的)的最佳的戰爭觀,它是上兵伐謀的思想背景。孫子清楚地知道,盡管戰爭是不可避免的,但是戰爭會消耗社會資源,所以要“慎戰”,而一旦不得不開戰,也要“速戰”。因此,《孫子兵法》開宗明義:“兵者,國之大事,死生在之地,存亡之道,不可不察也。”同時又看到戰爭對人力、物力、財力的依賴:“凡用兵之法,驅車千駟,革車千乘,帶甲十萬,千里饋糧,則內外之貴,賓客之用,膠漆之材,車甲之奉,日費千金,然后十萬之師舉矣。”要在如此大量動用、消耗社會資源的戰爭中取勝,就要速勝。因為曠日持久的戰爭,會使軍隊疲憊,銳氣受挫,“屈力殫殆”。而“速戰”則可以一方面減少因戰爭多帶來的巨大耗費,又可以解決補給困難的問題。所以不完全了解用兵的弊端,就無法真正理解用兵的益處。為了保證戰爭的勝利,還要具有“因糧于敵”和“勝敵而益強”的智慧。孫子認為,明智的將軍總是務求在敵國解決糧草的供給問題,這既可以解決我方的給養,又可造成敵方的窮盡,還在一定程度上加速了戰爭的進程。優待俘虜兵保障其供給,混合編入自己的戰車行列,就可以愈是戰勝敵人,自己也就愈強大。這就是:“故殺敵者,怒也;取敵之利者,貨也。故車戰,得車十乘以上,賞其先得者,而更其旌旗,車雜而乘之,卒善而養之,是謂勝敵而益墻。故兵貴勝,不貴久。”

        2、“不戰而屈人之兵”——“上兵伐謀”的具體體現。從用兵的策略來講,“上兵伐謀”可謂上策中的上策,即最佳的策略選擇;從戰爭的一般原則來說,“不戰而屈人之兵”可謂高明中的高明,即最佳結果;同時,作為最佳選擇之最佳結果——“不戰而屈人之兵”又充分張顯了孫子“慎戰”的境界。

        通常通往“最佳”的選擇原則是:“兩害相權取其輕,兩利相權取其重”。然而戰爭的“利”、“害”選擇既不是簡單的多寡問題,也不是單純的數量問題,而是戰爭觀和戰爭理念的問題。因此在前面的論述中我曾說,“慎戰”和“速戰”是“上兵伐謀”的思想背景。這個思想背景就是戰爭觀和戰爭的理念。

        孫子說:一般的戰爭指導法則是:使敵人舉國降服為上策,而擊破敵國就略遜一籌;使敵人全軍完整地降服為上策,而擊潰敵人的軍隊就略遜一籌;使敵人全旅完整地降服為上策;,而打垮敵人的旅就略遜一籌;使敵人全卒完整地降服是上策,而用武力打垮它就次一等;使敵人全伍降服是上策,用武力擊潰它就次一等。因此,百戰百勝,并不是高明中高明的;不經交戰而能使敵人屈服,這才是最高明的。可以說,在上述“次優”和“最優”的選擇中,“不戰而屈人之兵”是用兵的最佳選擇和最優狀態。

        孫子把用兵的策略分為四個等級,即最優(上策)、次優(其次)、再次優(再次)和最差(下策)。并指出:“上兵伐謀,其次伐變,其次伐兵,其下攻城。”“故善用兵者,屈人之兵而非戰也,拔人之城而非攻也,毀人之國而非久也,必以全爭于天下,故兵不頓而利可全,此謀攻之法也。”即用兵的上策是用謀略戰勝敵人,其次是挫敗敵人的外交聯盟,再次就是直接與敵人交戰,擊敗敵人的軍隊,下策就是攻打敵人的城池。善于用兵的人使敵人屈服而不是交戰,奪取敵人的城池而不是靠強攻,毀滅敵人的國家而不是靠久戰,一定要用全勝的戰略思想勝于天下。這樣做既不使自己的軍隊疲憊受挫,又是能取得圓滿的全面的勝利。這就是以謀取勝的標準。

        如果說“上兵伐謀”是孫子“慎戰”思想的體現,那么全勝則是“上兵伐謀”的結果。當然,正如“慎戰”并非不戰一樣,“上兵伐謀”也非不戰,而是講究如何去戰,即如何以最小的社會資源消耗,去獲取戰爭的勝利。當智慧和由智慧而生的智謀統領、駕馭戰爭的全過程時,當戰爭過程中的對策選擇總是沿著最優的路線進行時,也就進入了“上兵伐謀”的境界。只有“伐謀”,即用智慧、頭腦而非單純用肉身去打伐的兵,才是“上兵”,即最優秀、最有戰斗力的軍隊。因此,“上兵伐謀”具有以最佳的方式達到最佳的結果的,古典經濟學中的理性的“經濟人”的最優化行為的特質。

        3、“知勝有五”——實現最優化的條件。盡管從理論上說無論次優、再次優、甚至下策都是一種選擇,但相對于最優而言,畢竟是次優的。當然選擇是要受當時的條件、環境制約的,當條件、環境發生變化時,選擇也會發生變化,同時次優的選擇在特定的情況下,可能成為最優的選擇。換句話說,在選擇的全過程中,選擇鏈條中的最優,在條件發生變化后,未必依然是最優;而選擇鏈條中的次優,在條件發生變化后,可能成為最優。既然條件和環境影響人們的選擇行為和對策的相對最優化,那么創造有利于最有選擇的條件和環境(這很類似孫子所說的“勢”),把握最佳決策的機會(“任勢”),就成為決策最優化的保證。所以孫子提出了能把握勝利的五種情況和國君危害元帥軍事行動的三種情形。

        所謂把握勝利的五種情況,可以理解為實現全勝的五項保障。而“全勝”也正是“上兵伐謀”的結果(“以全爭于天下,兵不頓而利可全,此謀攻法也。”),因此,也可以把實現“全勝”的五項保障看成是實現最優化的五項保障。這就是《謀攻》篇所說的:“故知勝有五:知可以戰與不可以戰者勝;識眾寡之用者勝;上下同欲者勝;以虞待不虞者勝;將 能而 君不御者勝。此五者,知勝之道也。”知道可以打或不可以打者,能夠勝利;了解多兵和少兵的不同用法這,能夠勝利;全軍上下意愿一致者,能夠勝利;自己有準備來對付無準備的敵手者,能夠勝利;將帥有才 能而國 君不加制肘的,能夠勝利。

        所謂 君危害軍事行動的三種情況,可以理解為無法實現最優選擇的情形。具體地說就是:“故君之所以患于軍者三:不知軍知不可以進而謂之進,不之軍之不可以退而謂之退,是謂縻軍。不知三軍之事,而同三軍之政者,則軍士惑矣。不知三軍之權而同三軍之任,則軍士疑矣。三軍既惑且疑,則諸侯之難至矣,是謂亂軍引勝。”不了解軍隊不能前進而硬使軍隊前進,不了解軍隊不能后退而硬使軍隊后退的束縛軍隊的行為;不了解軍隊的內部事務,而去干預軍隊的行政的迷惑將士的行為;不懂軍事上的權宜機變,而去干涉軍隊的指標的使將士疑慮的行為;這三種 君的行為將會自亂其軍,徒失勝機。

        結束語

        中國古代軍事文化以尚智貴謀,慎戰節武為特征。這種建筑在戰爭反思基礎上的軍事文化,脫離了廝殺的原始,達到了“知兵非好戰”的境界,從而具有哲學智慧的美感。同時,這一文化價值取向,也使得統一戰爭的謀劃者,在構筑其戰略方針時,牢牢把握了“經武之略,在于貴謀”的原則,力爭“不戰而屈人之兵”,以達到“慎戰”而又“全勝”的目的。

        中國歷史上的戰爭,尤其是春秋戰國時期的戰爭,很少有正義與非正義、侵略與反侵略之分。大凡戰爭總是與“統一”或“大一統”這一文化——政治理念聯系在一起。因此,所謂“兵書戰略”以遠邁作戰和戰略戰術本身,深含治國理財之道,甚至可以說是以兵謀戰略體現出來的治國謀略和統治術。

         

         

        課題基本信息

        課題立項名稱 

        老莊哲學與孫子兵法

        最終成果名稱 

        對《孫子兵法的博弈論分析

        課題成果形式 

        研究報告

        課題負責人姓名:

        陶一桃

              位:

        深圳大學

        課題組成員姓名:

        武鳳蘭、董江濤

        課題立項時間 

        2005

        課題結項時間 

        20117