運籌優化(十九)--決策論基礎及其最優化求解

Eason.wxd發表於2019-01-27

研究決策的問題包括:決策的基本原理、決策的程式、決策的資訊、決策的方法(定量與定性的方法)、決策的風險、決策中的人因素、決策的思維方式、決策的組織、決策的實施 等。

決策科學包括的內容十分廣泛:涉及社會學、決策心理學、決策行為學、決策的量化方 法和評價、決策支援系統和決策自動化等多學科和多領域的綜合應用。

單目標決策

決策的分類

從不同的角度出發可得不同的決策分類。

1. 按性質的重要性分類

可將決策分為戰略決策、策略決策和執行決策 , 或叫戰略計劃、管理控制和執行控制。

戰略決策是涉及某組織發展和生存有關的全域性性、長遠問題的決策 , 如廠址的選擇、 新產品開發方向、新市場的開發、原料供應地的選擇等。

策略決策是為完成戰略決策所規定的目的而進行的決策 , 如對一個企業產品規格的選擇、工藝方案和裝置的選擇、廠區和車間內工藝路線的佈置等。

執行決策是根據策略決策的要求對執行行為方案的選擇 , 如生產中產品合格標準的選擇、日常生產排程的決策等。

2. 按決策的結構分類

分為程式決策和非程式決策。
程式決策是一種有章可循的決策 , 一般是可重複的。 非程式決策一般是無章可循的決策, 只能憑經驗直覺作出應變的決策, 一般是一次性的。

3. 按定量和定性分類
分為定量決策和定性決策 , 描述決策物件的指標都可以量化時可用定量決策 , 否則只能用定性決策。總的發展趨勢是儘可能地把決策問題量化。

4. 按決策環境分類

可將決策問題分為確定型的、風險型的和不確定型的三種。確定型的決策是指決策環境是完全確定的, 作出的選擇的結果也是確定 的。風險型決策是指決策的環境不是完全確定的 , 而其發生的概率是已知的。不確定型決策是指決策者對將發生結果的概率一無所知 , 只能憑決策者的主觀傾向進行決策。

5. 按決策過程的連續性分類

可分為單項決策和序貫決策。單項決策是指整個決策過程只作一次決策就得到結果, 序貫決策是指整個決策過程由一系列決策組成 , 一般講管理活動是由一系列決策組成的, 但在這一系列決策中往往有幾個關鍵環節要作決策 , 可以把這些關鍵的決策分別看作 單項決策。

決策過程

構造人們決策行為的模型主要有兩種方法 : 一種是面向決策結果的方法 ; 另一種是面向決策過程的方法。

面向決策結果的方法認為 : 若決策者能正確地預見到決策結果 , 其核心是決策的結果和正確的預測。通常的單目標和多目標決策是屬這型別的。

面向決策過程的方法認為 : 若決策者瞭解了決策過程 , 掌握了過程和能控制過程 , 他就能正確地預見決策的結果。

任何決策都有一個過程和程式, 絕非決策者靈機一動拍板就行。面向決策過程的方法一般包括預決策→決策→決策後三個互相依賴的階段。

預決策階段是指當要決策的問題擺在決策者面前時 , 決策者能立即想到各種可能方案 , 並意識到沒有理想方案時, 就會產生矛盾。他開始企圖尋找減少矛盾的方案 , 沿著這企圖擴大線索時, 就需要收集資訊。收集資訊時開始時比較客觀 , 無傾向性, 以後逐漸變 得主觀和有傾向了。當預決策進行得較順利, 可以進行區域性決策。

決策階段可分為分部決策和最終決策兩個階段。分部決策包括對決策處境作方向性的調整 , 如排除劣解 , 重新考慮已放棄的方案 , 增加和去掉一些評價準則。 在合併一些方案後, 減少了變數數和方案數, 決策者按主觀傾向重新估價各方案, 並保留傾向的少數方 案 , 以便進行最終決策。

決策後階段 , 當進行了最終決策 , 這時主要考慮的問題是決策後看法不一致。這時決策者傾向於解釋和強調已選方案的優點 , 並尋 找更多的資訊來證明已選方案的優點和正確性。應克服願聽取相同意見、不願聽取不同意見的現象。決策後階段要對決策實施進 行了解,這是十分重要的, 決策實施是決策的繼續,決策後階段往往也是下次決策的預決策階段。

任何決策問題都有以下要素構成決策模型 :

(1) 決策者,他的任務是進行決策。決策者可以是個人、委員會或某個組織。一般指領導者或領導集體。

(2) 可供選擇的方案(替代方案)、行動或策略。參謀人員的任務是為決策者提供各種可行方案。這裡包括瞭解研究物件的屬性 , 確定目的和目標。

  • 屬性是指研究物件的特性,它們是客觀存在的, 是可以客觀量度的, 並由決策者主觀選定的 , 如選拔飛行員時 , 按身高、年齡、健康狀況等數值來表明其屬性。
  • 目的是表明選擇屬性的方向 , 如要優秀還是良好 , 反映了決策者的要求和願望。
  • 目標是給出了引數值的目的 , 如目的是選擇一種省油的汽車時 , 那麼以每公升能行駛 60 公里為目標。

(3) 準則是衡量選擇方案, 包括目的、目標、屬性、正確性的標準, 在決策時有單一準 則和多準則。

(4) 事件是指不為決策者所控制的客觀存在的將發生的狀態。

(5) 每一事件的發生將會產生某種結果,如獲得收益或損失。

(6) 決策者的價值觀,如決策者對貨幣額或不同風險程度的主觀價值觀念。

定型的決策是指不包含有隨機因素的決策問題 , 每個決策都會得到一個唯一的事先可知的結果。從決策論的觀點來看, 前面討論的規劃論等都是確定型的決策問題。這裡討論的決策問題都是具有不確定因素和有風險的決策。

不確定型的決策

所謂不確定型的決策是指決策者對環境情況一無所知。這時決策者是根據自己的主觀傾向進行決策, 由決策者的主觀態度不同基本可分為四種準則 : 悲觀主義準則、樂觀主義準則、等可能性準則、最小機會準則。

  • 悲觀主義(max min)決策準則

悲觀主義決策準則亦稱保守主義決策準則。當決策者面臨著各事件的發生概率不清時 , 決策者考慮可能由於決策錯誤而造成重大經濟損失。由於自己的經濟實力比較脆弱 , 他在處理問題時就較謹慎。他分析各種最壞的可能結果 , 從中選擇最好者, 以它對應的策略為決策策略,用符號表示為 max min 決策準則。在收益矩陣中先從各策略所對應的可 能發生的“策略—事件”對的結果中選出最小值 , 將它們列於表的最右列。 再從此列的數值中選出最大者 , 以它對應的策略為決策者應選的決策策略。

  • 樂觀主義(maxmax)決策準則

持樂觀主義(max max)決策準則的決策者對待風險的態度與悲觀主義者不同, 當他面臨情況不明的策略問題時, 他絕不放棄任何一個可獲得最好結果的機會 , 以爭取好中之好的樂觀態度來選擇他的決策策略。決策者在分析收益矩陣各策略的“策略—事件”對的 結果中選出最大者, 記在表的最右列。再從該列數值中選擇最大者 , 以它對應的策略為決策策略

  • 等可能性(Laplace)準則

等可能性(Laplace)準則是 19 世紀數學家 Laplace 提出的。他認為: 當一個人面臨著 某事件集合 , 在沒有什麼確切理由來說明這一事件比那一事件有更多發生機會時 , 只能認為各事件發生的機會是均等的。即每一事件發生的概率都是 1/ 事件數。決策者計算各 策略的收益期望值 , 然後在所有這些期望值中選擇最大者, 以它對應的策略為決策策略。然後按下式決定決策策略。

S_{k}^{*} \rightarrow \underset{i}{max}\left \{ E(S_{i}) \right \}

  • 最小機會損失準則

最小機會損失決策準則亦稱最小遺憾值決策準則或 Savage 決策準則。首先將收益矩陣中各元素變換為每一“策略—事件”對的機會損失值(遺憾值, 後悔值)。其含義是: 當某一事件發生後,由於決策者沒有選用收益最大的策略, 而形成的損失值。若發生件,各策略的收益為 aik ,i=1,2,⋯,5,其中最大者為:

a_{i,k} = \underset{i}{max} \,(a_{i,k})

這時各策略的機會損失值為:a_{i,k}^{'} = \left \{\underset{i}{max} \,(a_{i,k}) - a_{i,k} \right \}, i = 1, ..., 5

從所有最大機會損失值中選取最小者 , 它對應的策略為決策策略。用公式表示為 :S_{k}^{*} \rightarrow \underset{i}{min}\, \underset{j}{max}\, a_{i,j}^{'}

  • 折中主義準則

當用 min max 決策準則或 max max 決策準則來處理問題時, 有的決策者認為這樣太極端了。於是提出把這兩種決策準則給予綜合,令 a為樂觀係數, 且 0≤a≤1。並用以下關係式表示:

H_{i} = aa_{i_{max}} + (1 - a )a_{i_{min}}

其中aimax和aimin分別表示第 i個策略可能得到的最大收益值與最小收益值。

在不確定性決策中是因人因地因時選擇決策準則的, 但在實際中當決策者面臨不確定性決策問題時, 他首先是獲取有關各事件發生的資訊 , 使不確定性決策問題轉化為風險決策。

風險決策

風險決策是指決策者對客觀情況不甚了 解 , 但對將發生各事件的概率是已知的。 決策者往往通過調查, 根據過去的經驗或主觀估計等途徑獲得這些概率。在風險決策中一般採用期望值作為決策準則, 常用的有最大期望收益決策準則和最小機會損失決策準則。

  • 最大期望收益決策準則(expectedmonetaryvalue,EMV)

決策矩陣的各元素代表“策略—事件”對的收益值, 各事件發生的概率為pj先計算各策略的期望收益值:

\sum_{j}\, p_{J} a_{i,j}, i = 1,2,..,n

然後從這些期望收益值中選取最大者, 它對應的策略為決策應選策略。即:

\underset{i}{max}\sum_{j} p_{j}a_{i,j}\rightarrow S_{k}^{*}

EMV決策準則適用於一次決策多次重複進行生產的情況,所以它是平均意義下的最大收益。

  • 最小機會損失決策準則(expected opportunity loss,EOL)

矩陣的各元素代表“策略—事件”對的機會損失值, 各事件發生的概率為 pj , 先計算各策略的期望損失值。

\sum_{j}\, p_{J} a_{i,j}^{'}, i = 1,2,..,n

然後從這些期望損失值中選取最小者 , 它對應的策略應是決策者所選策略。即

\underset{i}{min}\sum_{j} p_{j}a_{i,j}^{'}\rightarrow S_{k}^{*}

從本質上講 EMV 與 EOL 決策準則是一樣的。

風險決策的代表,就是貝葉斯決策的應用。這裡不囉嗦了。

決策論,還有一個概念是決策樹,其重點不是機器學習決策樹演算法的應用,而是,自然意義上的決策行為和對應行為收益的加權和。

多目標決策

在考慮單目標最優化問題時 , 只要比較任意兩個解對應的目標函式值後 , 就能確定誰優誰劣 ( 目標值相等時除外 ) 。在多目標情況 , 就不能作這樣簡單的比較來確定誰優誰劣了。要求若干目標同時都實現最優往往是很難的。經常是有所失才能有所得, 那麼問題的失得在何時最好。各種不同的思路可引出各種合理處理得失的方法。以下介紹化多為少的方法。

化多為少的方法

主要目標法

解決主要問題 , 並適當兼顧其他要求。

1. 優選法:在實際問題中通過分析討論,抓住其中一兩個主要目標, 讓它們儘可能地好, 而其他指標只要滿足一定要求即可 , 通過若干次試驗以達到最佳。

2. 數學規劃法:轉換多目標決策為非線性規劃問題。

線性加權和法

若有m個目標fi( x ) , 分別給以權係數λi ( i = 1 , 2 , ⋯ , m ) , 然後作新的目標函式(也稱效用函式)。

平方和加權法

設有m個規定值f1* ,⋯,fm* ,要求m個函式f1 (x),⋯,fm(x)分別與規定的值相差儘量小,若對其中不同值的要求相差程度又可不完全一樣, 即有的要求重一些,有的輕一些。這時可採用下述評價函式:U(x) = \sum_{i = 1}^{m} \lambda_{i}\left [ f_{i}(x) - f_{i}^{*} \right ]^2要求minU( x) , 其中λi可按要求相差程度分別給出。

理想點法

假設可以找到每個目標函式的最優值,這些最優值形成原多目標函式的理想點,然後定義一定的模,在這個模的意義下找一個點儘量接近理想點。

乘除法

將目標函式分為兩部分,一部分取最大,一部分取最小,然後定義取最小的目標函式連乘作為分子,取最大的目標函式連乘作為分母,形成新的目標函式,該單目標函式取最小。

功效係數法——幾何平均法

設m個目標f1 (x),⋯,fm(x),其中k1個目標要求實現最大,k2 個目標要求實現最小,其餘的目標是過大不行,過小也不行。對於這些目標 fi( x)分別給以一定的功效係數 (即評分)di,di 是在[0,1]之間的某一數。當目標最滿意達到時,取di =1;當最差時取di =0。描述di與fi(x)的關係,稱為功效函式,表示為di =Fi(fi)。對於不同型別目標應 選用不同型別的功效函式。

分層序列法

由於同時處理 m個目標是比較麻煩,故可採用分層法。分層法的思想是把目標按其重要性給出一個序列, 分為最重要目標、次要目標等。設給出的重要性序列為f1 (x),f2(x),⋯,fm(x) ,首先對第一個目標求最優,並找出所有最優解的集合記為 R0 。然後在 R0 內求第二個目標的最優解, 記這時的最優解集合為 R1 , 如此等等一直到求出第m個目標的最優解。

直解求非劣解

上述種種方法的基本點是將多目標最優化問題轉換為一個或一系列單目標最優化問題。把對後者求得的解作為多目標問題的解 , 這種解往往是非劣解。對經轉換後的問題所求出的最優解往往只是原問題的一個(或部分) 非劣解 , 至於其他非劣解的情況卻不得 而知。於是出現第三類直接求所有非劣解的方法 , 當這些非劣解都找到後 , 就可供決策者 作最後的選擇 , 選出的好解就稱為選好解。顯然決策者這時的選好 , 必須取決於他心中的 另一個目標。這可能是定性的或無法奉告的。運籌學工作者主要是根據已知的目標 , 儘可能地列出非劣解,以供決策者選擇 , 非劣解求法很多 , 這裡僅介紹線性加權和改變權係數的方法。

多目標線性規劃的解法

當所有目標函式是線性函式 , 約束條件也都是線性時 , 可有些特殊的解法。特別是澤勒內(Zeleny)等將解線性規劃的單純形法給予適當修正後,用來解多目標線性規劃問題, 或把多目標線性規劃問題化成單目標的線性規劃問題後求解 ,逐步法

逐步法是一種迭代法。在求解過程中 , 每進行 一步 , 分 析者把 計算 結果 告訴決 策者 , 決策者對計算結果作出評價。若認為已滿意了 , 則迭代停止 ; 否則分析者再根據決策者的 意見進行修改和再計算 , 如此直到求得決策者認為滿意的解為止 , 故稱此法為逐步進行法 或對話式方法。

層次分析法

層次分析法是指將一個複雜的多目標決策系統作為一個系統,將目標分解為多個目標或準則,進而分解為多指標(或準則、約束)的若干層次,通過定性指標模糊量化方法算出層次單排序(權數)和總排序,以作為目標(多指標)、多方案優化決策的系統方法。

層次分析法是將決策問題按總目標、各層子目標、評價準則直至具體的備投方案的順序分解為不同的層次結構,然後用求解判斷矩陣特徵向量的辦法,求得每一層次的各元素對上一層次某元素的優先權重,最後再加權和的方法遞階歸併各備擇方案對總目標的最終權重,此最終權重最大者即為最優方案。

層次分析法比較適合於具有分層交錯評價指標的目標系統,而且目標值又難於定量描述的決策問題

1.建立層次結構模型

將決策的目標、考慮的因素(決策準則)和決策物件按它們之間的相互關係分為最高層、中間層和最低層,繪出層次結構圖。 最高層是指決策的目的、要解決的問題。 最低層是指決策時的備選方案。 中間層是指考慮的因素、決策的準則。對於相鄰的兩層,稱高層為目標層,低層為因素層。

2.構造判斷(成對比較)矩陣

在確定各層次各因素之間的權重時,如果只是定性的結果,則常常不容易被別人接受,因而Santy等人提出一致矩陣法,即不把所有因素放在一起比較,而是兩兩相互比較,對此時採用相對尺度,以儘可能減少性質不同的諸因素相互比較的困難,以提高準確度。如對某一準則,對其下的各方案進行兩兩對比,並按其重要性程度評定等級。a_{ij}為要素i與要素j重要性比較結果,表1列出Saaty給出的9個重要性等級及其賦值。按兩兩比較結果構成的矩陣稱作判斷矩陣。判斷矩陣具有如下性質:

a_{ij} = 1 / a_{ji}

判斷矩陣元素a_{i,j}的標度方法如下:

表1 比例標度表

因素i比因素j

量化值

同等重要

1

稍微重要

3

較強重要

5

強烈重要

7

極端重要

9

兩相鄰判斷的中間值

2,4,6,8

3.層次單排序及其一致性檢驗

對應於判斷矩陣最大特徵根\lambda_{max}的特徵向量,經歸一化(使向量中各元素之和等於1)後記為W。W的元素為同一層次因素對於上一層次因素某因素相對重要性的排序權值,這一過程稱為層次單排序。能否確認層次單排序,則需要進行一致性檢驗,所謂一致性檢驗是指對A確定不一致的允許範圍。其中,n階一致陣的唯一非零特徵根為n;n 階正互反陣A的最大特徵根\lambda\geqslant n, 當且僅當\lambda = n時,A為一致矩陣。由於λ連續的依賴於a_{ij},則λ 比n 大的越多,A的不一致性越嚴重,一致性指標用CI計算,CI越小,說明一致性越大。用最大特徵值對應的特徵向量作為被比較因素對上層某因素影響程度的權向量,其不一致程度越大,引起的判斷誤差越大。因而可以用 λ-n 數值的大小來衡量A 的不一致程度。定義一致性指標為:

CI = \frac{\lambda - n}{n - 1}

CI=0,有完全的一致性;CI 接近於0,有滿意的一致性;CI 越大,不一致越嚴重。

為衡量CI 的大小,引入隨機一致性指標 RI:

RI =\frac{\sum_{i=1}^{n} CI_{i}}{n}

其中,隨機一致性指標RI和判斷矩陣的階數有關,一般情況下,矩陣階數越大,則出現一致性隨機偏離的可能性也越大,其對應關係如表2:

表2 平均隨機一致性指標RI標準值(不同的標準不同,RI的值也會有微小的差異)

矩陣階數

1

2

3

4

5

6

7

8

9

10

RI

0

0

0.58

0.90

1.12

1.24

1.32

1.41

1.45

1.49

考慮到一致性的偏離可能是由於隨機原因造成的,因此在檢驗判斷矩陣是否具有滿意的一致性時,還需將CI和隨機一致性指標RI進行比較,得出檢驗係數CR,公式如下:

CR= \frac{CI}{RI}

一般,如果CR<0.1 ,則認為該判斷矩陣通過一致性檢驗,否則就不具有滿意一致性。

4.層次總排序及其一致性檢驗

計算某一層次所有因素對於最高層(總目標)相對重要性的權值,稱為層次總排序。這一過程是從最高層次到最低層次依次進行的。

5.注意

在運用層次分析法時,如果所選的要素不合理,其含義混淆不清,或要素間的關係不正確,都會降低AHP法的結果質量,甚至導致AHP法決策失敗。為保證遞階層次結構的合理性,需把握以下原則:

  1. 分解簡化問題時把握主要因素,不漏不多;

  2. 注意相比較元素之間的強度關係,相差太懸殊的要素不能在同一層次比較

相關文章