Codeforces 148D Bag of mice：概率dp 記憶化搜尋

林堯彬發表於2017-09-03

題目連結：http://codeforces.com/problemset/problem/148/D

題意：

　　一個袋子中有w只白老鼠，b只黑老鼠。

　　公主和龍輪流從袋子裡隨機抓一隻老鼠出來，不放回，公主先拿。

　　公主每次抓一隻出來。龍每次在抓一隻出來之後，會隨機有一隻老鼠跳出來（被龍嚇的了。。。）。

　　先抓到白老鼠的人贏。若兩人最後都沒有抓到白老鼠，則龍贏。

　　問你公主贏的概率。

題解：

　　表示狀態：

　　　　dp[i][j] = probability to win（當前公主先手，公主贏的概率）

　　　　i：剩i只白老鼠

　　　　j：剩j只黑老鼠

　　找出答案：

　　　　ans = dp[w][b]

　　邊界條件：

　　　　if i==0 dp[i][j] = 0　（沒有白老鼠了，不可能贏）

　　　　else if j==0 dp[i][j] = 1　（有且只有白老鼠，一定贏）

　　　　else if j==1 dp[i][j] = i/(i+1)　（如果公主拿了黑老鼠，那麼龍一定會拿到白老鼠，公主輸。所以公主一下就要拿到白老鼠）

　　如何轉移：

　　　　對於dp[i][j]，有兩種贏的方法：

　　　　　　（1）公主在這個回合一次就抓到了白老鼠。

　　　　　　（2）公主和龍都各抓了一隻黑老鼠，然後公主在下一個回合贏了。

　　　　P（一次就抓到了白老鼠） = i/(i+j)

　　　　P（進入下個回合，即兩人都抓到黑老鼠） = P（公主抓到黑老鼠） * P（龍抓到黑老鼠） = j/(i+j) * (j-1)/(i+j-1)

　　　　所以dp[i][j] = P（一次就抓到了白老鼠） + P（進入下個回合） * P（在下個回合贏）

　　　　那麼考慮下個回合可能的狀態。

　　　　因為公主和龍都已經抓走了兩隻黑老鼠，那麼下個回合取決於跳出來的老鼠，有三種可能：

　　　　　　（1）跳出來白老鼠

　　　　　　（2）跳出來黑老鼠

　　　　　　（3）老鼠已經抓完了，沒有老鼠跳出來

　　　　對於情況（3），原狀態(i,j)只可能為：(1,1) , (0,2) , (2,0)，均包含在邊界條件中，所以不作考慮。

　　　　剩下兩種情況的可能性：

　　　　　　（1）P（跳出來白老鼠） = i/(i+j-2)　(i>=1 and j>=2)

　　　　　　（2）P（跳出來黑老鼠） = (j-2)/(i+j-2)　(j>=3)

　　　　所以P（在下個回合贏） = P（跳出來白老鼠） * dp[i-1][j-2] + P（跳出來黑老鼠） * dp[i][j-3]

　　　　總方程：

　　　　　　nex = 0

　　　　　　if i>=1 and j>=2 nex += i/(i+j-2)*dp[i-1][j-2]

　　　　　　if j>=3 nex += (j-2)/(i+j-2)*dp[i][j-3]

　　　　　　dp[i][j] = i/(i+j) + j/(i+j) * (j-1)/(i+j-1) * nex

　　另外，這道題的題解有兩個版本，一種記憶化搜尋，一種for迴圈版，都差不多。

AC Code（記憶化搜尋）:

 1 // state expression:
 2 // dp[i][j] = probability to win
 3 // i: i white mice
 4 // j: j black mice
 5 //
 6 // find the answer:
 7 // ans = dp[w][b]
 8 //
 9 // transferring:
10 // if i>=1 and j>=2 nex += i/(i+j-2)*dp[i-1][j-2]
11 // if j>=3 nex += (j-2)/(i+j-2)*dp[i][j-3]
12 // dp[i][j] = i/(i+j) + j/(i+j) * (j-1)/(i+j-1) * nex
13 //
14 // boundary:
15 // if i==0 dp[i][j] = 0
16 // if j==0 dp[i][j] = 1
17 // if j==1 dp[i][j] = i/(i+1)
18 #include <iostream>
19 #include <stdio.h>
20 #include <string.h>
21 #define MAX_N 1005
22 
23 using namespace std;
24 
25 int w,b;
26 bool vis[MAX_N][MAX_N];
27 double ans;
28 double dp[MAX_N][MAX_N];
29 
30 double dfs(int i,int j)
31 {
32     if(vis[i][j]) return dp[i][j];
33     vis[i][j]=true;
34     if(i==0) return dp[i][j]=0;
35     if(j==0) return dp[i][j]=1;
36     if(j==1) return dp[i][j]=(double)i/(i+1);
37     double nex=0;
38     nex+=(double)i/(i+j-2)*dfs(i-1,j-2);
39     if(j>=3) nex+=(double)(j-2)/(i+j-2)*dfs(i,j-3);
40     return dp[i][j]=(double)i/(i+j)+(double)j/(i+j)*(j-1)/(i+j-1)*nex;
41 }
42 
43 void read()
44 {
45     cin>>w>>b;
46 }
47 
48 void solve()
49 {
50     memset(vis,false,sizeof(vis));
51     ans=dfs(w,b);
52 }
53 
54 void print()
55 {
56     printf("%.9f\n",ans);
57 }
58 
59 int main()
60 {
61     read();
62     solve();
63     print();
64 }

AC Code（for迴圈）:

 1 #include <iostream>
 2 #include <stdio.h>
 3 #include <string.h>
 4 #define MAX_N 1005
 5 
 6 using namespace std;
 7 
 8 int w,b;
 9 double ans;
10 double dp[MAX_N][MAX_N];
11 
12 void read()
13 {
14     cin>>w>>b;
15 }
16 
17 void solve()
18 {
19     memset(dp,0,sizeof(dp));
20     for(int i=0;i<=w;i++)
21     {
22         for(int j=0;j<=b;j++)
23         {
24             if(i==0)
25             {
26                 dp[i][j]=0;
27                 continue;
28             }
29             if(j==0)
30             {
31                 dp[i][j]=1;
32                 continue;
33             }
34             if(j==1)
35             {
36                 dp[i][j]=(double)i/(i+1);
37                 continue;
38             }
39             double nex=(double)i/(i+j-2)*dp[i-1][j-2];
40             if(j>=3) nex+=(double)(j-2)/(i+j-2)*dp[i][j-3];
41             dp[i][j]=(double)i/(i+j)+(double)j/(i+j)*(j-1)/(i+j-1)*nex;
42         }
43     }
44 }
45 
46 void print()
47 {
48     printf("%.9f\n",dp[w][b]);
49 }
50 
51 int main()
52 {
53     read();
54     solve();
55     print();
56 }

轉載於:https://www.cnblogs.com/Leohh/p/7468561.html

Codeforces 148D Bag of mice (概率dp)
2015-08-09
codeforces 148 D Bag of mice(概率dp)
2014-07-08
Codeforces 900D Unusual Sequences：記憶化搜尋
2018-02-24
記憶化搜尋
2024-05-25
C - Digital Path 計蒜客 - 42397（dp記憶化搜尋）
2020-11-26
Git
C++記憶化搜尋
2024-08-24
C++
codeforces 505C. Mr. Kitayuta, the Treasure Hunter (記憶化搜尋)
2015-01-20
codeforces 148 D 概率dp
2014-11-01
一類適合記憶化搜尋的區間dp
2024-03-27
poj1179 區間dp（記憶化搜尋寫法）有巨坑！
2015-03-18
Codeforces Round #390 (Div. 2)(A,B,C(記憶化搜尋),D（貪心，優先佇列）)
2017-02-16
佇列
【記憶優化搜尋/dp】HDU - 6415 - 杭電多校第九場 - Rikka with Nash Equilibrium
2018-08-20
優化UI
Codeforces Round #689 (Div. 2, based on Zed Code Competition)-B. Find the Spruce（DFS+記憶化搜尋）
2020-12-12
Zed
bzoj 4899 記憶的輪廓題解（概率dp+決策單調性優化）
2019-06-23
優化
POJ 1579-Function Run Fun（記憶化搜尋-遞迴）
2017-04-28
Function遞迴
【leetcode 1510 石子游戲】【記憶化搜尋】
2024-06-08
LeetCode
Codeforces 351B Jeff and Furik：概率 + 逆序對【結論題 or dp】
2018-01-04
組合數的計算（利用楊輝三角/記憶化搜尋）
2020-12-21
概率DP入門題
2014-10-20
ES 筆記十七：結構化搜尋
2019-11-06
筆記
WeetCode3 暴力遞迴->記憶化搜尋->動態規劃
2022-12-04
遞迴動態規劃
【演算法學習筆記】概率與期望DP
2021-07-23
演算法筆記
概率DP總結 by kuangbin
2014-01-10
HDU 3853 LOOPS(概率dp)
2014-07-08
OOP
Codeforces 235B Let's Play Osu! (概率dp求期望＋公式變形)
2015-08-25
公式
二叉搜尋樹 [四邊形不等式優化區間dp]
2020-08-15
優化
poj3252 數位dp（所有比n小的二進位制位0的個數不少於1的個數）記憶化搜尋
2015-02-21
POJ 2311-Cutting Game（Nim博弈-sg函式/記憶化搜尋）
2016-05-12
GAM函式
【leetcode 3149. 找出分數最低的排列】記憶化搜尋
2024-05-20
LeetCode
SGU 495 Kids and Prizes：期望dp / 概率dp / 推公式
2017-09-21
公式
POJ3744 Scout YYF I (概率DP + 矩陣優化)
2014-12-24
矩陣優化
搜尋引擎優化（SEO）
2020-05-17
優化
POJ 3744 概率dp+矩陣
2014-10-13
矩陣
NOIP2014pj子矩陣[搜尋｜DP]
2016-08-27
矩陣
solr搜尋分詞優化
2018-03-10
Solr分詞優化
微信全文搜尋優化之路
2017-10-20
優化
搜尋結果頁優化
2017-05-21
優化
Google的個性化搜尋
2008-01-03
Go

Codeforces 148D Bag of mice：概率dp 記憶化搜尋

相關文章