神奇的演算法 - 動態規劃 Dynamic Programming
Preface
動態規劃一直是我覺的不容易掌握的演算法技巧,它不像其他演算法技巧有一個固定的模式,而是一種思維方式
題目的靈活性高,不太容易掌握
Starting From Fibonacci Sequence
費氏數列是資工系學生一開始接觸到的題目
費氏數列的定義是 $F(n) = F(n-1) + F(n-2)$,而 $F(0) = 0, F(1) = 1$
所以寫起來基本上長這樣
1
2
3
4
5
6
7
8
9
func fibonacci(n int) int {
if n == 0 {
return 0
}
if n == 1 {
return 1
}
return fibonacci(n-1) + fibonacci(n-2)
}
改寫成 tail recursion 也可以大幅度的提升速度
你可能有聽過,這個版本的實作效率非常差
這是因為這個版本的實作會重複計算很多次相同的值
所以他的 time complexity 是 $O(2^n)$(i.e. exponential
)
所以更好的解法之一是使用動態規劃
基本上我們知道 fib(n) 等於前一項加上前兩項
所以你可以用一個 for loop 過去就解決了
1
2
3
4
5
6
7
8
9
func fibonacci(n int) int {
dp := make([]int, n+1)
dp[0] = 0
dp[1] = 1
for i := 2; i <= n; i++ {
dp[i] = dp[i-1] + dp[i-2]
}
return dp[n]
}
我們是逐步的建構出 fib(n) 的值,並且搭配上記憶化搜索,所以 time complexity 是 $O(n)$
Introduction to Dynamic Programming
DP 的心法是將一個大問題拆解成許多小問題,並且將小問題的解答記錄下來(記憶)
在解決小問題的時候,記憶化搜索可以幫助我們避免重複計算
當你解決完所有的小問題後,你就可以得到大問題的解答,答案就出來了
只不過要如何找到解決小問題的公式,老實說這有點難
看幾個例子或許你會有所感覺
LeetCode 322. Coin Change
給定一個金額,以及一個硬幣面額的陣列,問你需要多少硬幣可以湊出這個金額,且硬幣數量要是最少的
這題用貪婪法是沒辦法解的,因為多了一個限制,硬幣數量要是最少的
用遞迴可以窮舉出所有可能性,不過會出現重複的組合需要過濾
既然在學習 DP,我們就用 DP 來解決這個問題
找零錢一般來說都是從大到小(找 24 塊會給 2 * 10
+ 4 * 1
,應該是不會給 24 * 1
),但硬幣數量不一定會是最少的
比方說
你有 [1, 6, 7, 9, 11], 然後找的零錢為 13
- greedy: 1 *
11
+ 2 *1
3 個硬幣 - dp: 1 *
6
+ 1 *7
2 個硬幣
要怎麼知道 n
金額的最少硬幣數量呢?
很明顯我們沒辦法第一時間想出來,因為這個問題太複雜了
一種方式是我們可以先從小金額開始,一步一步的推導出大金額的最少硬幣數量
這樣時間複雜度也僅僅只有 $O(n)$
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
func coin(coins []int, amount int) int {
dp := make([]int, amount + 1)
dp[0] = 0
for i := 1; i <= amount; i++ {
result := int(1e9)
for _, coin := range coins {
if i - coin >= 0 {
result = min(result, dp[i - coin] + 1)
}
}
dp[i] = result
}
if dp[amount] == 1e9 {
return -1
}
return dp[amount]
}
重點在 result = min(result, dp[i - coin] + 1)
0 元的時候,有 0 種方法可以湊出,所以 dp[0] = 0
但是為什麼公式的部份需要 +1
呢?
上述 iterate 全部的硬幣面額,然後我們要找出最小硬幣數量所以用 min
dp[i - coin]
表示的是 當前金額扣掉硬幣面額後的金額,所需的最小硬幣數量
換句話說,如果我們要湊出當前金額,我們需要湊出 i - coin
的金額,而 i - coin
的金額正好是目前考慮的硬幣面額
所以我們需要 +1
,表示我們使用了一個硬幣
因為 dp[i] 裡面儲存的都是最小硬幣數量,所以可以保證 dp[i + 1] 經由我們的計算肯定也是最小硬幣數量
Multi-state Decision Problem
我們剛剛看到的題目都是屬於單一狀態決策問題
也就是他的變因只有一個,需要考慮的事情相對單純(i.e. 最小值)
不過 DP 難的地方,我覺的在於多狀態決策問題
他的變因超過一個以上,整個狀態的轉移變得非常複雜
LeetCode 120. Triangle
題目的要求是說,給定一個三角形,找出從頂點到底邊的最小路徑和
這個題目的解法有點像是走迷宮
我們可以很輕易的得出他的公式,也就是最小和等於當前的值加上下一層的最小值
你會想,這還不簡單,用個遞迴從上到下窮舉出所有可能性就可以了
1
2
3
4
5
6
7
func traverse(x, y int) int {
return triangle[x][y] + min(
traverse(triangle, x + 1, y),
traverse(triangle, x + 1, y + 1),
)
}
有沒有發現,這個解法你好像在哪裡看過
它跟我們上面說的 fibonacci 一樣,都是屬於 exponential
的解法
為什麼?
第一層 call,會往下算完全部的可能性;第二層 call,也會往下算完全部的可能性
它會重複計算很多次
改進的方法也是一樣的,我們可以用一個 dp 陣列記錄下來(記憶化搜索)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
var nnum = int(-1 * 1e5)
func traverse(triangle [][]int, x, y int, dp [][]int) int {
size := len(triangle)
if x >= size || y >= size {
return 0
}
if dp[x][y] != nnum {
return dp[x][y]
}
dp[x][y] = triangle[x][y] + min(
traverse(triangle, x + 1, y, dp),
traverse(triangle, x + 1, y + 1, dp),
)
return dp[x][y]
}
當前最小值取決於,你往左邊還是右邊走
那我們可以把當前的數值紀錄起來
我們可以透過 dp array 進行記憶化搜索,避免重複計算
當遇到重複計算的時候,我們就可以直接返回答案
LeetCode 97. Interleaving String
題目基本上就是給你三個字串,問你說能不能用前兩個字串交叉組成第三個字串
題目本身挺單純的,你只要用 pointer 去嘗試組合出最後一個字串即可
第一版的 code 是用遞迴寫的
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
func isInterleave(s1 string, s2 string, s3 string) bool {
return dp(s1, s2, s3)
}
func dp(s1, s2, s3 string) bool {
if len(s3) == 0 && len(s1) == 0 && len(s2) == 0 {
return true
}
if len(s3) == 0 {
return false
}
target := s3[0]
result := false
if len(s1) > 0 && s1[0] == target {
result = result || dp(s1[1:], s2, s3[1:])
}
if len(s2) > 0 && s2[0] == target {
result = result || dp(s1, s2[1:], s3[1:])
}
return result
}
能不能組成 s3 這個字串,取決於 s1 跟 s2 的狀態
所以要怎麼改進呢
使用二維的 DP 陣列,紀錄每個狀態的當前結果
看起來會像這樣
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
func isInterleave(s1 string, s2 string, s3 string) bool {
if len(s1) + len(s2) != len(s3) {
return false
}
arr := make([][]int, len(s1) + 1)
for i := 0; i < len(s1) + 1; i++ {
arr[i] = make([]int, len(s2) + 1)
}
return solve(arr, s1, s2, s3, 0, 0, 0)
}
func solve(arr [][]int, s1, s2, s3 string, i, j, k int) bool {
if k == len(s3) && i == len(s1) && j == len(s2) {
return true
}
if k == len(s3) {
return false
}
if arr[i][j] != 0 {
return arr[i][j] == 1
}
result := false
target := s3[k]
if i < len(s1) && s1[i] == target {
result = solve(arr, s1, s2, s3, i + 1, j, k + 1)
}
if !result && j < len(s2) && s2[j] == target {
result = solve(arr, s1, s2, s3, i, j + 1, k + 1)
}
if result {
arr[i][j] = 1
} else {
arr[i][j] = -1
}
return result
}
這邊初始化二維陣列,是使用 int 的類型
原因在於要區分有沒算過,而 boolean 的 true, false. 單用 false 會有兩種語意,所以要用 int 來紀錄
-
0
: nil -
-1
: false -
1
: true
重點在 solve function 裡面
你可以看到基本的思路是一樣的
如果當前字母相同就往下算,而這有兩種情況
- s1 與 s3 字首相同
- s2 與 s3 字首也相同
所以你可以看到有兩個 if
另外第 34 行有一個 fast path, 因為我們只關心成功的 case, 所以這邊檢查 !result
代表第一個 case 已經成功了,所以不用檢查第二個 case(它不會影響結果)
然後 DP 的精隨是能夠提早 return 已經計算過得資料
所以在 22 行的時候我們這樣做了
另外一個小小的東西
我一開始是定義 solve
的回傳值是 int
然後在 main function 那在判斷
不過,這樣會 TLE, 改成 boolean 可以解決(不過這部份就有點 hack 了我覺的)
基本上你只要想到能用二維陣列,這個方法已經足夠
Conclusion
動態規劃的題目有趣但難度我覺的偏高
有些題目可以先從暴力解開始(i.e. recursion)
遞迴寫出來如果 TLE 代表方向應該是對的,當你有辦法構築出遞迴公式的時候
可以嘗試 identify 出公式內的變因,再轉換成動態規劃的問題會相對容易
另外寫程式的時候我們常常透過 debugger 或是 print 大法觀察變數
在這個例子中可以是 dp array
但我親身經歷後是覺的它沒有那麼容易看懂,相鄰的 array item 不一定有直接的關係(尤其是多維的 array)
會導致 debug 過程困難
See Also
References
- 程式設計與演算法競賽入門經典(ISBN: 978-986-347-311-4)
Leave a comment