今天講個有趣的演算法:如何快速求 \(n^m\),其中 n 和 m 都是整數。
為方便起見,此處假設 m >= 0,對於 m < 0 的情況,求出 \(n^{|m|}\) 後再取倒數即可。
另外此處暫不考慮結果越界的情況(超過 int64 範圍)。
當然不能用程式語言的內建函式,我們只能用加減乘除來實現。
n 的 m 次方的數學含義是:m 個 n 相乘:n*n*n...*n,也就是說最簡單的方式是執行 m 次乘法。
直接用乘法實現的問題是效能不高,其時間複雜度是 O(m),比如 \(3^{29}\) 要執行 29 次乘法,而乘法運算是相對比較重的,我們看看能否採用什麼方法將時間複雜度降低。
設 m = x + y + z(x、y、z 都是整數),我們知道有如下數學等式: \(n^m\) = \(n^{x+y+z}\) = \(n^x * n^y * n^z\)。
也就是說,如果我們已經知道 \(n^x\)、\(n^y\)、\(n^z\) 的值,是不是就可以直接用他們相乘得出 \(n^m\)的結果?這樣的話乘的次數就大大降低了。
於是問題就變成應該將 m 拆成怎樣的幾個數的和。
因為計算機是玩二進位制的,我們嘗試著將這些數跟 2 扯上聯絡(以 2 為底),看看會不會有奇蹟發生。
我們看看具體的例子:\(3^{29}\)。
我們將 29 做這樣的拆分:29 = 16 + 8 + 4 + 1。
這個拆分有什麼特點呢?右邊的數都是 2 的 X 次方(\(2^4 + 2^3 + 2^2 + 2^0\))。
我們把上面的拆分帶進公式:\(3^{29} = 3^{16} * 3^{8} * 3^{4} * 3^{1}\)。
那我們能不能知道 \(3^{16}\)、\(3^{8}\)、\(3^{4}\)、\(3^{1}\) 是什麼呢?
我們不用計算就知道 \(3^{1}\) 是什麼——但僅此而已。
不過我們可以用 \(3^{1}\) 自乘 4 次的到 \(3^4\);然後再用 \(3^4\) 自乘得到 \(3^8\);再通過 \(3^8\) 自乘得到 \(3^{16}\)。
好像有點感覺了——我們每做一次乘法,就能將結果翻倍(如 \(3^4\) 自乘就變成 \(3^4*3^4 = 3^8\))。
如此,雖然也要多次乘法,但乘的次數從 29 次降到 9 次!
然後我們再回頭看看上面的拆分:
29 = 16 + 8 + 4 + 1 = \(2^4 + 2^3 + 2^2 + 2^0\) = \(1*2^4 + 1*2^3 + 1*2^2 + 0*2^1 + 1*2^0\) 。
這不就是學校學的二進位制轉十進位制嗎(29 的二進位制是 11101)?
\(3^{29} = 3^{16} * 3^{8} * 3^{4} * 3^{1}\) 是說:取 29 的二進位制表示中所有值是 1 的位,算出它們的指數值並相乘就得到最終的值。
我們用 go 語言實現一下:
// 求 a 的 n 次方
// a、n 是非負整數
func Pow(a,n int64) int64 {
// 0 的任何次方都是 0
if a == 0 {
return 0
}
// 任何數的 0 次方都是 1
if n == 0 {
return 1
}
// 1 次方是它自身
if n == 1 {
return a
}
// 用滾雪球的方式計算冪
// 雪球初始值是 1
var result int64 = 1
// 滾動因子初始化為 a 的 1 次方(a 自身)
factor := a
// 迴圈處理直到 n 變成 0(所有的二進位制位都處理完了)
for n != 0 {
// 跟 1 做與運算,判斷當前要處理的位是不是 1
// 之所以是直接跟 1 做與運算,因為後面每處理一輪都將 n 右移了一位,保證每次要處理的位都在最低位
if n & 1 != 0 {
// 當前位是 1,需要乘進去
result *= factor
}
// 每輪結束時將滾動因子自乘
// 因為每行進一輪,指數都翻倍,整體結果就是自乘
// 比如本輪因子是 2**4,下一輪就是 2**8
// 2**8 = 2**(4+4) = 2**4 * 2**4
// (** 表示指數)
factor *= factor
// n 右移一位,將下一輪要處理的位放在最低位
n = n >> 1
}
return result
}
有什麼用呢?
很多語言內建的 pow 函式都只接受浮點數,浮點數的運算是非常重的,如果我們的程式需要頻繁計算整數的冪,就可以採用 quick pow 演算法代替語言內建的冪函式以提升效能。
我們對 go 語言內建的 math.Pow 和 quick pow 演算法做個效能測試對比一下。
// 測試 3 的 29 次方的效能測試
var benchPowB int64 = 3
var benchPowP int64 = 29
// 上面的 quick pow 演算法
func BenchmarkQuickPow(b *testing.B) {
for i := 0; i < b.N; i++ {
algo.Pow(benchPowB, benchPowP)
}
}
// go 語言 math 包的 Pow 方法,只接受 float64 型別
func BenchmarkInnerPow(b *testing.B) {
x := float64(benchPowB)
y := float64(benchPowP)
for i := 0; i < b.N; i++ {
math.Pow(x, y)
}
}
// 用簡單乘法實現(3 自乘 29 次)
func BenchmarkSimpleMulti(b *testing.B) {
for i := 0; i < b.N; i++ {
var r int64 = 1
var j int64 = 0
for ; j < benchPowP; j++ {
r *= benchPowB
}
}
}
測試結果:
goos: darwin
goarch: amd64
cpu: Intel(R) Core(TM) i7-7700HQ CPU @ 2.80GHz
BenchmarkQuickPow-8 357897716 3.373 ns/op
BenchmarkInnerPow-8 39162492 29.30 ns/op
BenchmarkSimpleMulti-8 121066731 9.549 ns/op
PASS
ok command-line-arguments 4.894s
從效能測試結果看,quick pow 演算法比簡單乘法快了好幾倍,比 math.pow 快了近 10 倍。
所以,如果程式只需要求整數冪,而且能確保計算結果不會越界時,可以考慮使用 quick pow 演算法代替語言內建的浮點函式。