2020q3 Homework3 (quiz3)
contributed by <
1. ASR
考慮到程式碼的相容性,目的是實作一套可跨越平台的 ASR,假設在二補數系統,無論標的環境的 shift 究竟輸出為何,我們的 ASR 總可做到:
-3 是 (-5) / 2 的輸出,並往負無限大的方向前進
fix ^ (fix >> n)
會變成2b'000.....0 ^ 2b'000.....0 = 2b'000.....0
(不影響結果)fix ^ (fix >> n)
會變成2b'111.....1 ^ 2b'000.....1 = 2b'111.....0
( 1 的數量等同 n)2. int __builtin_ctz & int __builtin_clz
用 __builtin_ctz 來實作 LeetCode 342 . Power of Four,假設 int 為 32 位元寬度。實作程式碼如下:
此題是要確認該數字是否為 4 的冪次方,若該數為 4 的冪次方 32bits 中只會有 1 個 bit 為 1 且該 bit 右邊的 bits 數量應該偶數個,
num > 0 && num & (num-1)
首先確認該數是否為正數且只有 1 個 bit 為 1,!(__builtin_ctz(num) & 0x1)
(num & (num - 1))==0
的部分可以使用!(__builtin_popcount(num) ^ 1)
來代替num > 0
,但會因為 undefined behavior噴 compiler error.避免說「噴 compiler error」這樣不精準的話,因為
num > 0
練習 LeetCode 41. First Missing Positive
3. __builtin_popcount
針對 LeetCode 1342. Number of Steps to Reduce a Number to Zero,我們可運用 gcc 內建函式實作,假設 int 寬度為 32 位元,程式碼列表如下:
32 bits 內的 bit = 1 的數量等同要執行 subtract 的次數,因此可以很容易之道
後我們還需要向右移動 1 個 bit,透過__builtin_clz(num)
我們可以找到最左邊的 1 在哪個位置,找到後用31-__builtin_clz(num)
就可以知道應該向右 shift 幾次,所以BBB
.4. 64-bit GCD
考慮以下 64-bit GCD (greatest common divisor, 最大公因數) 求值函式:
gcd(u,v) = 2*gcd(u/2,v/2)
gcd(u,v) = gcd(u/2,v)
gcd(u,v) = gcd(u,v/2)
XXX = v
YYY = u << shift
.透過 __builtin_ctz 改寫
注意到下面的實驗中會將 quiz3 中題目的作法命名為 fast gcd,使用 __builtin_ctz 調整後的版本則稱為 faster gcd 以方便解釋。
for (shift = 0; !((u | v) & 1); shift++)
迴圈可以使用 __builtin_ctz 來改寫為如下:5. bit array
在影像處理中,bit array (也稱 bitset) 廣泛使用,考慮以下程式碼
可用 clz 改寫為效率更高且等價的程式碼:
看向原 Code 第 9 行,目的是要從最右邊的 bit 開始 check 是否為 1,下面改寫的版本把 for 改成 while,
bitset & -bitset
的 2 的補數做 & ,這樣即可得到最右邊 bit 數為 1 且其他 bits 皆為 0 的 bitmap,最後第 12 行是用來將最右邊 1 改為 0,這樣下次__builtin_ctzll(bitset)
就不會找到錯誤的 bit .