<style> div.ui-view-area{ background-color: black; color: white; } h1.part {color: yellow;} h2.part {color: yellow;} h3.part {color: yellow;} h4.part {color: yellow;} h5.part {color: yellow;} h6.part {color: yellow;} .shell{ color: red; font-size:125% } .dollar{ color: cyan; font-size:125% } </style> # 2016q3 Homework1 (raytracing) contributed by <`Jim00000`> ## 作業說明 * [成大wiki](http://wiki.csie.ncku.edu.tw/sysprog/schedule) * [A02: raytracing](https://hackmd.io/s/B1W5AWza) * [2016q3 Homework1 (作業區)](https://hackmd.io/s/H1B7-hGp) ## 設定目標 - [x] 學習gprof - [x] 學習gcov - [ ] 善用loop unrolling - [ ] 善用POSIX Thread - [ ] 善用OpenMP - [ ] 善用software pipelining ## 開發環境 ubuntu 16.04 LTS <font class="dollar">$ </font><font class="shell" >lscpu</font> ``` Architecture: x86_64 CPU 作業模式: 32-bit, 64-bit Byte Order: Little Endian CPU(s): 8 On-line CPU(s) list: 0-7 每核心執行緒數:2 每通訊端核心數:4 Socket(s): 1 NUMA 節點: 1 供應商識別號: GenuineIntel CPU 家族: 6 型號: 58 Model name: Intel(R) Core(TM) i7-3630QM CPU @ 2.40GHz CPU MHz: 1263.750 CPU max MHz: 3400.0000 CPU min MHz: 1200.0000 BogoMIPS: 4789.11 虛擬: VT-x L1d 快取: 32K L1i 快取: 32K L2 快取: 256K L3 快取: 6144K NUMA node0 CPU(s): 0-7 ``` ## 學習gprof * 參考文章:https://sourceware.org/binutils/docs/gprof/ 範例程式: ```clike= #include <stdio.h> #define ITER 20 int increment(const int num); int main(void) { int num = 0; for(int i = 0; i < ITER ; i++){ num += increment(num); } return 0; } int increment(const int num) { return num + 1; } ``` 然後在編譯時加入下列編譯器指令<font class="shell"> -g -pg </font> 編譯範例:<font class="dollar">$</font><font class="shell">gcc -std=gnu99 -g -Wall -Wextra -O0 -pg -c main.c -o main.o</font> 如果有使用shared library要加入<font class="shell">-static-libgcc</font> 讓程式執行一次產生gmon.out檔,再使用gprof <font class="dollar">$</font><font class="shell">gprof a.out</font> ``` % cumulative self self total time seconds seconds calls Ts/call Ts/call name 0.00 0.00 0.00 20 0.00 0.00 increment ``` 我們需要觀察的一些要素是time,self seconds,calls和name * time * 程式使用在此函式所花的時間百分比 * self seconds * 程式使用在此函式所花的時間 可以加入<font class="shell">-Q</font>讓gprof產生比較簡潔的資訊 也有Line By Line Profiling的選項 加入<font class="shell">-l</font>讓每個function後出現在source file的哪裡被使用 ``` % cumulative self self total time seconds seconds calls Ts/call Ts/call name 0.00 0.00 0.00 20 0.00 0.00 increment (main.c:17 @ 400671) ``` 使用gcov程式來分析Line By Line Profiling會是更恰當的方法 簡而言之可以使用gprof找出程式熱點所在,並找出特定佔有高百分比時間的函式做改善 ## 學習gcov 參考資料:https://gcc.gnu.org/onlinedocs/gcc/Gcov.html gcov是一個用來測試code coverage的工具,以下節錄自官方對gcov功能的定義 * how often each line of code executes * what lines of code are actually executed * how much computing time each section of code uses 網站推薦與gprof搭配使用,很顯然地,gcov適合用來分析小範圍的code,而gprof分析整體程式的效能 使用gcov的話就不能開啟編譯器最佳化,程式碼也須少用marco 使用方式如下: <font class="dollar">$</font><font class="shell">gcc -O0 -fprofile-arcs -ftest-coverage main.c</font> <font class="dollar">$</font><font class="shell">./a.out</font> <font class="dollar">$</font><font class="shell">gcov main.c</font> 以上步驟可以產生出main.c.gcov的分析檔 ``` -: 0:Source:main.c -: 0:Graph:main.gcno -: 0:Data:main.gcda -: 0:Runs:1 -: 0:Programs:1 -: 1:#include <stdio.h> -: 2: -: 3:#define ITER 20 -: 4: -: 5:int increment(const int num); -: 6: 1: 7:int main(void) -: 8:{ 1: 9: int num = 0; 21: 10: for(int i = 0; i < ITER ; i++){ 20: 11: num += increment(num); -: 12: } 1: 13: return 0; -: 14:} -: 15: 20: 16:int increment(const int num) -: 17:{ 20: 18: return num + 1; -: 19:} ``` 這檔案就很有分析價值了,可以針對程式的小細節做最佳化 當然,還有一些參數指令可以下 * -b * 可以查看branch