contributed by <TotallyWrong
>
TotallyWrong
On going
CPU : Intel Core i5-5200U
Cache size: L1 Cache 128KB, L2 Cache 512K, L3 Cache 3072KB
Operating System : Ubuntu 15.10 Wily Werewolf
Feature:
再測試過原始的圓周程式後,得到的結果如下圖而Baseline的結果是最差的而結果最好的是AVX+Urolling。 而OMP2 thread 結果似乎比OMP4好,但是我懷疑這是因為我的電腦腦是二核心的,
因為不管幾個線程最終還是只有二核。
這是我寫出來採用萊布尼茨公式的結果,而可以看出OMP2和4的效果是最好似乎這種算法是比較有利平行化。但是OMP2和4還是很相進甚至OMP2的效果可能更好一點看來有4個線程和有四核心還是不同的事情
放在一起萊布尼茨的OMP2效果是最好的