# 第十二週 5/2 ## 資料視覺化 可以將讀出來的資料用各種圖像展現出來 ### 散佈圖 ``` xx=[] yy=[] plt.plot([0,1], linestyle = 'dotted') #散佈圖 plt.scatter(x=xx,y=yy,s=0.1) plt.axis('square') plt.xlim(0,1) plt.ylim(0,1) ``` ![](https://i.imgur.com/US7rmlL.png) ### 直方圖 ``` x=(4,2,4,5,6,7,7,8,0,2) plt.hist(x, bins=10) plt.show() ``` ![](https://i.imgur.com/64BCQbG.png) ## 羅倫茲曲線 羅倫茲曲線是在過往財富分配數據上建立的累積分布函數所對應的曲線,可以用python的語法將圖畫出來。 ``` dfLorenz=dfIncome[:] se=dfLorenz['Income'].sort_values() cumulativeSum=0 i=0 # 宣告xx為串列變數 xx=[] # 宣告yy為串列變數 yy=[] # 手動追蹤看看 for x in se: i=i+1 cumulativeSum+=x xx.append(i/n) yy.append(cumulativeSum/sum) plt.plot([0,1], linestyle = 'dotted') #散佈圖 plt.scatter(x=xx,y=yy,s=0.1) plt.axis('square') plt.xlim(0,1) plt.ylim(0,1) print('羅倫茲曲線(Lorenz curve)') plt.show() ``` ![](https://i.imgur.com/ebpxxiv.png) ## 吉尼係數 吉尼係數根據羅倫茲曲線所定義的判斷年所得分配公平程度的指標,我們也能用程式來計算出它來。 ``` R=np.trapz(x=xx,y=yy) A=0.5-R G=A/(A+R) print(G) #答案 0.46011844647436917 ```