# 來自<<真確>> 第一章的靈感: ## 由數據呈現來理解Lebesgue 積分 ##### Editor: Jayfish(杰魚仔) ###### tags: `book reading` --- 在<<真確>>第一章提及大眾不該再用二分法來區分世界觀,如開發中國家、已開發國家等詞。書中提出四分法世界來幫助大家更精確理解世界。但我認為更好的方法是以數據分布來理解數據、理解世界 **在分類方法中,本路人突然有一靈感讓未來數據呈現能有更不一樣的發展** - Note: 雖然這樣致命的缺點是資訊量太大,不容易被記住。印象深刻與資訊複雜是我認為的一種trade-off。 ## 靈感的起源 當我們要呈現每日人均所得與對應之世界人數關係圖,若以四分法來呈現或許可以繪製成以下圖表:  - y 縱軸代表每日所得 - x 橫軸代表有多少人(十億)再該對應所得 - Note: 數字非真實數字 則 當我們想知道全世界每日所得總合時可以利用計算面積的方式來估計: **總所得 =加總{每十億人 乘 這十億人的估計日均所得}** **= 加總{每一單位X 乘以 對應的估計Y}** **= $\Sigma_{i=1}^{8} x_iy_i$** **= $\ 2+10+10+10+20+20+20+20$** **= 112** 估計的每日世界所得大約為 1120億 ## 靈感的延續 但有時製圖的人會想把折現圖、圓餅圖、長條圖等等換來換去;主要原因可能來自圖表呈現感受(報告容易亂騙觀眾)、個人偏好(主管偏好、規定要求等)、好玩愛亂想(像我一樣)等理由。 而其種一種圖表的變化來自於橫軸或縱軸尺度的變化: 例如若上述日均所的圖表轉為以人數 2的X次方來畫可能所獲得的圖表如下:  - 簡易解釋如下 - 2的0次為 1;第一個十億人日均所得約 2 元 - 2的1次為 2; 第二個十億人 日均所得約 10 元 - 2的2次為 4; 第三個十億人至第四個十億人 日均所得也是 10 元 - 2的3次為 8;第五個十億人至第八個十億人 日均所得約 20 元 同樣的當我們要計算世界每日所得時可以利用面積算法估計: *可能直覺的計算方式* **總所得 = 加總{每一單位X 乘以 對應的估計Y}** **= 2+10+10+20** **= 42** 很快的會發現絕對不是這樣算,因為世界每日所得應該不太會因為繪製圖表時由呈現感受、個人偏好、好玩愛亂想等因素所做得轉換而有所變化。 上述計算出錯誤的420億,主要源自於這次計算少考慮轉換的效果,也可以當作是利用x軸表示法來測量人數時測錯所導致的。 在轉換過的圖中每一單位x其實代表的人數不是原始圖的10億人;而是以下 - 第一個單位是十億人 - 第二個單位是2的1次減2的0次 = 1,代表10億人 - 第二個單位是2的2次減2的1次 = 2,代表20億人 - 第三個單位是2的3次減2的2次 = 4,代表40億人 *因此正確算法應該是:* **=總所得 = 1(十億人)x2(元)+1(十億人)x10(元)+2(十億人)x10(元)+4(十億人)x20(元)** **= 2+10+20+80** **=112(十億元)** *帶點好玩的進來* 當我們很無聊在秋日的午後故意想扯點數學,我們可以把上述數學化 明顯的原始圖的X軸與第二張圖的X軸轉換為 $x_1 = 2^{x_2}$ 當我們想測出第二個圖橫軸的真實世界正確人數,可能會設計一個 u 函數;沒錯你猜得到的: $\mu (X_2)=2^{X_2}$ 套用第二個圖中的每單位X: $\delta_0 ...\delta_3$ $\mu (\delta_0)=1$ $\mu (\delta_1)=1$ $\mu (\delta_2)=2$ $\mu (\delta_3)=4$ 若我們算總所得的方式為利用不同所得去切割: - 2元以下 - 10元以下至2元上 - 20元以下至10元上 - 20元上 則上述切割分類對應的人數為: - 2元以下 : u(delta_0)=1 - 10元以下至2元上 :u(delta_1+delta_2)=3 - 20元以下至10元上 :u(delta_3)=4 - 20元上 :u(其他) = 0 因此,在估計計算總所得為: **總所得 = 加總{分類人均所得估計 乘 這類人的人數}** **$=2 \mu (\delta_0)+10 \mu (\delta_1+\delta_2)+20 u(\delta_3)$** **= 2x1+10x3+20x4** **=112** 上面所用的方法,與本路人所知Labesgue所用積分概念相同。 第一步:對y分類切割 第二步:收集每個分類y所對應的x 第三部:加總每個分類中y與測出的x值量的乘積 這樣概念的好處直覺上可以想成x數據更有彈性,x與y的關係更有彈性。數學上可能會可慮每個分類收集到的X的可數性等等bla bla bla的性質,太多的學術數學名詞不在本篇路人對話考量範圍內。 ## 靈感的結尾 在2010年起數據的使用、萃取及呈現成為熱門領域,若希望自己更精確的學習以及理解世界上的資訊,如同<<真確>>所述二分法已不再適用。四分法、光譜類呈現、降維等方法可能更能展現數據本質。若有一套適用於這20年分析數據、呈現數據的方法勢必能縮減研究者、實務者時間。**例如,大眾可能對鐘型分配、常態分配理解最深;若能將各種數據皆繪製成標準鐘形圖,而改變y軸及X軸尺度或許能讓圖表使用者更快速理解數據的本質及方便比較。** 當大家慣用上述例子時,計算上對於x軸的測量將更為寬廣;本路人料想將有更多人能理解及上手Labague積分的意義;或許能對本路人所幻想**更未來的**世界更進一步。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up