# 5.1 Multivariate Data ## 背景 在前一章,我們討論了對 classification 和 regression 的 parametric approach,而在這一章裡,我們要 generalize 到 multivariate case,也就是我們會有: - input $\Rightarrow$ multiple inputs > input 可能為 discrete 或 numeric - output $\Rightarrow$ class code / continuous output > output 是這些 inputs 的 function 我們會學到要怎麼從一個 labeled 的 multivariate sample 中去 learn 這些 functions,以及要怎麼透過手邊的 data 去 fine-tune function 的 complexity。 --- ## 用矩陣表示 sample 在很多應用裡面,我們會對每個 individual 做出很多 measurements,或是我們的 event 產生的是一個 observation vector。 因此,我們就可以把 sample 用矩陣表示。 說明和例子如下圖: ![image](https://hackmd.io/_uploads/B1qx82P_C.png) ## multivariate analysis 的目的 通常這些 variables 之間是 correlated。 > 畢竟如果這些 variables 之間沒有關連性,那麼我們也不需要去分析了。 那我們的目標可能會是: - simplification:透過特定的方法,用少量的 parameters 去歸納總結這些大量的 data。 - exploratory:產生關於這些 data 的 hypotheses。 - 某些應用裡,我們有興趣的是透過其他的 variables 來預測某一個 variable 的值。 > 如果 predicted variable ++discrete++,那就是 <font color = "snake">multivariate classification</font>;如果是 ++numeric++,那就是 <font color = "snake">multivariate regression</font>。 這一節就簡單介紹到這裡。