LHB阿好伯, Jan 30, 2019 06:48 PM
Image Not Showing Possible ReasonsLearn More →
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
R
class()
R內建的class(x)
可以用來判斷資料類型
首先可以分為下面6種資料類型
Data Type | Example | 備註 |
---|---|---|
Logical 邏輯值 | TRUE, FALSE | 邏輯判斷結果 |
Numeric 浮點數 | 1, 2.3, 4567890 | 多數數字為浮點數,為計算機儲存數字資料所產生的 |
Integer 整數 | 1L, 2L, 34L | 避免浮點數就在整數後面加上大寫L |
Coplex 複數 | 3 + 2i | |
Charater 字串 | 'a', "TURE", "12.3" | 字串都由兩個雙引號或單引號所包覆 |
Raw 原始 | "Hello" = 48 65 6c 6c 6f | 16 進制表示法 |
data.frame 資料框架 | 可以儲存不同變數類型的資料的資料結構,多為矩陣類型,一行為一變數資料 | |
factor因子 | ||
list列表 | ||
matrix矩陣 | ||
functione公式 |
在R內建的數值運算上是有限制的
R 的 .Machine
這個內建變數中有一些關於數值資料的資訊
這些資訊可能會因為不同的電腦而有不同(不過對大多數的電腦而言,通常都是一樣的)
以下是跟一般使用者比較相關的數值。
.Machine$double.xmax
與 .Machine$double.xmin
分別表示目前 R 所能處理的最大浮點數與最小正浮點數:
2147483647 這個值就等於 231 −1
如果需要更高精度的數值運算可以使用 Rmpfr 這個套件
而如果是大數運算,則可以使用 brobdingnab 套件。
而浮點數大家可以去查看看,對他了解是一種電腦存檔所產生問題
在某些運算時可能回造成與我們預期解果不同
多數程式語言都會有問題
但也都有解決方法
看是使用套件Rmpfr或是換個方式判斷結果
例如用R計算((0.81 * 0.1) + (0.09 * (-0.9)))
理論上是0但結果會得到1.387779e-17
那這時可以像是以有效位數的方式擷取到小數點後兩位
或是做判斷是不是 -0.01 < x < 0.01
一個可以接受的誤差範圍去做區分
data frame 是一個用來儲存類似 Excel 表格的變數類型它跟矩陣類似
不過 data frame 的每個行(column)可以儲存不同變數類型的資料
甚至非狀巢結構的列表亦可
像是很有名的 iris 資料集就是data frame的資料
我們可以使用 data.frame
函數來建立 data frame 變數
在EXCEL中可以去除重複值而在R中當然也行只需要使用到unique()即可
先隨機抽樣30個英文字母作為樣本
在R中可以快速地進行簡單的數據間交集離集等操作
R程式語言的基礎:物件
吳漢銘 國立臺北大學 統計學系
G. T. Wang
統計之都