# 資料D10:Pandas DataFrame資料選取 https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html ## 利用欄位名稱/列索引選取整行/列資料 DataFrame名稱[欄位名稱] 得到某一欄位資料 DataFrame名稱[[欄位名稱1,名稱2...]] 得到某些欄的資料(這些欄位要用中括號再框一次 DataFrame名稱[a:b] 得到a-1~b-2行資料(不能只輸入一個數字,可用a:a+1代表,終點可省略,若想要指定間隔c,後面再:c) ## 選取特定欄位的資料 DataDrame名稱.loc[列索引名稱, 欄索引名稱] 得到某些欄位的資料,超過一個的話要再用[]包起來 DataDrame名稱.iloc[列索引位置, 欄索引位置] 得到某些欄位的資料,超過一個的話要再用[]包起來 若以上都只有一個點,可用at以及iat ## 利用遮罩選取資料 DataFrame名稱[關於DataFrame的條件式] 例如 df[df > 2] 不符合條件的格子會NAN DataFrame名稱[關於DataFrame[某欄位]的條件式] 例如 df[df["A"]>2] 列出符合的行 (如果光是中括號裡面,則是一個真值表) ** 且或 要分別用&|隔開 ###### tags: `資料科學馬拉松` `python`