--- title: 20220912 Data tags: tools --- # 資料與大數據高速運算支援 :::info Editted by Prof. Huei-Wen Teng at NYCU. Last update: 2021/10/29. ::: ## 資料 You can find any data you like! ### 常用資料來源 1. [Kaggle](https://www.kaggle.com/datasets) 2. [UCI](https://archive.ics.uci.edu/ml/index.php) ### 國內公開資料平台 1. [政府資料開放平臺](http://data.gov.tw) 2. [台灣證交所(TWSE)](http://www.tse.com.tw/zh/) 3. [公開資料觀測站](http://mops.twse.com.tw/mops/web/index) ### 國外公開資料平台 1. [NYC Open Data](https://data.cityofnewyork.us/data) 2. [Data.gov](http://catalog.data.gov/dataset) 3. [UN Data](http://data.un.org/): Face recognition, collaborative filtering, web ranking (see bottom, under "Projects") 4. [20 Newsgroups](http://qwone.com/~jason/20Newsgroups/) 5. [Blogs (with spam labels)](http://ebiquity.umbc.edu/resource/html/id/212/Splog-Blog-Dataset) 6. [Enron e-mail data set](http://www.cs.cmu.edu/~enron/) (see also [here](http://www.cs.cmu.edu/~einat/datasets.html)) 7. [Congress voting records](http://www.govtrack.us/developers/data) 8. [Twitter, Slashdot, etc.](http://caw2.barcelonamedia.org/node/7) 9. [NYTimes news articles](http://archive.ics.uci.edu/ml/datasets/Bag+of+Words) ### 陽明交大資財系購買以下資料庫 1. 台灣經濟新報,Taiwan Economics Journal ([TEJ](https://hackmd.io/X1aElLDVQZeHOhLA9w-SQA)) 2. [WRDS](https://hackmd.io/fXT3POGtQ5aXuENC8BB3Gw) ## 大數據及高速運算支援 若資料過於龐大(ex. 3000多萬筆的玉山銀行競賽資料),可考慮使用 [國網中心:註冊說明](https://hackmd.io/HXY75BRpRzimkWdClAbuLw) <!-- 2. :construction: pytorch -->