# LCW Code [TOC] ## 檔案敘述 - **SP500_nasdaq100.csv** : csv 包含所有 S&P 500 和 Nasdaq 的公司 ``` // Attribute id (empty) 公司縮寫(Symbol) 公司名子(Name1) 公司部門(Sector) ``` - **extract_reuters.py** : 從路透社(reuters.com)平行抓取資料 - **extract_wsj.py** : 從華爾街抓資料 - **data_process.py** : 對收集到的資料進行處理 - **doc2vec.py** : 將文章向量化 - **list_firm.csv** : 所有公司對應的 csv ( 對應的 csv 在 firm_csv_folder_old 資料夾 ) - **create_dataset.py** : A script to create our 4 dimensions dataset for each company - **picklizer** : A script to make pickle file of all press articles for each firm ###### tags: `paper code`
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up