###### tags: `工作週誌` # 第九周週誌 C109154330 洗柏詞 # 摘要: 拆分檔案,使用較小的資料檔案進行操作 # 工作內容: 使用visual studio code進行訓練。 ## 主要需要工具 visual studio code ## 匯入模組 ```python! import numpy as np import pandas as pd import random import torch ``` ## 副程式 ```python! kmu_train_dataset = pd.read_csv(ORIGINAL_TRAIN, sep ='\t',names=names ,header=None) ``` ### 遇到問題: 1. 分隔出來的檔案會跑掉 || | | -------- | -------- | ### 解決方法: 1. 詢問學長後,去了解read_csv( )裡的參數代表的意思 ## 主程式 ```python! cutdata.to_csv(f'cut\cut{a}.tsv', index=False ,header=None , sep ='\t' ) for a in range(1,990): cutdata = kmu_train_dataset.loc[a*100-100:a*100,:] cutdata.to_csv(f'cut\cut{a}.tsv', index=False ,header=None , sep ='\t' ) ``` ### 遇到問題: 無 ## 模擬結果  # 結論: 他多出一行標題的時候,本來的想法是用drop或replace去移除多的那列,但是都沒有效果,後來去查詢說明,才知道有參數可以設定。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up