###### tags: `工作週誌` # 第九周週誌 C109154330 洗柏詞 # 摘要: 拆分檔案,使用較小的資料檔案進行操作 # 工作內容: 使用visual studio code進行訓練。 ## 主要需要工具 visual studio code ## 匯入模組 ```python! import numpy as np import pandas as pd import random import torch ``` ## 副程式 ```python! kmu_train_dataset = pd.read_csv(ORIGINAL_TRAIN, sep ='\t',names=names ,header=None) ``` ### 遇到問題: 1. 分隔出來的檔案會跑掉 |![](https://i.imgur.com/i7p96Tk.png)|![](https://i.imgur.com/PMxttdE.png) | | -------- | -------- | ### 解決方法: 1. 詢問學長後,去了解read_csv( )裡的參數代表的意思 ## 主程式 ```python! cutdata.to_csv(f'cut\cut{a}.tsv', index=False ,header=None , sep ='\t' ) for a in range(1,990): cutdata = kmu_train_dataset.loc[a*100-100:a*100,:] cutdata.to_csv(f'cut\cut{a}.tsv', index=False ,header=None , sep ='\t' ) ``` ### 遇到問題: 無 ## 模擬結果 ![](https://i.imgur.com/qxNNqBe.png) # 結論: 他多出一行標題的時候,本來的想法是用drop或replace去移除多的那列,但是都沒有效果,後來去查詢說明,才知道有參數可以設定。