--- tags: 會議記錄, Label Sequence --- # 會議記錄 2021/04/27(與呂老師) ## 確認資料 - 許老師版: top patern example的投影片是暑假舊版。 - 呂老師版: 圓餅圖是最新資料統計的結果,以此版本為主。 --- ## 碩士論文 - 自然語言是序列性資料,如果把問題拆開成數個子句後,就會損失資訊。 - 可以把子句序列想成一種ngram的pattern。 - AI發展到現在,需要有人機互動。所以以人為本的AI特別重要,尤其是教育。 - 不是在我們系統的資料也要能夠分析成功。 - 加入PBA方法。 - 俊達 - 題型的分類是依據底層的label來分的,但是如果底層的label如果無法清楚區分,題型分類會變得困難。 - 分類可以把語言的序列性以及完整的題目當作feature。 - 可以先把raw data做clustering或其他data mining方式,觀察資料的分布在定義要分成幾類。 - 基本題也可以用應用題一樣,依關鍵字分類。 - 若芸 - 二步驟算法(pattern)的解釋,如果是多步驟的話就當作多個pattern,不斷合併成最精簡的二步驟算法。 - 以QA方式做解釋,而非寫作文方式(太囉嗦了)來解釋題目。 - related work: pattern、QA、education。 - 皇穀 - LSA可請呂老師協助。 - 可以參考加入ontology概念、架構,當作一個related work。 - 像是人生,也會有很多種的情境,可以納入思考,不要只執著於MWP的collocations。 --- ## 待處理 - 在label_sequence_table_list (marked).xlsx裡有哪幾項label pattern是還會再做縮減(reduction、filitering...)等規則,整理列表完提供給呂老師。 - PBA要寫清楚 --- ## 待討論 - 英文文法會有時態表示,從英文題目觀察哪一句是"原有"、"現有"關係。中文題目也可以利用rewrite用副詞表示時態,幫助辨識哪句是"原有"還是"現有",也可以幫助解釋說明題目進行的時序。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up