--- tags: 會議記錄, Label Sequence --- # 會議記錄 2020/11/11 ### 報告Weekly Meeting 11/11 - hkmd文件: Weekly Meeting 11/11 ### 待語意組協助標注之資料統計 - 以目前定義43種語意類別將6000題題目的所有子句標上label sequence,並且以其中31種對解題重要的label作為分類依據,將所有子句以label sequence分類。其中有些子句因為map的知識尚未建立完整,子句的label sequence不完整,無法跟其他子句分成同一類,才會有些類別只有一個子句。 --- ### 句型統整 - 題目切成一個個子句,標上目前定義共21種的句型類別。 - 針對目前定義的21種句型類別介紹定義和給例子說明。以下是幾個易混淆需注意的事項: - 句型 **才夠** 和 **夠不夠** 的差異 - "才夠"題目的答案是要給一個明確的值(value)。 - e.g. 37元的紅豆湯,用10元來付,最少要付幾個才夠? - "夠不夠"的答案類似於yes/no問句,答案只要回答"夠" 或 "不夠"。 - e.g. 21朵花,每7朵綁成一束,夠不夠綁成3束? - 句型若有合併句子的情況 - 目前定義2種合併規則: 1. 單位限制+才夠 2. 追上+時間 - 說明: 不修改子句內容,只有刪除子句間連接的標點符號並直接合併。執行此動作不在normailize作而是在sentence type labeling後。 --- ### Frame統整 - 解題步驟 - Conversion - 看部分子句,部分子句的句型是否作轉變,目前並定義的規則共3條如下: 1. **量變 to 有**(須同時符合以下兩個條件): - 量變之agent前面沒有出現過 - 題目要出現過非`量變`的句型 - e.g. 小明買3顆蘋果,小明吃了2顆 (其中"買"的子句會從**量變**轉成**有**) 2. **1/1 每單位量刪除** - 雖是每單位量但不影響計算 - e.g. 1人分1杯飲料 3. **時間**+**追上** = **追上時間** - Transformation - 看全部子句,轉全部或部分句型,目的要將句型轉成可以對應的frame的slot,並且是依label sequence也就是看value依據轉換。像是如何把"有"變成"現有" 或 "原有",是根據子句中有"剩下"的描述當作"現有",另一個"有"就當"原有"。還有不在Coversion之前作是因為可能會影響Coversion的規則(e.g. **量變 to 有**) - 易混淆的frame--平分: - 在有些題目會被當作除法或是減法,當作除法時是依據問句中有提到"每個人...",其餘當作是減法。 --- ### 接下來的進度 - 有關標註和題型分類 - 先將所有題目句子以題型依據分類,主要對複雜、應用題為主(e.g. 雞兔同籠、追及問題)。利用keyword search找出哪些題目屬於哪一類。 - 以題型分類完成後,每類題型先選一兩題作好label sequence,包含缺少的知識點也補上,之後再把該類題型剩餘的題目請語意組協助標注,讓語意組能以我們事先標注好的題目為範例並建立map。 - 製作兩個工具: 滾動式label、自動分類題型 - 滾動式label: 一次先自動標注1000個子句後,若發現要修改或新增的label,就馬上修改label。修改後再重跑之前已標注的子句,檢查之前是否有錯,沒有的話就繼續標下一份1000個子句。 - 自動分類題型: 針對新的、未分類的句子,依題型分類產生的各自keyword,利用keyword search來決定新的句子類別,再作後續label sequence等解題步驟。 - 有關解題步驟 - 是否將Conversion和Transformation合併成一個步驟?內部的運作像是否看部分或整體的句子再討論 - 有關frame--追及問題 - 在Transformation階段會將兩個速率的子句,區分出"慢速"、"快速"。在Frame Matching對應到追及問題有一樣的四個slot後,最後在Calculation作運算。 - 需要討論的問題: - 目前以多個算式表示一個frame,雖然方便生產解釋,但缺點是這樣的frame可能不夠一般化,只能對應追及問題的部分題型,無法包辦所有追及問題。在Calculation階段可能需要先寫一個通用的追及問題的固定公式後,再對不同計算過程(同樣是追及問題,但是子句組成或是問的答案不同)當作子類別,並用多個條件區分子類別作其他運算。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up