# Weekly Meeting 11/11 --- ## Outline - 待語意組協助標註之資料統計 - 句型統整 - Frame統整 --- ## 待語意組協助標註之資料統計 - 總題數: 5,192 - = 6,674(Training set) - 1,482(Kevin 能解) - 總句數: 17,088 - 平均每題3.3句 ---- - 總類別數: 4,718 - 每題切子句, 用目前43個類別的語意知識先標註列成label sequence - 取每行被label到的語意序列, 且屬於"重要語意標籤.txt"中31個語意標籤為分類依據 ``` [物件] 蘋果汁 蘋果汁[物件] 蘋果也要一樣多 蘋果[物件] 也要 一樣多[等價] ``` ---- - 只含有一個句子的類別數量: 3,133 ``` [問次數] 最少要舀幾次才能舀完 最少[最多最少] 要舀 幾次[問次數] 才能舀完 [人稱] [V] [問數量] [物件] [V] [V] [物件] 她用了幾張獎卡去換筆記本 她[人稱] 用[V] 了 幾張[問數量] 獎卡[物件] 去[V] 換[V] 筆記本[物件] ``` ---- - 沒被分到任一類的句數: 156 ``` 依照相同方向 依照相同方向 洞庭湖面積約4040平方公里 洞[組織和地點] 庭[組織和地點] 湖面積約4040平方公里 ``` --- ## 句型統整 | | | | |:--------:|:------------:|:--------:| | 量變 | 單位限制 | 誰的最多 | | 有 | 才夠 | 誰的最少 | | 屬性 | 單位限制才夠 | 速率 | | 每單位量 | 日期 | 時間 | | 平分 | 較先後 | 追上 | | 兩數差 | 合起來是多少 | 追上時間 | | 夠不夠 | 給予 | 有數隻腳 | ---- 1. 量變 - 增加或減少 - 爸爸買5顆蘋果 2. 有 - 人擁有物件、存在物件的數量DM - 爸爸有5顆蘋果、蘋果有5顆 3. 屬性 => 每單位量 - 物件的非數量DM - 蘋果10元 4. 每單位量 - 單一或兩個物件的兩個DM之間的等價換算 - 一包色紙10元、每3張獎卡可換1本筆記本 ---- 5. 平分 - 均分,除法 - 平分給4個小朋友 6. 兩數差 - 算相差,通常有比...多、比...少 - 瓢蟲比毛毛蟲多幾隻 7. 夠不夠 - 包含"夠不夠"三個字的描述 - 夠不夠綁成3束 ---- 8. 單位限制 - 限定某一個單位一{數|ㄕㄨˇ} - 用10元來付 9. 才夠 - 包含才夠的子句 - 最少要付幾個才夠 10. 單位限制才夠 - 融合了`單位限制`與`才夠`,意即以單位限制的條件下,需要多少個指定物。 - 俊偉大概要準備幾個十元 ---- 11. 日期 - 包含日期的子句 - 小文3月29日生日 12. 較先後 - 比較早或是比較晚 - 誰的生日比較早到 13. 合起來是多少 - "合起來是多少"這六個字,為不指定對象的加總 - 合起來是多少 ---- 14. 給予 - 包含`給予者`、`收受者`、`給予物`的描述 - 小翔把24張遊戲王卡送給安安後 15. 誰的最多 - 誰的`?`最多,包含所有的DM - 誰的錢最多、誰得到的星星最多 16. 誰的最少 - 誰的`?`最少,包含所有的DM - 誰的錢最少、誰得到的星星最少 ---- 17. 速率 - 表示速率的值 - 小文每分鐘走90公尺 18. 時間 - 表示花費的時間 - 小文出發16分鐘後 19. 追上 - 追及問題,表示一種狀態 - 小燕追上小文 ---- 20. 追上時間 - 當相鄰子句的sentence type分別是"追上"、"時間"時,將兩子句合併成"追上時間" - {小文出發16分鐘後|時間}+{小燕追上小文|追上} = {小文出發16分鐘後小燕追上小文|追上時間} 21. 有數隻腳 - 雞兔同籠問題,表示腳的總數 - 農場裡養了兔子和鵝共42隻,==已經知道共有102隻腳==,兔子和鵝各有幾隻? --- ## Frame統整 - Notation - Solving Steps - Conversion - Transformation - New Frame - 單一屬性加減 - 量變的加總 - 追及問題 ---- - 只用到加法的frame的比較 - 單一物件加減 - 單一屬性加減 - 上下位 - 加總 - 量變的加總 - 合起來是多少 - Solving Steps Example - 單一物件加減 - 追及問題 ---- ### Notation - $+_R$ 有下標R代表這不是計算的加,而是regular expression 中代表一個以上之意 - $*_R$ 有下標R代表這不是計算的乘,而是regular expression 中代表零個以上之意 - $()$ 綁定某個group - $(A|B)$ 代表這個group中可以是A或者是B ---- ### Solving Steps 0. Label Sequence 1. Sentence Type Labeling (句型標註) 2. Conversion (看部分句型且部分句型轉變) 1. **量變 to 有** 須符合以下條件: - 量變之agent前面沒有出現過 - 題目要出現過非`量變`的句型 2. **1/1 每單位量刪除** 3. **時間**+**追上** = **追上時間** ---- 3. Transformation (看全部句型且部分或全部句型轉變) - 主要用於Conversion沒有辦法處理的狀況,像是需要看整體的時候。 - Transformation完的結果會對應到Frame的Slot - 有->原有、現有、上位、下位... - 量變->量變 - 速率->慢速、快速 - ... 4. Frame Matching (計算概念對應) 5. Calculation ---- ### New Frame - 單一屬性加減 - $(每單位量|屬性)(\pm量變|-平分)+_R=屬性$ - {一條鐵絲長90公分|每單位量},{做勞作先用去25公分|量變},{捆東西再用去38公分後|量變},{鐵絲剩下幾公分|屬性}? - 170元再加上30元,就有幾元? - "再"、"就"前加逗號 (前處理) - {170元|屬性},{再加上30元|量變},{就有幾元|屬性}? ---- - 量變的加總 - $(量變)+_R=量變$ - 情人花店今天補進了13朵向日葵、24朵鬱金香和19朵玫瑰花,共補進了幾朵花? - 會先經過normalize,將子句分拆出 - {情人花店今天補進了13朵向日葵|量變},{情人花店今天補進了24朵鬱金香|量變},{情人花店今天補進了19朵玫瑰花|量變},{共補進了幾朵花|量變}? ---- - 量變的加總 - $(量變)+_R=量變$ - {情人花店今天補進了13朵向日葵|量變},{情人花店今天補進了24朵鬱金香|量變},{情人花店今天補進了19朵玫瑰花|量變},{共補進了幾朵花|量變}? - 這邊不使用conversion,因為conversion的`量變`轉`有`有兩個前提 1. 量變之agent前面沒有出現過 2. 題目要出現過非`量變`的句型 - 因題目只有量變句型,故不轉換。 ---- - 追及問題 - $慢速, 快速, 追上時間, 先走時間$ - Transformation前: $速率_1, 速率_2, 追上時間, 先走時間$ - Transformation後(將速率分成慢速和快速): $慢速, 快速, 追上時間, 先走時間$ - $\begin{eqnarray} 追及路程 &=& 慢速 \times 先走時間 \\ 追及時間 &=& 追上時間 - 先走時間 \\ 追及路程 &=& (快速 - 慢速) \times 追及時間 \end{eqnarray}$ ---- ### 只用到加法的frame的比較 ---- | | 單一物件加減 | 單一屬性加減 | 上下位 | 加總 | 量變的加總 | 合起來是多少 | | ---------------------- | ------------------------------- | ------------------------------- | --------------------------------- | --------------------------------- | --------------------------------- | ---------------------------------------- | | 是否 同一物件/人的總合 | Y | Y | N | Y | N | 不指定 | | Type Sequence 特徵 | 有<font color="red">量變</font> | 有<font color="red">量變</font> | 沒有<font color="red">量變</font> | 沒有<font color="red">量變</font> | 只有<font color="red">量變</font> | 有 <font color="red">合起來是多少</font> | ---- ### Solving Steps Example ---- #### 單一物件加減 - **Step 1: Sentence Type Labeling** - {8片西瓜|有},{吃了7片|量變},{剩下幾片|有}? - **Step 2: Conversion** - {8片西瓜|有},{吃了7片|量變},{剩下幾片|有}? - **Step 3: Transformation** - {8片西瓜|原有},{吃了7片|量變},{剩下幾片|現有}? ---- - **Step 4: Frame Matching** - 因為有 *原有, 量變, 現有* 這個 sequence - 所以對到 **單一物件加減** 這個frame - **Step 5: Calculation** - $原有-量變=現有$ ---- #### 追及問題 - **Step 1: Sentence Type Labeling** - {在公路上行走|語境},{小文每分鐘走90公尺|速率},{小燕每分鐘走120公尺|速率},{小文先出發|語境},{小文出發16分鐘後|時間},{小燕追上小文|追上},{小文比小燕先出發幾分鐘|先走時間}? ---- - **Step 2: Conversion** - {小文每分鐘走90公尺|速率},{小燕每分鐘走120公尺|速率},{小文出發16分鐘後小燕追上小文|追上時間},{小文比小燕先出發幾分鐘|先走時間}? ---- - **Step 3: Transformation** - {小文每分鐘走90公尺|**慢速**},{小燕每分鐘走120公尺|**快速**},{小文出發16分鐘後小燕追上小文|追上時間},{小文比小燕先出發幾分鐘|先走時間}? ---- - **Step 4: Frame Matching** - 因為有 *慢速, 快速, 追上時間, 先走時間* 這個 sequence - 所以對到 **追及問題** 這個frame ---- - **Step 5: Calculation** - $\begin{eqnarray} 追及路程 &=& 慢速 \times 先走時間 \\ 追及時間 &=& 追上時間 - 先走時間 \\ 追及路程 &=& (快速 - 慢速) \times 追及時間 \end{eqnarray}$
{"metaMigratedAt":"2023-06-15T15:32:51.731Z","metaMigratedFrom":"YAML","title":"Weekly Meeting 11/11","breaks":true,"slideOptions":"{\"transition\":\"slide\"}","contributors":"[{\"id\":\"325cb9a2-2cc4-4308-8e12-b079922d655c\",\"add\":368,\"del\":107},{\"id\":\"35dabed6-7dfb-4ac3-8e6a-858efe91a445\",\"add\":3027,\"del\":208},{\"id\":\"62e36997-69dd-4830-b567-1b6decba8ab1\",\"add\":3159,\"del\":211}]"}
    186 views
   Owned this note