--- tags: 許老師, --- # [小學數學文字分析Jimmy](https://drive.google.com/file/d/1sZY9CeYeDnswZVVWopKiU-xR5C3jkAyJ/view?usp=sharing) Feedback ## Language Analysis 步驟變化 ### 原先五部曲 1. Semantic Labeling 2. Normalization 3. Filtering 4. Reduction 5. Rewriting ### 調整後 1. Rewriting (包含原先五部曲的 Normalization 和 Rewriting) `Jimmy` 2. Semantic Labeling `Kevin` 3. Filtering `Kevin` 4. Reduction `Kevin` p.s. 確認一下,Jimmy的Rewriting 應該不包含 Semantic Labeling 對吧? ## 例子屬於原先哪步驟及一些討論 ### 屬於原先的Normalization #### 1. 拆句 - Before - 小明和小華各拿到3顆、5顆蘋果。 - After - 小明拿到3顆蘋果,小華拿到5顆蘋果。 #### 5. 回填屬性 - Before - 爸爸的年齡比媽媽多幾歲? - After - 爸爸的年齡比媽媽==的年齡==多幾歲? ### 屬於原先的Rewriting #### 2. 回填物件、人稱 - Before - 小明買了5顆蘋果,吃了兩顆, - After - 小明買了5顆蘋果,==小明==吃了兩顆==蘋果==, #### 3. 回填動詞、物件 - Before - 小明喝了兩杯果汁,小華3杯, - After - 小明喝了兩杯果汁,小華==喝了==3杯==果汁==, ### 討論 4. 小明買了兩顆蘋果,每顆20元,(合句) 第二句還是在描述前面的蘋果,無法單獨存在。Jimmy需要將這兩句合成一句 ,也就是將這兩個蘋果的properties都記錄在instance map內。 首先想請教老師理想的合句是變成以下哪個呢? ``` 1. 小明買了兩顆蘋果每顆20元 2. 小明買了兩顆蘋果且每顆20元 3. 小明買了兩顆每顆20元的蘋果 4. 小明買了每顆20元的蘋果兩顆 ``` 再來,我們覺得有以下幾點原因所以可能不太適合合句。 1. 之前出現每單位量在前面的情況,沒有以合句的方式處理,如: ``` 蘋果每顆20元,小明買了兩顆 ``` 而此句和 ``` 小明買了兩顆蘋果,每顆20元 ``` 其實非常類似。 2. 一個條件句理想上是有一個DM,最多兩個。 條件句中若出現三個以上的DM,不論在filtering 或reduction的處理上會更加麻煩,在type下要去access DM取值的rule也要額外考量有三個的狀況。 ``` - 蘋果 - 兩顆(數量) - 每單位量 - 每顆(數量) - 20元(金額) ``` 3. 就解題的角度來看,可能要新增Frame。 e.g. ``` 蘋果每顆20元,小明買了兩顆,共要付多少元? ``` 對應到的type sequence為 `[每單位量_金額]`,`[買]`,`問金額`,則此type sequence的組合可對應到Frame $$ 每單位量_{金額}\times 買=問金額 $$ ``` 小明買了兩顆蘋果,蘋果每顆20元,共要付多少元? ``` 若維持不分句並rewrite,會有類似的type sequence:`[買]`,`[每單位量_金額]`,`問金額`,也可運用上述的Frame。 ``` 小明買了每顆20元的蘋果兩顆,共要付多少元? ``` 但如果合句的話,可能要新增type,像是`[量變每單位量]`之類的,然後相對應的Frame可能也不怎麼具有解釋性 $$ 量變每單位量_{金額}=問金額 $$ 事實上,若是這種有三個以上DM的句子 ``` 小明買了每顆20元的蘋果兩顆 ``` 雖然還沒確切處理過,不過是打算拆開的。