# Experiment - Text Summarization <!-- f1 score summary format: | | Naive | Kmeans | Azure Language Service | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | | | | | --> ### 摘要方法 - Naive Summarization - 使用tfidf挑出關鍵字後,以此為參考來賦予每個句子分數,並挑出分數高於平均的句子作為摘要結果。 - Kmeans Summarization - 將句子使用 pretrained model `paraphrase-xlm-r-multilingual-v1`做embedding後做Kmeans,再從各cluster中挑出代表句來組成摘要。 - Azure Language Service & openai - 這兩個方法都是使用微軟提供的api直接做生成式的摘要。 ### Metrics 採用f1 score作為衡量表現的方法,計算方式如下: - precision: 產出之summary的字出現在自訂summary中的比例 - recall: 自訂summary的字出現在產出之summary中的比例 - `f1 = 2 * (precision * recall) / (precision + recall)` ### 實驗結果 <details> <summary>佩洛西訪台</summary> :::info Summary: 美國聯邦眾議院議長裴洛西(Nancy Pelosi)率團展開亞洲行,訪團於8月2日抵達松山機場,並且於3日與總統蔡英文會面。不過裴洛西要在台灣停留一事,讓中國相當不滿,不停進行軍事恫嚇威脅。 ::: #### Naive 新華社萬字長文列11點「事實」針對美國眾議院議長裴洛西月初訪台,中國大陸不僅在台灣周邊展開大規模軍事演習,宣布制裁裴洛西及其直系親屬,並對美國實施取消安排中美兩軍戰區領導通話等八項反制措施,在國際社會引發不少批評的聲音。裴洛西月初訪台過了25天…新華社仍在發動學者砲轟美國對台政策美國眾議院議長裴洛西(大陸譯為「佩洛西」)月初訪台後,儘管北京當局採取軍事、外交、經濟等手段對台美實施報復,卻未能阻止美國政界人士持續來台。 f1 score: 0.42 #### Kmeans ”現在,美國眾議院議長佩洛西的歷史性訪台行程已經結束。有一位網友回應她說,如同韓國,在朝鮮(即北韓)導彈的陰影下數十年,面對戰爭威嚇,並不恐懼,而是習慣了。1624年,荷蘭殖民者侵佔台灣南部。◆聯大第2758號決議確認了一個中國原則,得到國際社會普遍遵循。 f1 score: 0.3895855472901169 #### Azure Language Service 為此,新華社25日凌晨3時許發布萬字長文:「佩洛西竄台的若干事實」,為北京當局一連串的軍事、外交回應辯護。我們有必要擺出事實,正本清源,讓美國霸權本質和強盜邏輯無處遁形。美台勾連挑釁在先,中方正當防衛在後。所以,這意味著宏觀的、大的政策沒有改變,但雙方執行政策的方式變了,這意味著對抗正變得越來越激烈。 f1 score: 0.2811619070964579 #### OpenAI 議長佩洛西可能訪台的消息一出,立刻引發中美關係微妙的新一輪演變。先前根據媒體報道,佩洛西將駕著小飛機,由新加坡飛至台北榮總的空軍基地台中長榮機場,然後乘小巴前往台南北都,無論如何都絕不容許兩岸關係發生微妙的變化。至於佩洛西是否會 f1 score: 0.2980588603631809 | | Naive | ==Kmeans== | Azure Language Service | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.42 | 0.39 | 0.28 | 0.30 | </details> <details> <summary>烏俄戰爭</summary> :::info 2022年2月24日,俄羅斯總統普丁以「非軍事化、去納粹化」的理由,派遣俄軍入侵烏克蘭領土。 ::: #### Naive 和平尚未到來:烏克蘭獨立紀念日的俄軍轟炸與戰爭迷霧【2022.8.25烏克蘭】「俄國入侵烏克蘭已6個月,戰爭是否有機會終結?烏克蘭總統澤倫斯基(VolodymyrZelensky)在向聯合國安理會視訊談話時,提及了此事,他強調烏克蘭將讓俄羅斯為其所造成的一切傷害付出代價,重申烏克蘭不會放棄抵抗俄羅斯的自由之戰,並誓言奪回2014年落入俄羅斯控制的克里米亞半島。強生此行,宣布英國將提供烏克蘭價值5,400萬英鎊的軍事援助,包括無人偵查系統和導彈系統,當中包括850架黑色大黃蜂(Black f1 score: 0.4286612193588938 #### Kmeans 新國科會首任主委吳政忠在致詞開頭即強調「部會合作」的組織核心,表示「科技不只是科技,科技與經濟、社會、環境等面相都有密切的關係」,也因此不應侷限於某個部分,應當是多個部會、學術界、產業界等攜手合作推動。俄國越想把烏克蘭納入自己的軌道,烏克蘭人民的民族認同感就越強。 f1 score: 0.25 #### Azure Language Service 和平尚未到來:烏克蘭獨立紀念日的俄軍轟炸與戰爭迷霧【2022.」2022年8月24日是烏克蘭獨立31年紀念日,同時也是俄羅斯入侵屆滿6個月。在獨立日當日,俄羅斯再度發動砲轟,襲擊烏克蘭東部城鎮查普林(Chaplyne),造成22人死亡、50人受傷;而即將卸任的英國首相強生(BorisJohnson)亦選在烏克蘭獨立日訪問基輔,同時宣布英國提供價值5,400萬英鎊的軍事援助,緊隨在美國統拜登宣布的30億美元援助之後。24日當日,俄軍以火箭彈襲擊烏克蘭東部城鎮查普林火車站,其中有火箭彈擊中火車,造成火車車廂起火燃燒;針對查普林的攻擊造成至少22人死亡、其中5人在火車車廂中被燒死,還有50人受傷。 f1 score: 0.41293122801766075 #### OpenAI 1.俄羅斯經濟倒退四年,正迎來最長的衰退期,GDP估降4.7%。2.英國情報單位指出,烏俄戰爭即將進入新階段,部署BTG到克里米亞,俄方意圖對烏克蘭進行特別軍事行動。3.北約秘書長延斯·斯托爾滕貝格近日受訪表示,在俄羅斯總統普丁發起特別軍事行動後,北約組織便決定幫助烏克蘭,讓衝突不再擴大。 f1 score: 0.394026811471237 | | ==Naive== | Kmeans | Azure Language Service | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.43 | 0.25 | 0.41 | 0.39 | </details> <details> <summary>普悠瑪事件</summary> :::info 2018年10月21日下午4:50分在台鐵宜蘭線的蘇澳鎮新馬車站旁發生的普悠瑪自強號列車脫軌事故。事故全車共有366人,18人死亡,215人輕重傷,133人未受傷。 ::: #### Naive 台鐵賠償雙標普悠瑪家屬嘆情何以堪交通部前天同意台鐵支付太魯閣號事故罹難者家屬逾一點五億懲罰性賠償金,普悠瑪號事故中除罹難者家屬董小羚不滿台鐵雙標,感嘆「都是命喪台鐵,情何以堪?普悠瑪號事故3周年董小羚談司機被判刑:對國家很失望前年10月21日台鐵普悠瑪號在新馬站翻覆,釀18死、291傷事故,今天滿三周年。她說,對國家感到很失望,絕對不該由一人承擔。董小羚說,三年前事故發生後選擇原諒司機,卻是原諒台鐵背後更大共犯結構。 f1 score: 0.44708029197080296 #### Kmeans 我們想讓你知道的是我們同情這位駕駛的不幸遭遇,但是真相不等於想像,現實的殘酷是無可奈何。我們看到立法委員的爆料打臉,覺得大快人心,但是再精良的設備,也敵不過毫無風險意識的駕駛方式。他拍明星名人,也拍主流視野外的酷兒族群與文化場景。用色彩撞破刻板分界,讓符號與畫面一起說故事登曼波在成為攝影師之前從事的是電影與廣告美術,這些經歷都轉化成他影像創作上的養分。 f1 score: 0.19128586609989376 #### Azure Language Service 406次普悠瑪無動力、基隆八堵號誌異常臉書社團「合鐵事故通報平台」指出,406次普悠瑪自強號於三民車=瑞穗車站間,發生機械異常事件,造成該車次及台東線部分班次延遲。台鐵局說,初步了解,ATP地上感應子故障,停在中性區間,沒有動力,移開後重新升弓就好。台鐵局說,疑似是黃燈故障。」傷者也表達「感覺差很多」。 f1 score: 0.39753282928770395 #### OpenAI 這篇文章主要討論台鐵太魯閣號事故的緣起。文章指出,工程車滑落引起重大傷亡,業主單位是交通部所屬的「台灣鐵路局」,列車損毀,「台灣鐵路局」也是苦主之一,肇事原因非「交通秩序、交通設備故障、交通安全問題」而是「公安事故」,工程業主和受害苦主都是「台灣鐵路局」,鐵路局又是「交通部」的所屬的事業單位,所以交通部「責任統包」?但工安問題的業管單位是「公共工程委員會」,「公共工程委員會」和「交通部」都是隸屬行政院下的一級機關,上次普悠瑪號調查單位是「國家運輸安全委員 f1 score: 0.2699934829159296 | | ==Naive== | Kmeans | Azure Language Service | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.45 | 0.19 | 0.40 | 0.27 | </details> <details> <summary>鄭捷殺人</summary> :::info 2014年5月21日下午,於台北捷運發生隨機殺人事件。兇手鄭捷持摺疊瑞士刀,在臺北捷運板南線的龍山寺站和江子翠站之間的列車上行兇。共造成4死24傷。 ::: #### Naive 「怪罪他人」認知思考,即將犯罪行為的發生歸罪外在因素,包括他人、心情、或喝酒醉等(Barriga&Gibbs,1996)。但是他的生的本能,使其衍生出攻擊的驅力(aggressivedrive),而將自我毀滅轉移至外界目標。註替代殺人:因為自己想死,然後藉由殺人來讓自己被判死或現場遭警方擊斃。看更多和平國際《人性越界.犯罪心理解剖書:首部監所心理教師視角,逼近犯罪行為的起心動念》鄭捷事件後鬆懈?阿伯持剪刀刺人、男乘客亮水果刀 f1 score: 0.24067388688327312 #### Kmeans 而且反社會就是那些壞人都是反社會呀。鄭捷一審、二審皆被判處4個死刑,並褫奪公權終身,最高法院2016年4月22日三審時維持原判定讞,而鄭捷也在最終判決後短短18天、於該年5月10日執行槍決伏法。反社會人格其實不見得每個人都會表現出來,但除了以殘忍的方法來和社會互動外,也有比較輕微的、反社會心態造成的一些投機性的行為,這就可能無時無刻都會發生。 f1 score: 0.3593399877775515 #### Azure Language Service 這類型犯案已被認為是現代社會到處存在的未爆彈,但台灣拿人民稅款揮霍的衙門迄今「司法精神病院」倡議,是應對之策?鄭捷在判決死刑定讞後僅12天,即跨過之前四十餘待槍決死刑犯先斃命,沒人過問鄭捷到底怎麼想,為什麼無動機的隨機犯案?司法機關順應民意的快速槍決鄭捷,但是犯案的原因、下次爆發的種子依然在社會亂竄。平靜的生活只是卑微的請求。 f1 score: 0.30095541401273884 #### OpenAI 2018年2月27日,台北捷運淡水線上的沙鹿站,突然發生與鄭捷類似的刺殺事件。來自林口的紙雕設計師蔣姓男子,在沙鹿站刺傷4名女性,其中一名9歲的小莊,22歲的莊易妍,23歲的陳鈺婷,以及26歲的邱靖雯。小莊和莊易妍身亡,陳鈺婷和邱靖雯則送院治療。目前約莫一個多月,紙雕設計師蔣姓男子在刺傷4 f1 score: 0.45990357177998625 | | Naive | Kmeans | Azure Language Service | ==openAI== | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.24 | 0.36 |0.30 | 0.46 | </details> <details> <summary>龍龍老K</summary> :::info Summary: 脫口秀演員龍龍控訴遭到薩泰爾娛樂《炎上》班底老K霸凌,在台上脫稿演出嘲笑她與前男友賀瓏的關係,事後老K在直播上暗諷龍龍,脫口秀演員東區德還脫口而出「因為被賀瓏X過,所以整個個性扭曲了」。 ::: #### Naive 老K復出:不會被限制2022-02-2119:12聯合報記者林士傑/即時報導融合脫口秀、嘻哈音樂的「造音少年3!」老K去年和龍龍發生紛爭,爾後退出薩泰爾沉寂至今,他說:「確實事件過後有刻意停止一段時間的公開演出,倒不是因為掙扎或被打擊,而是不希望任何演出因為這件事被模糊焦點,所以才空白了一段時間。「高級玩家」由RedColorG、小Q、JCat、Lambo組成,是倪重華一手栽培的嘻哈團體,團員非常興奮可以受邀演出,也盡全力準備精彩樂曲「Got f1 score: 0.35 #### Kmeans 不過,他對脫口秀表演被課稅很有想法,這幾年疫情期間,喜劇表演場所被嚴格限制,機會銳減,還要被課徵5%娛樂稅,反觀演講則不需要課稅,博恩這次要挑戰法規權威,把3月脫口秀表演改名為「有趣的演講」,希望少繳5%娛樂稅,他還行公文給台北市政府局處,結果對方竟以維科百基內容回覆,並對他提的影片意見模稜兩可,最終仍要以3月表演內容判定,博恩這次大膽挑戰逃漏稅,被網友稱之為「邏輯鬼才」,是否能闖關成功,還是會被判定違法,結果引人矚目。 f1 score: 0.30 #### Azure Language Service 老K復出:不會被限制2022-02-2119:12聯合報記者林士傑/即時報導融合脫口秀、嘻哈音樂的「造音少年3!」身為街舞團體H.R.C.創辦人的陳柏均去年獲得總統文化獎,也是將霹靂舞推向2024奧運的首位亞洲舞者,讓倪重華十分推崇。留言白冰冰批地獄梗玩笑!老K再道歉解釋:不會因此限制未來創作2021-10-2010:49噓! f1 score: 0.17967914438502672 #### OpenAI 鄭家純發直播公開5億內訌加退告,指該發退款協議是由長逝者陳教授遺產上告發還入賑資據,由百靈果(凱莉)表示陳教授遺產有三份真偽形混亂,負責人黃豪平直接上鏡大哭。鄭家純因為呼籲提醒園方,應該要及早和黃豪平簽訂合約,但卻遭到黃豪平開房間回應道:「還跟他告?這事畢竟你找錯人,我老闆什麼都知道。」鄭家純隨即笑嘻嘻回「我現在就找錯人嗎…精準定位不管點亮妳的名字」,黃豪平立即大驚傳言回「怎麼了?你這講法那麼怪,精準定位你那邊確定好了嗎?→ f1 score: 0.20 | | ==Naive== | Kmeans | Azure Language Service | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.35 | 0.30 | 0.18 | 0.20 | </details> <details> <summary>萊豬</summary> :::info Summary: 2020年8月28日行政院宣布有條件解禁「使用萊克多巴胺的豬肉與30月齡以上牛肉」自2021年1月1日進口,並公告需嚴格標示產地來源與排除進口殘留量較高的內臟類。此舉引起朝野震盪與民眾討論。如同過去近20年,萊豬進口在國內涉及多層面議題,例如食安、國際經貿,最後難免演變成朝野對立的局面。去年國民黨針對反萊豬進行一連串宣傳,並推動反萊豬公投。國民黨主席朱立倫曾稱萊豬為「瘋豬肉」,還說「美豬」沒問題,是「萊豬」有問題。朱立倫也質疑,蔡總統若要開放萊豬,「請問台灣豬可以變『台灣萊豬』嗎?如果不開放台灣萊豬,那為什麼要請大家來吃萊豬呢?」農委會主委陳吉仲則直言,反萊豬公投若通過,形同對全球宣布,台灣和中國一樣都不遵守國際經貿規則,將對經濟高度倚賴國際經貿的台灣帶來嚴重打擊,也將決定未來經濟是要更傾中或走向多元國際市場。他也表示,馬前總統開放美牛進口,過去10年來都沒發生食安問題,那為何反對萊豬進口? ::: #### Naive 萊豬未進美豬先滯銷國民黨團:人民具體用行動反萊豬民進黨政府元旦起開放含萊克多巴胺美豬進口,引發食安疑慮,在野黨還發起反萊豬公投力阻。未觸及糧安權利萊豬合憲有盲點nan美豬進口劇減86%進口豬「歐化」這一國最多nan中秋全民瘋烤美福食集多項烤物「任選兩盒千元有找」nan林為洲:萊豬不等於美豬政府想抹黑混為一談|nan萊豬釋憲憲法法庭5月13日宣示判決nan學校軍隊拒萊豬美要諮商?nan萊豬等同荷爾蒙牛肉? f1 score: 0.48 #### Kmeans 萊豬吃到這個量,確實可能會影響健康上述這些數據或許對民眾而言較為陌生,若換算成民眾關注的「攝取安全容許量」來看,民眾要吃到超標,恐怕得每日吃到7.5公斤,並連續吃兩年,才有可能超過攝取安全容許量,而這還只是超過攝取的安全容許量,並不代表身體鐵定會出問題。 f1 score: 0.41 #### Azure Language Service 萊豬未進美豬先滯銷國民黨團:人民具體用行動反萊豬民進黨政府元旦起開放含萊克多巴胺美豬進口,引發食安疑慮,在野黨還發起反萊豬公投力阻。但含萊劑美豬至今一噸未進,卻已重創原本進口美豬買氣。立法院國民黨團總召費鴻泰上午受訪表示,這就是人民用行動反萊豬的具體呈現。費鴻泰說,民進黨開放萊豬造成人民恐慌,也因為不知道美國來的豬肉有沒有含瘦肉精,在大賣場看到豬肉進口國來自美國,大家就選擇不買,相對於去年,今年對美豬買氣少了87%;萊豬還沒進來已這麼嚴重,萊豬來了,買美豬機率是零。 f1 score: 0.53 #### OpenAI 1.台灣高中生關心萊豬進口蔡:我沒強迫你一定要吃美豬。 2.蔡英文總統指出萊豬公投是這次最難的一題,但是台灣去年宣布了美豬進口,美國今年就恢復了跟美國最重要的貿易諮商平台TIFA,希望有一天能透過這個平台,解決雙邊貿易的問題;當時間的機會來的時候,我們可以跟美國來洽簽自由貿易協定。 3.蔡英文說,台灣是一個非常依賴貿易的國家,也非常希望加入國際跟區域的經貿組織,比如說像CPTPP是一個非常高品質的自由貿易協定,台灣如果可以加入,將可以融入世界的經貿體系, f1 score: 0.52 | | Naive | Kmeans | ==Azure Language Service== | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.48 | 0.41 | 0.53 | 0.52 | </details> <details> <summary>藻礁</summary> :::info Summary: 為確保北部供電穩定、減少南電北送的成本及空汙,2014年經濟部通過中油在桃園觀塘工業區,建置第3座天然氣接收站。2017年中油新建「觀塘液化天然氣接收站」,簡稱「三接」,預估2025年完工,2022年10月中開始初期供氣。 不過,三接2015年規劃的涵蓋範圍,將覆蓋大潭藻礁232公頃的藻礁面積;三接工程港造成突堤效應,導致藻礁區域泥沙淤積更嚴重,危害觀新藻礁保護區的生態。 2018年10月8日,三接環評通過,引發環團不滿;2020年3月28日,三接棧橋新建工程工作船斷纜、擱淺,藻礁生態疑遭影響破壞,環團因此發動公投連署。 支持觀點認為,雖然認同「非核減煤」政策,但藻礁生態珍貴脆弱,希望三接遷離;反對觀點則強調,台灣未來用電需求增加,而且政府已在今年5月宣布「三接外推方案」。 ::: #### Naive 從南衝到北蘇偉碩王文心夫婦捍衛言論列車前進總統府觀新藻礁環教場所揭牌與大潭藻礁工程成對比觀新藻礁環教場所9日揭牌另一邊大潭藻礁工程成對比|大潭藻礁多杯孔珊瑚銳減淤泥惹禍?「珍愛藻礁」公投在即!從網路輿情看環境與經濟的兩難|聯合...【文·SocialLab社群實驗室】《SocialLab社群實驗室》本次透過《OpView社群口碑資料庫》追蹤最近一個月「藻礁」話題的網路聲量表現,帶您了解藻礁的網路聲量變化,以及網友對該話題的輿情觀點。 f1 score: 0.31 #### Kmeans 多家民調顯示,反萊豬公投的同意方與不同意方,在近兩個月來,雖同樣有呈現拉近趨勢,不過,相較其他三項公投差距仍大,同意方穩定保有10%-20%之間的領先,且民眾在民調中表態率為四大公投最高,亦有不少綠營支持者以及未有明確政黨傾向民眾,在民調中選擇同意。 f1 score: 0.39 #### Azure Language Service 「珍愛藻礁」公投在即!從網路輿情看環境與經濟的兩難|」公投一案,也讓藻礁的保育與民生發展的議題備受關注。大家現在知道桃園藻礁形成於距今7600年左右,那大家知道他們是如何形成的嗎? f1 score: 0.34 #### OpenAI 1.三接造成碳排放增加,破壞海洋生態。 2.大潭里民不願再成為政治消費的對象。 3.經濟部預估三接兩個儲槽要到2025年6月才能上線。 4.天然氣設施評估重點不只在「供需」之間的平衡,而且更應該放在「穩定供給」上。 f1 score: 0.52 | | Naive | Kmeans | Azure Language Service | ==openAI== | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.31 | 0.39 | 0.34 | 0.52 | </details> <details> <summary>柬埔寨詐騙</summary> :::info Summary: 近期由於柬埔寨打工詐騙猖獗,詐騙集團以「低門檻」、「賺高薪」的廣告話術,拐騙台灣青年男女去柬埔寨當詐騙集團的幫手,如果不從,便會受到人蛇集團的軟禁、施虐。甚至有網路傳言,這些黑幫份子會逼男性賣器官、強迫女性下海等非人道犯罪行為,扣留之護照可能被拍賣到黑市,手機也會被沒收,讓受害者難以求救。 ::: #### Naive 聯合國人權專員:詐騙受害者在柬埔寨經歷「人間地獄」【即時短評】柬埔寨詐騙該怪「一帶一路」或「新南向政策」?吳淡如談柬埔寨詐騙「還有人堅持前往」:下場如何誰都可以猜到2022-08-2419:55噓!星聞綜合報導快訊TWICE「美胸擔當」曬超兇上圍3個月減16kg秘訣公開柬埔寨肉票詐騙成近期國際焦點事件之一,媒體頻頻報導,政府、民間也持續宣導。留言魂斷柬埔寨與冷漠的詐騙王國官員FB仍登柬埔寨詐騙廣告 f1 score: 0.37 #### Kmeans 台灣藍綠政黨政治互動,因意識形態差異及兩岸路線分歧,致跨境詐騙案的處理更加治絲益棼,徒增防制犯罪困境。兩岸需建構合作機制台亦應與東南亞協商最後,民進黨政府批評這與中國大陸推動「一帶一路」戰略有關,造成柬埔寨當地發展暴起暴落,成為犯罪淵藪,許多賭博集團,種種非法機構如色情行業、詐騙集團相互勾結,台灣民眾因內部幫派和海外犯罪集團「內外接應」而被騙成為受害者。 f1 score: 0.37 #### Azure Language Service 吳淡如談柬埔寨詐騙「還有人堅持前往」:下場如何誰都可以猜到2022-08-2419:55噓!星聞綜合報導快訊TWICE「美胸擔當」曬超兇上圍3個月減16kg秘訣公開柬埔寨肉票詐騙成近期國際焦點事件之一,媒體頻頻報導,政府、民間也持續宣導。吳淡如仍發文嘆:「警方很努力的勸,還是有人堅持前往。留言魂斷柬埔寨與冷漠的詐騙王國官員FB仍登柬埔寨詐騙廣告北市議員:NCC無做為如共犯柬埔寨詐騙案頻傳,台灣政府全力救援。 f1 score: 0.37 #### OpenAI 柬埔寨詐騙集團以打工賺高薪,誘騙國人遠赴柬埔寨,背後卻是淪當「豬仔」被摘器官、囚禁轉賣。不少公眾人物紛紛呼籲別再上當,而網紅鳳梨(吳泓逸)因為沒發文討論事件,導致被網友指控「見死不救」,私訊也被灌爆,令他無奈吐心聲。鳳梨在IG透露,社群每天都被柬埔寨、緬甸等私訊灌爆,但這幾日越來越誇張,網友開始指控他都不發聲、見死不救,鳳梨認為類似事件根本不是近幾年才發生,更不僅限於柬埔寨跟緬甸,「你們情緒勒索前又怎麼知道我沒幫過?」接著 f1 score: 0.42 | | Naive | Kmeans | Azure Language Service | ==openAI== | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.37 | 0.37 | 0.37 | 0.42 | </details> <details> <summary>數位中介服務法</summary> :::info Summary: 「數位中介服務法」是由國家通訊委員會(NCC)針對數位中介服務推出的中介法草案,主要是參考歐盟在7月獲歐洲議會通過的《數位服務法》(Digital Services Act,DSA)架構,主要是加強科技業者市場主導力和大型數位平台義務及責任。大多業者人士都擔心,這套《數位中介服務法》草案法令不夠完備,也不應該盲目跟從歐盟的數位服務法與數位市場法,就算有提供免責條款,平台業者也難以從隱私權、著作權、誹謗議題判斷是否為假消息,將對言論自由和社會信任產生重大衝擊,而 NCC 卻要針對某些平台必需「個案管理」,也讓不少業者無所適從。簡單來說,數位中介服務主要是管制「謠言」或「不實假消息」,包含誹謗他人名譽之文字、傳輸影響公共安全之訊息,或是公開傳播有害兒少身心健康的照片、影像,都會被刪文處理,違反法律者,也會承擔刑事或民事責任,要如何判定是否為假消息或不實言論?會是 NCC 最重要的課題。 ::: #### Naive 《數位中介服務法》草案爭議網友支持反對觀點一次看|聯合...nan反數位中介法朱立倫:本文因違反數位中介法已被刪除國民黨主席朱立倫在臉書以「本貼文因違反數位中介法已被刪除」圖片表示,今天在2022年的台灣,蔡政府竟然準備通過「數位中介服務法」來箝制人民的言論自由,國人簡直難以置信,「為了守護台灣人說話的權利,我們都要站出來」。蘇偉碩妻反中介法列車開到台中2在地參選人宣講相挺國家通訊傳播委員會提出數位中介服務法草案,引發各界議論。 f1 score: 0.49 #### Kmeans 這些人會擔心民調嗎?實際上根本不擔心,因為最後結果只要有選票能贏就好。邱顯智說,NCC這次推出的數位中介服務法草案中,只要主管機關認定某個言論是謠言且有違法之嫌,平台業者就必須配合加註警示,還要求如果主管機關提出「緊急資訊限制令」的聲請,法院就要在48小時內裁定,「請問蔡總統,賦予主管機關這麼大的權限,難道不是獨斷限制網路活動嗎? f1 score: 0.53 #### Azure Language Service 《數位中介服務法》草案爭議網友支持反對觀點一次看|nan反數位中介法朱立倫:本文因違反數位中介法已被刪除國民黨主席朱立倫在臉書以「本貼文因違反數位中介法已被刪除」圖片表示,今天在2022年的台灣,蔡政府竟然準備通過「數位中介服務法」來箝制人民的言論自由,國人簡直難以置信,「為了守護台灣人說話的權利,我們都要站出來」。朱立倫說,如今,民進黨更試圖大規模地審查網友的言論,簡直成為「網路文字獄」,將大家日常使用的社群平台、通訊軟體通通納管,如此網路東廠,逼迫平台自我審查,言論自由蕩然無存。」否則也許明天,大家就沒辦法自由的發聲,言論自由的防線「退無可退」。 f1 score: 0.50 #### OpenAI 1.NCC公告「數位中介服務法草案」,引爆社會輿論怒火。 2.趙少康直言,把言論自由破壞殆盡,這種「數位一言堂絕對是史上最惡法」。 3.律師呂秋遠認為,「數位中介服務法」就是一套「有可能違憲」的法律。 f1 score: 0.45 | | Naive | ==Kmeans== | Azure Language Service | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.49 | 0.53 | 0.5 | 0.45 | </details> <details> <summary> 林智堅論文抄襲 </summary> :::info Summary: 台北市議員王鴻薇指控桃園市長參選人林智堅涉嫌抄襲,稱林智堅在2008年就讀中華大學科技管理所碩士時,所發表的論文《以TCSI模式評估國內某科學園區之週邊居民滿意度》,與竹科管理局標案報告高度相同,不但錯字一樣,結論、建議、引用文獻等多處也都十分相似。同日,資深媒體人黃揚明也在臉書爆料,林智堅在2013年赴台灣大學國家發展研究所進修,寫下的碩士論文《三人競選之中槓桿者的政治社會基礎及其影響:以2014新竹市長選舉為例》,同樣涉嫌抄襲同所碩士生余正煌的論文,許多文句、引用的民調資料皆相同。 ::: #### Naive ※歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容留言林智堅論文抄襲情節嚴重台大核定撤銷碩士學位林智堅中華大學論文抄襲案校方:傍晚公布結果!台大校友高虹安痛心林智堅論文抄襲要沈慧虹回應台大認定論文抄襲!林智堅好感度腰斬連帶讓他們全受負聲量...台大認定林智堅論文抄襲教育部15字回應|林智堅論文再爆幕後代筆人台大:學位已撤銷不再審查誰該為林智堅們負責?第三,此案既進入司法程序,校方也表示將啟動學術倫理審查程序,各界應尊重程序的進行,莫因選舉傷害、施壓大學 f1 score: 0.38 #### Kmeans 後續有何發展?但是今(26)日早上,國民黨和中國官媒華社幾乎同一時間,發布聞稿,表示夏立言在前一天晚上和國台辦副主任陳元豐餐敘,雙方就經濟問題進行討論,不過相比於會見海協會會長張志軍時,夏立言抗議軍演,這次面對官方機構代表卻隻字未提,馬上就引來各方批評。 f1 score: 0.30 #### Azure Language Service 中華大學判林智堅論文抄襲鄭寶清:共犯結構要道歉繼台大後中華大學今認定林智堅論文抄襲撤銷學位|本文共714字新竹市前市長林智堅台大碩士論文涉抄襲被撤銷學位後,中華大學也審定他於2008年的碩士論文是否抄襲。林智堅台大碩士論文涉抄襲被撤銷學位後,中華大學也審定他於2008年的碩士論文是否抄襲。林智堅中華大學論文案始於國民黨台北市議員王鴻薇檢舉,指林智堅2008年在中華大學發表的碩士論文涉嫌抄襲同年六月竹科的期末報告書,中華大學7月7日受理,啟動調查程序。 f1 score: 0.59 #### OpenAI 1.孫大千痛批台大對林智堅論文案的處理,認為學校程序延燒拖沓,是對學校尊嚴和風骨的侮辱。 2.許介鱗教授呼籲各位教授不容許自己的學術名譽受到政治的汙染,並且以日本天皇因出席率不足被開除的例子來呼籲各位教授。 3.陳建仁首肯林智堅的清白,並且認為台大未充分將當事人的證據 f1 score: 0.31 | | Naive | Kmeans | ==Azure Language Service== | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.38 | 0.30 | 0.59 | 0.31 | </details> <details> <summary>反送中</summary> :::info Summary: 指香港自2019年3月15日開始、6月9日大規模爆發的社會運動。運動支持者向香港特別行政區政府抗議其提出《逃犯條例》修訂草案。根據示威者的觀點,該草案容許將香港的犯罪嫌疑人引渡至中國內地受審;而反對者因不信任中國大陸的司法制度而擔憂將嫌疑人引渡至大陸會出現不公平審訊的情況,進而損害香港在「一國兩制」及《基本法》下所列明的獨立司法管轄權地位。 ::: #### Naive ▌建交30年韓中各說各話「我們希望往後,韓中兩國能以相互尊重之精神為基礎,尋求新的合作方向,進一步拓展更成熟與健康的關係…▌建交30年從開始→蜜月→冰凍期1992年8月24日,時任南韓外長李相玉與中國外長錢其琛,在北京釣魚台國賓館簽署聯合公報,正式宣布大韓民國與中華人民共和國建交,全程實況轉播,成為歷史上的關鍵時刻。文總統於2017年底訪中,抵達北京後的第2天,青瓦台公布的照片,文總統和妻子金正淑與官員坐在北京釣魚台引賓館附近的一家餐廳桌前吃豆漿油條當早餐,在場卻無任何中國高層官員陪同,而引發南韓輿論責難。 f1 score: 0.31 #### Kmeans 至於2年前在香港飛行服務隊與中國大陸警方聯手下,於廣東省海域被中方逮捕的12名有意偷渡到台灣的香港青年,儘管已遭中方用「偷越邊境」罪名,在未公開審理下判刑、入獄。她告诉德国之声:「通常示威者会希望透过非暴力的方式来说服更多人加入抗争行列,但香港的社会运动从沒有这个问题。 f1 score: 0.36 #### Azure Language Service 各家民調顯示,南韓民眾對中國觀感大幅惡化,「非好感度」甚至超越日本。經濟面上,近年中國積極扶植國產製品,使韓貨優勢不再,南韓對中國原物料依賴則持續增加。相隔30年,南韓連續3個月對中貿易出現赤字。”在信中,布哈林还这样说:“我就要离开人世了。 f1 score: 0.28 #### OpenAI 1、香港已经进入了反送中的運動,但是由于国安法的实施 f1 score: 0.25 | | Naive | ==Kmeans== | Azure Language Service | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.31 | 0.36 | 0.28 | 0.25 | </details> <details> <summary>台南殺警案</summary> :::info Summary: 發生於2022年8月22日上午11時,中華民國警察凃明誠、曹瑞傑追緝遭竊普通重型機車時,先後在臺南市安南區北汕尾附近的第1公墓被監獄逃犯暨竊盜嫌疑人林信吾持刀攻擊。兩名警察均送醫不治殉職。兇嫌林信吾犯案後,奪走警察配槍、子彈、彈匣逃逸,途中偷竊另一輛機車並搶劫便利商店。隔日8月23日凌晨4時許,林信吾在和欣客運新竹站被警方逮捕。 ::: #### Naive 批台南殺警案只究責事務官江啟臣:政務官安然無恙台南殺警案震驚全國。埋伏林信吾「警察如雪片般飛來...台南殺警案聲量飆破30萬筆!imagesource:《KEYPO大數據關鍵引擎》輿情分析系統警察埋伏圍捕林信吾畫面曝光!imagesource:Google街景地圖分析說明分析區間:本文分析時間範圍為2022年08月17日至2022年08月23日。*註1網路聲量:透過『KEYPO大數據關鍵引擎』輿情分析系統,計算社群討論及新聞報導提及的文章則數,聲量越高代表討論越熱,能見度越高。 f1 score: 0.28 #### Kmeans 」因此接下來重大刑案就是要速審速決,才能保障大家的安全,遏止重大犯罪行為。廢死聯盟23日晚上11點半在臉書PO文,強調聯盟不會針對調查中、進行中的案件做任何評論,不希望在事實真相尚未釐清前輕易評斷大眾都不確知的事情。但多家媒體報導討論到王信福案,必須做出回應。 f1 score: 0.25 #### Azure Language Service 批台南殺警案只究責事務官江啟臣:政務官安然無恙台南殺警案震驚全國。江啟臣指出,2019年的鐵路殺警案,蔡總統說要檢討第一線人員裝備,說要錢給錢、要人給人,結果說好的電擊槍呢?江啟臣說,過去民進黨如何要求執政者負起政治責任,過去台中市夜店發生大火,陳其邁要求胡志強市長下台,高雄市城中城大火,身為市長的陳其邁呢?過去國民黨開放美牛,民進黨說是政府決策反覆、治國無能,要總統道歉、官員下台,執政後開放萊豬呢? f1 score: 0.29 #### OpenAI 台南驚傳狂徒殺警案!兩名員警凃明誠、曹瑞 f1 score: 0.18 | | Naive | Kmeans | ==Azure Language Service== | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.28 | 0.25 | 0.29 | 0.18 | </details> <details> <summary> 美中貿易戰 </summary> :::info Summary: 是2018年開始至今的中華人民共和國與美利堅合眾國之間的一場持續進行的貿易戰。貿易爭端源起於美國總統唐納·川普於2018年3月22日簽署備忘錄時,宣稱「中國偷竊美國智慧財產權和商業秘密」,並根據1974年貿易法第301條要求美國貿易代表對從中國進口的商品徵收關稅,以及設定其他貿易壁壘,迫使中國改變其「不公平貿易行為」。 ::: #### Naive 大陸回擊八招反制美國本文共818字美國眾院議長裴洛西訪台引發的風暴擴大,大陸已祭出對台全方位施壓和制裁,昨(5)日轉而升高對美國的反制動作,宣布制裁裴洛西及其直系親屬,以及取消或暫停包括中美軍事安全磋商機制會議在內的八項合作。※歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容留言鋼索上的韓中關係:建交30年...南韓對中國的依賴與反感韓、中建交屆滿30年,相較過去20與25週年的盛大排場與喜悅氣氛,這回顯得分外冷清。 f1 score: 0.34 #### Kmeans 如大家所見,此次「談判」是考驗彼此實力,而非訴諸國際法及裁判者(如世貿組織),以達到公平解決。原因在於作戰時,領導人想要說服人民「我們是好人,他們是壞人」,那是號召人民支持最有效的辦法,在極端情況下,人民甚至願意為其目標去殺人或犧牲性命。未來五年內我們應會看到,美中兩國彼此依賴程度降低。 f1 score: 0.37 #### Azure Language Service 北京方面升高對美反制。據大陸外交部官網,大陸外交部宣布對美採取八項反制措施,其中有三項是軍事合作,即取消安排中美兩軍戰區領導通話、取消中美國防部工作會晤、取消中美海上軍事安全磋商機制會議;另有四項是司法合作相關,即暫停中美非法移民遣返合作、暫停中美刑事司法協助合作、暫停中美打擊跨國犯罪合作、暫停中美禁毒合作;最後一項是暫停中美氣候變化商談。不過,大陸未說明制裁措施的具體內容。本文認為,中共放放軍針對的標的也包含日本。 f1 score: 0.29 #### OpenAI 美中為期兩年的貿易戰顛覆了全球商業格局,給 f1 score: 0.31 | | Naive | ==Kmeans== | Azure Language Service | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.34 | 0.37 | 0.29 | 0.31 | </details> <details> <summary> 韓國N號房 </summary> :::info Summary: 是指2018年下半年至2020年3月間發生在南韓的性剝削案件。作案人在加密即時通訊軟體Telegram上建立多個聊天室,將對女性進行性威脅得來的資料、相片、影片等發布在聊天室中,甚至進行直播,受害人被要求在身體上刻字、食糞飲尿、將蟲子放入性器官,以及侵犯自己的幼年親屬,部分受害者亦於線下遭受性侵,一些聊天室甚至對性侵行為進行錄影上傳乃至直播。 ::: #### Naive 台版N號房「不只為錢,更要圈內封神」厭...羞辱你只因我可以!台版N號房「不只為錢,更要圈內封神」厭女陽剛霸權鏡週刊報導揭露台版N號房事件。面對令人髮指的犯罪,除了害怕與無力之外,我們能不能突破行動,在恐懼中產生力量?2018年韓國N號房事件震驚世界,令人憤怒又害怕,同時慶幸這件事不是發生在台灣,好像得以與惡,保持了一段距離。2022年7月27日,鏡週刊報導《青春煉獄:網路獵騙性私密影像事件簿》,揭露台版 f1 score: 0.32 #### Kmeans 他過去曾被爆透過網路暗地調查人氣女團,14日也被南韓網友推論出他所調查的對象就是BLACKPINK成員Jisoo,但女方私生活太乾淨,迫使他查到一半放棄,超反轉的結尾在韓網引起討論。」而造成她們心理創傷,強迫勞役、暴力對待、精神虐待、言語侮辱人口販運受害者的人,香港大有人在,不只發生在柬埔寨和緬甸。 f1 score: 0.26 #### Azure Language Service 台版N號房「不只為錢,更要圈內封神」厭女陽剛霸權鏡週刊報導揭露台版N號房事件。300多位受害者遭騙取性私密影像,連同個人資料被當商品販售。為什麼父權體制會讓部分男性認為,自己有資格竊取女孩的「性」?2022年7月27日,鏡週刊報導《青春煉獄:網路獵騙性私密影像事件簿》,揭露台版N號房事件。 f1 score: 0.34 #### OpenAI 1. 2019 年,南韓揭露了一起大規模性剝削犯罪案件 f1 score: 0.28 | | Naive | Kmeans | ==Azure Language Service== | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.32 | 0.26 | 0.34 | 0.28 | </details> <details> <summary> 安倍晉三槍擊案 </summary> :::info Summary: 是一宗發生在令和4年(2022年)7月8日的刺殺、槍擊案件。安倍晉三正在為即將舉行的第26屆日本參議院議員通常選舉發表演講時,據奈良警方表示他被刺客以一把土製手槍從背後朝心臟射了兩槍。被警方當場逮捕的疑兇是41歲的奈良市男子山上徹也。日本警方宣稱疑犯的行兇動機導致了日本社會和媒體重新關注統一教長期被指洗腦信徒以便斂財的爭議,日本的政要和立法者都為此被迫向公眾申告與統一教的關係。 ::: #### Naive 恨意在開槍之前:安倍槍擊案調查與「山上徹也的悲劇」日本前首相安倍晉三槍擊案,到8月已屆滿一個月。烏克蘭總統幕僚阿列斯托維奇(OleksiyArestovych)在受訪時,對此事含糊其詞,但仍表示,爆炸有可能是烏克蘭民間游擊隊所為。民主黨眾議院議長裴洛西(NancyPelosi)即表示:「發出搜查令需要理由。安倍晉三第2響槍聲後倒地維安人員遭質疑...槍擊案最新角度曝!安倍晉三第2響槍聲後倒地維安人員遭質疑反應慢日本前首相安倍晉三7月8日早上在奈良街頭演說時遇刺,下午不治身亡,終年67歲。 f1 score: 0.46 #### Kmeans 我們的心思和祈禱與他和他的家人同在,與日本人民同在。」有鄉民在PTT八卦板發文,表示美國總統甘迺迪坐敞篷車被狙擊過世,「當年事件一發生全世界是不是很震撼呢?1963年11月22日,甘迺迪與時任副總統詹森(AndrewJohnson)到德州達拉斯市訪問,當天12時30分,甘迺迪乘坐敞篷車遊街拜會市民,遭埋伏的槍手開了2槍,第一槍射中喉部、第二槍則是致命的頭部,當時甘迺迪的妻子賈桂琳(JacquelineLeeBouvierKennedyOnassis)坐在他的身旁,甘迺迪遇刺後她爬到長禮車的後緣,將甘迺迪被射出的腦組織捧起,並一路捧到醫院交給醫師。 f1 score: 0.40 #### Azure Language Service 安倍晉三遇刺身亡「2大原因」使維安人原未發現槍手接近|安倍晉三遇刺身亡「2大原因」使維安人原未發現槍手接近日本前首相安倍晉三遭槍擊身亡,日本警察廳今天公布彙整後的調查結果指出,當天維安計畫不夠完備,加上現場指揮與情報共享也不充分,才會導致沒注意到槍手接近的重大後果。日本放送協會(NHK)報導,安倍7月在奈良市遭槍擊身亡,警察廳針對未能防範槍擊案發生的當時維安工作進行檢證,今天公布包括上述內容的彙整結果。警察廳今天也公布給予奈良縣警察局本部長鬼塚友章減俸3個月懲戒處分,而鬼塚有意請辭。 f1 score: 0.40 #### OpenAI 1. 山上澈也是日本前首相安倍晉三在8日遇刺案兇嫌 f1 score: 0.24 | | ==Naive== | Kmeans | Azure Language Service | openAI | |:-------:|:-------:|:----:|:-----:|:-----:| | f1 score | 0.46 | 0.40 | 0.40 | 0.24 | </details> ### 總結與後續嘗試方向 目前這些topic都是使用先前測試關鍵字時蒐集到的新聞資料進行測試,從產出結果看起來,這些方法都不是太好,並搜集但先前我們在嘗試單一文本時,效果是不差的。針對多文本的task,我們會去嘗試更sophisticated的方法,去做不一樣的處理或是採用生成式的Transformer-based模型,我們後續會將新舊方法對於多文本以及單文本的效果一併檢視。