# 2/8 研究計畫暫定版 v2
## 摘要
```!
本研究的目的在於利用 Discord 伺服器、聊天機器人,以及生成式 AI 技術,建立一個可以提供師生們取得資訊以及相互交流的校園平台。
隨著數位科技的快速發展,資訊傳遞交流方式日益多元化,在學校中,學生面臨著資訊不對稱、資訊取得不易等挑戰,而現有的資訊平台仍存在著資訊分散、互動性不足等狀況,為解決上述問題,本研究提出一個全新的校園互動平台計劃。
在 Discord 伺服器方面,將建立公共頻道和各科系頻道,促進資訊流通。透過機器人,提供最新消息、天氣狀況、選課評價、公車動態、餐廳推薦等功能。同時,深度整合生成式 AI 技術,讓機器人能夠更智慧地回應使用者的需求,提供更個人化的互動體驗。除了Discord伺服器外,也將建置一個專屬的網頁平台,延伸機器人的各項功能,提供更多樣的資訊和功能,滿足使用者更多元的需求。
```
## 研究動機與研究問題
```!
1. 研究動機
在這個資訊爆炸的時代,資訊傳遞交流方式日益多元,每個人或多或少都有接觸過相關事物,但資訊正確與否成為了另一個問題。在大學校園中的學生面臨著日益繁忙和複雜的生活挑戰,包括學業壓力、時間管理等問題。隨著社交平台的普及和機器人技術的發展,許多組織開始探索如何利用這些新技術為學生提供更好的服務。
Discord 是廣泛用於遊戲社群的通訊平台,近年來也逐漸受到教育領域關注。它提供了即時聊天和語音通話的功能,使學生可以方便地與同學、老師和校園組織進行交流。機器人技術發展也為 Discord 平台增添更多可能性,例如通過生成式 AI 提供自動化的服務和功能,幫助使用者更好地管理訊息、解決問題、提高效率等。
然而,校園現有的資訊平台存在學生互動性低以及資訊取得不易等問題。因此,以 Discord 為基礎建立了一個校園資訊平台,提供一個更便捷的途徑,讓學生能夠更快速地獲取學校相關訊息,並通過機器人解決互動性低的問題。
2. 研究問題
在當今的教育領域,Discord 作為一個社群平台已經受到越來越多的關注和應用。它提供的頻道聊天和語音通話功能、以及其豐富的社交互動性,適合教育場景的協作和交流需求。許多國外的教育機構和社群組織開始在 Discord 上建立自己的伺服器,用於學生群體的管理、課程討論、活動宣傳等,促進學生交流和合作。
對於聊天機器人技術在解決校園資訊交流問題方面的應用,已有初步實踐和研究。聊天機器人可以在Discord平台上提供自動化的服務和功能,例如自動回覆常見問題、提供日常提示和通知。通過機器人可以提高資訊流通的效率和便利性,並減輕人工管理的負擔。然而,要實現聊天機器人在校園資訊交流中的有效應用,還需要解決一些技術和設計上的挑戰,例如機器人智能程度、對話流暢性、與用戶互動方式等。
要設計一個整合了聊天機器人和生成式AI技術的校園互動平台,首先需要確定平台的功能和服務需求,並根據這些需求制定相應的設計方案和技術架構。其次,需要選擇合適的聊天機器人和AI技術,並進行開發和整合。在開發過程中,需要充分考慮用戶體驗和互動設計,確保平台的易用性和便利性。同時,還需要建構一個完善的後台管理系統,用於監控和管理平台的運行狀態,並及時處理用戶反饋和問題。
最後,要收集和分析使用者反饋,並根據反饋結果提出改進和優化建議,建立一個系統化的反饋機制和處理流程。可以通過問卷調查、數據分析等方式收集使用者反饋,並將反饋數據進行整理和分析,並根據分析結果來調整和優化平台的功能和服務,以提升用戶滿意度和使用效果。
```
## 文獻回顧與探討
```!
1. 聊天機器人 (Chatbots)
- 聊天機器人之定義:
聊天機器人(Chatbot)是一種計算機程序,其主要目的是通過文本或語音與使用者進行對話。這些程序利用自然語言處理(NLP)等技術,以理解和解釋使用者的語言,並回應以模擬人類對話(Khanna Anirudh,2015)。聊天機器人可以在各種應用中發揮作用,包括客服、教育、醫療等領域。它們可以基於預先編程的規則和模式,也可以使用機器學習等技術來不斷學習和改進其回應。
- 聊天機器人的基本原理和運作方式:
聊天機器人的基本原理包括:人工智慧標記語言(AIML)、自然語言處理(NLP)。當機器人接收到使用者輸入的資料後,進行自然語言處理(NLP)理解使用者的意圖,並產生適當的回應,可以是文字或圖片等形式。
- 聊天機器人在教育領域的應用現狀和趨勢:
聊天機器人在教育領域的應用正不斷擴展,成為一種創新的教學工具。這些機器人可以被設計成教育助手,提供學生個性化的學習體驗。例如,它們可以回答學生問題、解釋概念、提供額外練習,並在學習過程中提供即時反饋。
透過自然語言處理技術,聊天機器人能夠與學生進行真實對話。此外,它們還可以在數學、科學等學科中提供支援,使學習更生動有趣。在線上課程和遠程教學中,聊天機器人的應用也能夠提供個別化的指導,協助學生克服學習障礙。然而,教育領域仍需持續評估和改進聊天機器人的應用,確保它們能夠有效地融入教學環境,促進學生的學習和成長。
2. 生成式 AI (Generative AI)
- 生成式 AI 技術的基礎概念和發展歷程:
生成式 AI 技術是一種可以創造新內容和想法的人工智慧,包括創造對話、故事、影像、視訊和音樂。通過學習大量的數據,從而可以生成與原始數據相似的新數據。它主要依賴於深度學習技術,其中最常見的是生成對抗網絡(GAN)、長短期記憶網絡(LSTM)、Transformer等模型。發展歷程可以追溯到1980年代,Hopfield Network(John Joseph Hopfield,1982)以及Boltzmann machine(Geoffrey Hinton&Terry Sejnowski,1985)模型誕生,但由於當時電腦的計算能力和數據量限制,造成模型的表現並不理想。隨後GAN(Ian Goodfellow,2014)以及VAE(Diederik P. Kingma&Max Welling,2015)問世,推動了生成式 AI 的快速發展,並取得了重大突破。至今生成式 AI不斷提升生成的品質和生成的能力,,不過大眾也逐漸重視生成式 AI 的可控性及其倫理責任。
- 生成式 AI 在自然語言生成、對話生成等方面的應用:
自然語言生成(NLG)可以利用生成式 AI應用在文本生成、機器翻譯、人機對話以及教育與研究等領域,像是聊天機器人使用 NLG 技術來生成更加自然、人性化的對話,或是用於生成個性化的學習材料或研究報告。
- 生成式 AI 模型的訓練和調整,以適應校園資訊交流平台的需求:
生成式 AI 模型的訓練和調整是生成式 AI 技術的核心。生成式 AI 模型是一種人工智慧模型,可以生成新的資料,例如文字、圖像、音樂等。需要收集和準備訓練模型所需的資料,並且訓練過程需要進行迭代,直到模型達到預期的效果,最後進行評估與調整確保模型的性能符合要求(Shalev-shwartz,S. and Ben-david,S. 2014 )。
- 生成式 AI 會面臨到的挑戰:
生成式 AI 技術是一項新興技術,仍處於發展的早期階段,可能會碰到數據偏見以及安全性的問題。生成式 AI 技術是一項新興技術,仍處於發展的早期階段(Dario Amodei,2016)。它可以創造出新的內容和想法,並在各個領域得到廣泛應用。然而,生成式 AI 技術也面臨著一些挑戰。
其中之一是數據偏見,生成式 AI 技術是基於數據進行訓練的。如果訓練數據存在偏見,那麼生成式 AI 模型也會產生偏見的結果。例如,如果訓練數據中女性的比例較低,那麼生成式 AI 模型可能會生成對女性不利的內容。並且如果有人惡意導入一些不正確或是虛假的訓練數據,可能會導致生成式 AI 模型生成錯誤的訊息進而產生安全性及真實性的問題。
3. 自然語言處理 (Natural Language Processing, NLP)
- 自然語言處理的定義:
自然語言處理(NLP)是探索如何利用計算機來理解和處理自然語言文本或語音(Chowdhury, G.,2003)。這項技術的目標是讓計算機能夠像人類一樣理解和處理自然語言,從而為人們提供更加方便、高效的人機交互方式。隨著 NLP 技術的不斷發展,我們可以期待它在未來為人們帶來更多的便利和價值。
- 自然語言處理技術所面臨的挑戰:
自然語言處理(NLP)面臨著許多挑戰。不同語言具有不同的語法、詞彙和語義。例如,英語是屈折語,而漢語是孤立語。這意味著英語的詞形會隨著語法功能而發生變化,而漢語的詞形則保持不變(Deutscher, Guy.,2006)。
另一個挑戰是上下文理解。例如,“我喜歡這本書”這句話的含義可能因“這本書”所指的內容而有所變化。如果“這本書”指的是一本小說,那麼這句話可能表示喜歡這部小說的故事或人物。如果“這本書”指的是一本教科書,那麼這句話可能表示喜歡這本書的內容或教學方法。
為了應對這些挑戰,NLP研究人員提出了各種技術和方法,隨著技術的發展,NLP技術正在不斷進步,並在越來越多的領域得到應用。
4. 教育科技 (Educational Technology, EdTech)
- 教育科技的發展趨勢和應用現狀:
近年來,隨著科技的快速發展,教育科技也得到了迅速發展,不僅達成了在線教育的普及,也能透過大數據的應用更好地了解學生的學習情況,並做出相應的決策,更可以應用擴增實境(AR)為學生提供沉浸式的學習體驗,讓他們在虛擬環境中進行學習和探索(林佳穎、邱美虹、林佳弘,2021),甚至能在未來透過AI實現個性化的學習以及智能評估等輔助。
- 社交平台在教育領域中的應用和效果:
社交平台可以作為課堂教學的輔助工具,教師可以通過社交平台發佈課程資料、課堂錄影、課後作業等,方便學生隨時隨地學習。學生可以通過社交平台加入學習小組,與其他學生交流學習心得,互相幫助。教師也可以通過社交平台與其他教師交流教學經驗,分享教學資源。所以教育平台不僅能提高學習效率,也能促進學生合作更可以幫助教師的專業發展。
- 教育科技對學生學習和校園生活的影響:
臺灣在教育科技運用上的歷史,包括電化教育、視聽教育、視聽傳播、教學科技及數位學習等時期。其中,個人電腦的普及以及網路的出現對教育產生深遠影響,使教學與電腦幾乎難以分離,也改變了教學方法和師生互動方式。現今,軟體與硬體已經融為一體,資訊與網路科技與教育緊密相連,影響範圍廣泛,不僅使教學多元化,還改變了學習方式(何榮桂,2012)。
- 教育科技面臨的問題
在教育科技發展的背景下,網路成為了豐富的資訊來源,然而,這也引發了資訊過濾的問題,學生可能難以有效地辨別和選擇適切的資訊。因此,加強學生的資訊素養教育變得至關重要,以培養其適應快速發展的資訊社會的能力。
同時,教師在教學中也需要具備相應的資訊技術能力,整合科技資源於教學過程中。這不僅包括基本的電腦操作技能,還需了解教學軟體、多媒體資源的應用,以提升教學的靈活性和多元性,有助於創造更具互動性和引人入勝的學習環境,促進學生更主動地參與學習過程。因此,在教育科技的應用中,同時重視學生的資訊素養和教師的資訊技術能力培養,是確保科技融入教育帶來正面效果的關鍵要素。
```
## 研究方法與步驟
```!
1. 系統架構圖
這個系統架構圖展示了對校園互動平台的規劃,該平台主要分為兩大子系統:Discord Bot和網站。
圖一、系統架構圖
在 Discord Bot 子系統中,各個模組負責不同的功能。最新消息模組透過爬蟲組件從網頁上抓取最新消息並存入資料庫,使得用戶能夠及時獲取校園內的重要資訊。天氣預報模組則通過API組件向外部天氣API發送請求,提供即時的天氣預報。公車時刻模組和課程查詢模組同樣透過API組件或爬蟲組件提供公車時刻表和課程查詢功能,方便用戶查詢相關資訊。課程推薦模組則結合了爬蟲組件、機器學習組件和生成式 AI 組件,通過分析用戶的興趣和需求,提供個性化的課程推薦建議。
在網站子系統的部分同樣擁有多個模組,這些模組不僅提供了與 Discord Bot 子系統相似的功能,還擴展了一些額外的功能,如個人資料模組、選課評價模組、匿名留言模組等。這些模組通過資料庫管理組件來管理相應的數據,保證用戶的資料安全和一致性。
2. 前瞻技術
- 生成式 AI 組件
在使用生成式 AI 技術,特別是機器人問答和訊息生成方面,面臨著選擇適合的大型語言模型的挑戰。目前,主流的模型包括 OpenAI 的 GPT-4 Turbo、Meta 的 Llama 2 和 Google 的 Gemini Pro。這些模型各有優缺點,需要比較最符合需求的模型。
GPT-4 Turbo 擁有巨大的模型規模和廣泛的語言支援,但是它不開源且僅能透過 API 呼叫,使用成本相對較高。相比之下,Llama 2 雖然模型規模中等,但它的簡潔高效、易於訓練和部署,且不收費。而 Gemini Pro 具有強大的性能和易用性,且不收費,但模型規模相對較小且僅能透過 API 呼叫。
綜合考量後,將選擇 GPT-4 Turbo 或 Gemini Pro 模型作為機器人訊息生成的基礎。接下來,將著手處理資料和建立訓練資料集。首先,會確定校園常見問題的類別和範疇,然後收集、整理這些問題,建立訓練用的資料集。透過這樣的訓練資料集,能夠讓模型更深入地理解問題並生成合適的答案。
雖然模型經過微調後,仍無法保證其生成的內容都符合期望。因此,將透過自然語言檢查模型生成的答案,確保其品質。同時,積極收集使用者的反饋,並根據反饋不斷調整和優化模型。若反饋為好的,就將其對話納入訓練資料集用於模型的微調;若反饋為差的,則透過模型重新生成新的內容。
圖二、生成式AI組件流程圖
以課程推薦功能為例,透過格式化提供相關資料,例如修習課程、學科領域,並引導OpenAI生成針對使用者學習需求的個性化課程建議。這使得機器人能以更自然且上下文豐富的方式回應使用者,提供更精準的課程建議。
圖三、課程推薦功能流程圖
- 機器學習組件 (課程推薦)
首先,需要收集個人基本資料(如就讀科系、在學年級)、修課紀錄和職業興趣偏好,以及職能診斷報告。這些資料將以結構化的格式儲存在資料庫中。接著,進行資料預處理,包括數據清洗、去除不完整或不準確的資料,以及特徵選擇或提取,以將原始資料轉換為可供機器學習算法處理的格式。
然後,使用監督式機器學習方法來建立模型,使用決策樹或支持向量機模型,用於預測使用者對課程的興趣程度或推薦特定課程。下面將分析上述兩種模型之比較:
支援向量機(Support Vector Machine):
支援向量機(以下簡稱 SVM)是分析資料的機器學習算法,通過建構複雜的決策邊界來捕捉使用者的興趣模式。SVM 通常通過找到最佳的分隔超平面來將數據分類為不同的類別。在課程推薦的任務中,SVM 可以根據使用者的修課紀錄和興趣特徵來構建一個模型,從而將使用者分類為對某些課程感興趣和不感興趣的群體。由於 SVM 能夠處理高維度的資料和非線性問題,因此它可以有效地捕捉使用者的複雜興趣模式。然而,SVM的計算成本較高,對於大型資料集可能需要更多的時間和計算資源。
決策樹(Decision Tree):
決策樹是輔助決策的機器學習算法,通過將資料分割成不同的子集來建立一系列的分類規則,從而預測用戶對於某些課程的興趣程度。在課程推薦的任務中,決策樹可以幫助理解哪些特徵對於預測使用者興趣最為重要,並且提供了一個易於理解的模型結構。另外,決策樹對於混合型數據和缺失值的處理能力較強,並且不需要太多的數據預處理。然而,決策樹容易出現過度擬合的問題,特別是在處理高度非線性的問題時,因此可能需要進行樹的修剪或者使用集成學習方法來改進效果。
在訓練模型之前,需要進一步進行資料分割,以便將資料分成訓練集和測試集以進行驗證。接著進行模型訓練,將資料提供給模型,並通過調整模型的參數,以最小化預測與實際結果之間的誤差。在模型訓練完成後,使用測試集對模型進行評估。這可以通過計算不同評估指標(如準確度、F1分數等)來完成,以評估模型的性能。
最後,將訓練好的模型部署並整合到課程推薦功能中。當使用者發出查詢時,系統將使用者的個人資料作為輸入,並通過模型進行預測,從而生成個性化的課程推薦結果。同時,為了不斷提升系統的準確性和用戶滿意度,需要持續收集使用者的反饋資料,並根據這些資料來優化模型。
圖四、機器學習組件流程圖
- 爬蟲組件
使用爬蟲技術週期性地收集和更新相關的資料,並將這些資訊整合到機器人的回應中,提供更即時和準確的資訊。以課程查詢為例,使用者發送課程搜尋請求,機器人會至學校的網站爬取課程資料(例如:課程簡介、評分方式...等),在製作嵌入式訊息回傳給使用者。
圖五、爬蟲組件流程圖
- API 組件
利用開放資料(OPEN DATA)來取得天氣資料、公車狀態等資料,以增強機器人的功能。透過 OPEN DATA 提供的公共資料,獲取各種實時或者預測性資訊。這些資料可以直接用於機器人的功能模組,獲取最新的資訊並提供給使用者。透過整合這些開放資料,我們可以使機器人提供更豐富、更實用的服務,提升使用者體驗。
圖六、API組件流程圖
3. 平台技術與部屬
- 網頁平台
運用 XAMPP 或類似工具在實驗室的電腦上搭建伺服器環境,包括 Apache 伺服器、MySQL 資料庫和 PHP 解析器。XAMPP提供了一個完整的開發環境,這樣的方式能夠在開發和測試階段更靈活地進行操作,確保與 MySQL 資料庫的連接和操作順利進行,以儲存和檢索用戶資料。同時,利用 mdbootstrap 前端框架,快速建置美觀的網頁介面。這個框架提供了許多現成的 UI 元件和樣式,有助於提高開發效率和網頁的視覺吸引力,也能實現在不同尺寸和設備上提供一致的使用體驗。
在部署網頁應用之前,需要進行最後的工作。首先,需要購買網域名稱,以便使用者能夠通過網址訪問應用。網域名稱就像是應用在網際網路上的門牌號碼,方便使用者找到應用。其次,需要申請 SSL 證書,以確保使用者在訪問網站時能夠得到安全的體驗。SSL 證書可以加密使用者與網站之間的通信,防止敏感資訊被竊聽或洩露。
首先,將購買一個網域名稱,這是網站的唯一識別符號,就像一個地址一樣。通過購買網域名稱,可以確保網站在網際網路上有一個獨一無二的位置。這使得使用者可以通過簡單的網址來訪問網站,而不需要記住複雜的 IP 地址。
再來,將申請一個 SSL 證書。SSL 證書是一種數字證書,用於在網際網路上建立安全的連接。通過將 SSL 證書用在網站上,可以實現 HTTPS協議,這是一種安全的通訊協議,用於在使用者瀏覽器和網站之間進行加密通訊。這意味著使用者在與網站互動時,他們的敏感信息將被加密,從而保護他們的隱私和安全。
- 聊天機器人
使用 Python 作為主要開發語言。並整合 requests 和 beautifulsoup4 爬蟲套件這兩個套件的功能主要為,前者用於發送外部API以及其他請求,像是獲取天氣資訊、公車時刻、網頁原始碼等數據;後者從網頁中爬取所需的資料,例如最新消息、課程資料等,以供機器人使用。同時,使用 py-cord Discord 套件進行 Discord 聊天機器人的開發,此套件提供了與 Discord 伺服器進行連接和互動,提供多元化的功能,實現與用戶的互動和功能操作。此外,也整合 OpenAI 套件,如 GPT-4 Turbo 或 Gemini Pro,提高聊天機器人的對話理解能力和回應自然度。
圖七、分層架構圖
```







## 預期結果
```!
當校園互動平台順利建置後,我們預期會達到多個顯著的成果。首先,校園互動平台將成為校園內學生溝通的重要的管道,提供了即時、便捷的資訊服務。這有助於改善校園內的溝通效率,減少資訊不對稱和誤解,促進校園社群的凝聚力和合作氛圍。
透過機器學習技術提供的課程推薦功能,以及平台所提供的多元功能模組,例如最新消息、天氣預報、公車時刻表、校園活動資訊、社團交流等,期待能夠幫助使用者更有效率地選擇符合他們興趣和學習需求的課程,並提供除課程方面外更豐富的服務。使校園互動平台成為學生生活中不可或缺的一部分,並顯著提升滿意度和成效。
此外,校園互動平台的開放性和可擴展性也為未來的創新和發展提供更多可能性。校園社群的成員也能積極參與到平台的建設和發展,共同創造一個更加豐富、有價值和永續的校園互動生態系統。
預想參加的研討會或競賽:
1.TANET研討會: 參加 TANET 研討會可以讓平台得到更多的曝光,與相關領域的專家學者交流,獲得更多的反饋和建議,進一步完善和提升平台的功能和性能。
2.其他競賽: 參加其他相關的競賽激發創造力和競爭力,將平台的創新性和實用性展示給更廣泛的觀眾,可能獲得更多的認可和獎勵,促進平台的發展和推廣。
```
## 需要指導教授指導內容
```!
1. 協助架設網站:選擇適合的網站主機服務、推薦可靠的域名註冊服務提供商、建立網站架構和設計介面等方面給予指導。
2. 技術架構的設計和優化:系統的性能、安全性和擴展性等方面提供專業指導,以確保系統能夠達到最佳的效果和效能。
3. 技術問題的解決:在開發過程中,可能會遇到各種技術上的問題和困難,可以提供技術支援,協助研究相關技術文獻、進行測試和調試。
4. 資源和設備的支援:提供實驗室設備、技術工具和軟體、網絡資源等。
5. 技術文檔和報告的撰寫:協助撰寫清晰、完整的技術文檔和報告、提供寶貴的建議和反饋、確保文檔的品質和可讀性。
```
## 參考文獻
```!
[1] 黃士昕(2023)。利用Line Bot 聊天機器人輔助新手增加學習Python 成效。﹝碩士論文。國立高雄師範大學﹞臺灣博碩士論文知識加值系統。 https://hdl.handle.net/11296/5b9myk。
[2] 宋泓均(2023)。微積分聊天機器人的設計與研究。﹝碩士論文。南臺科技大學﹞臺灣博碩士論文知識加值系統。 https://hdl.handle.net/11296/8w433g。
[3] 鍾興瑄(2023)。探討Discord線上遊戲社群的休閒效益:從眾行為的影響。﹝碩士論文。嶺東科技大學﹞臺灣博碩士論文知識加值系統。https://hdl.handle.net/11296/b3dc3x。
[4] 彭嘉瑋(2022)。生成式對話聊天機器人:以老人健康領域對話為例。﹝碩士論文。國立雲林科技大學﹞臺灣博碩士論文知識加值系統。 https://hdl.handle.net/11296/93v4p7。
[5] 林佳穎、邱美虹、林佳弘 (2021) 。擴增實境在科學教育的研究趨勢:2005~2017年學術文獻回顧。科學教育月刊,440期,2-17。
[6] Shalev-shwartz, S. and Ben-david, S. (2014) Understanding Machine Learning from Theory to Algorithms. Cambridge University Press
[7] Dario Amodei, Chris Olah, Jacob Steinhardt, Paul Christiano, John Schulman, Dan Mané, (2016) Concrete Problems in AI Safety.
[8] Khanna Anirudh, Pandey Bishwajeet, Vashishta Kushagra, Kalia Kartik, Pradeepkumar Bhale, Das Teerath. A Study of Today's A.I. through Chatbots and Rediscovery of Machine Intelligence. International Journal of u- and e-Service, Science and Technology. 2015;8(7):277–284.
[9] Chowdhury, G. (2003) Natural language processing. Annual Review of Information Science and Technology, 37. pp. 51-89.
[10] Deutscher, Guy. (2006) The unfolding of language: an evolutionary tour of mankind's greatest invention reprint. New York: Holt Paperbacks.
```