# 語音分割 ### 最初的想法? 在觀看直播的時候發現,當實況主與其他實況主同時講話時,會根本聽不懂誰在講什麼,甚至剪輯師在剪輯直播檔時,也不知道在講什麼而不知道該怎麼上字幕 ### 這在做什麼? 將人與人的聲音做分割,之後也可以新增一些相關功能和一些剪輯軟體做結合 ### 參考資料 https://youtu.be/_toFpiHyuUg?si=oTVHpRP0CchhYmcO&t=388 https://youtu.be/QW0AXeaNHyM?si=PY2ANxCjhIND-ngE&t=152 # 桌寵 ### 最初的想法? 在使用電腦時會有很長的一段時間單獨一個人,有時候會想要別人陪伴說話。最初是想要做出一個類似galgame的角色並能與人談心的聊天機器人。![169402797926605_P24144049](https://hackmd.io/_uploads/BktjRaLLa.jpg) ### 這在做什麼? 在電腦桌面上生成一個角色扮演人物並能夠不排斥任何話題的與你聊天與對話,就彷彿在與一個真正的人聊天,甚至能讓你的人物擁有生動的動作還能對你的角色進行餵食,和牠玩耍並看著她成長 ### 可能會遇到的問題? 1.經過我使用後發現跟他聊天每則訊息的回覆時間大概落在10~30秒,有時候甚至更久。 2.申請APIKEY也需要花費很多時間和金錢可能會勸退許多人。 ### 參考資料 https://github.com/SillyTavern/SillyTavern/blob/release/.github/readme-zh_cn.md 這是我們在網路上找到與我們想法類似的網站,能做的事情很多列如:自己創建一個有故事背景的角色並且該角色還能上傳自己的live2D模型陪你聊天,但也有不少的缺點列如:執行起來十分麻煩還會出現很多BUG。 https://risuai.xyz/ 這與上面那個網址類似,不一樣的地方是它裡面有很多內置的角色可供下載,並且可以打開就可以直接使用,取而代之的是它的可玩性跟上面的比起來較低。 # AI虛擬歌手 ### 最初的想法? 在現在社會中,有著各國不同的歌手去藉由網路上各式平台來發表自己的音樂作品,而當中有著真人歌手和虛擬歌手等。我們想要製作一個能夠在直播平台中現唱以及製作自己專輯作品的AI虛擬歌手。 ### 這在做什麼? 這個AI歌手能夠在直播平台上收到觀眾直播留言點的歌曲,並且能夠在現場唱出來,而他還能夠透過編曲軟體去製作自己的歌曲。之後也能在社群平台發行自己製作的歌曲 ### 這有什麼問題? 聲音版權問題 進行分析模型訓練時需要去取得歌曲樣本,可能在未來中會有不少歌手禁止自己的歌曲被拿去做AI相關的訓練。 ### 參考資料 https://popbee.com/celebrities/celebrities-news/warner-music-signs-ai-virtual-networker-noonoouri 華納唱片在今年九月簽下AI虛擬歌手noonoouri https://koha.tw/life/mave-pandora-virtualgirlgroup/ 南韓今年二月出道的AI虛擬女團MAVE https://youtu.be/IyUPbX8STLo?si=S4VwyP9P13_8j3Lm 1. Animate Anyone 只需要上傳一張照片,就能夠讓照片人物跳起舞來 https://humanaigc.github.io/animate-anyone/ 2. GAIA(Generative AI for Avator) 上傳一段語音及一張照片,就能讓照片中人物開口說話,類似於之前網路流行過讓照片人物唱特定歌曲製作 https://arxiv.org/abs/2311.15230