你的 code 充滿時間:使用 Python 進入聲音訊號的世界 - 蘇黎
歡迎來到 PyCon TW 2024 共筆
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
共筆入口:https://hackmd.io/@pycontw/2024
手機版請點選上方 按鈕展開議程列表。
Welcome to PyCon TW 2024 Collaborative Writing
Image Not Showing
Possible Reasons
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →
Collaborative Writing Workplace:https://hackmd.io/@pycontw/2024
Using mobile please tap to unfold the agenda.
Collaborative writing start from below
從這裡開始共筆
Time is what we want most, but what we use worst - William Penn
音樂是人類所創造最複雜、具時間性的訊號,其中包含了大量不同的樂器、人聲、旋律,互相交織而成龐雜的時間訊號。
使用 Python 進入音訊處理 音頻處理
資料聽覺化(sonification),例如:全球歷年溫度
spectrum(頻譜), spectrogram(時頻圖)、tempogram、spectral flux、…,librosa
這個 python 套件都有提供計算以上 feature 的功能
Automatic music transcription 音樂採譯問題,莫札特聽過一次音樂就可以完整重現的概念。omnizart 全能的莫札特 python package
music generation
- 隨機音樂:風鈴、莫札特擲骰子遊戲
- 機率音樂:markov chain
- 數據音樂:Google magenta's music transformer
- Suno、Meta MusicGen
Text-to-music generation, LLM, VAE with RVQ
AI(新科技) 帶來的衝擊與焦慮,三種焦慮
- 被控制
- 經濟層面(被取代),mp3 的出現大量取代唱片
- 傷害尊嚴(人類不是謬思女神唯一眷顧的物種)
問題與限制
- 會不會 AI 和人類音樂家害怕同一件事?
- 音樂生成:時頻圖比較
- 從時頻圖上看,目前生成出來的距離完全真實還有蠻大的差距(騙不過音樂專業人士)
結論
「不要輕易得出任何一代不如一代的結論,但我們必須注意那已經吞噬了許多美好事務的機器。如果我想滿足這頭怪獸,就把舊的曲目丟給它吧!」
Below is the part that speaker updated the talk/tutorial after speech
講者於演講後有更新或勘誤投影片的部份
音樂是「聲音粒子」組成的馬可夫鏈
錄音、逐字稿、翻譯與摘要:https://ink.dwave.cc/zh-TW/share/5023