Try   HackMD

你的 code 充滿時間:使用 Python 進入聲音訊號的世界 - 蘇黎

歡迎來到 PyCon TW 2024 共筆

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

共筆入口:https://hackmd.io/@pycontw/2024
手機版請點選上方 按鈕展開議程列表。
Welcome to PyCon TW 2024 Collaborative Writing
Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

Collaborative Writing Workplace:https://hackmd.io/@pycontw/2024
Using mobile please tap to unfold the agenda.

Collaborative writing start from below
從這裡開始共筆

Time is what we want most, but what we use worst - William Penn

音樂是人類所創造最複雜、具時間性的訊號,其中包含了大量不同的樂器、人聲、旋律,互相交織而成龐雜的時間訊號。

使用 Python 進入音訊處理 音頻處理

資料聽覺化(sonification),例如:全球歷年溫度

spectrum(頻譜), spectrogram(時頻圖)、tempogram、spectral flux、librosa 這個 python 套件都有提供計算以上 feature 的功能

Automatic music transcription 音樂採譯問題,莫札特聽過一次音樂就可以完整重現的概念。omnizart 全能的莫札特 python package

music generation

  • 隨機音樂:風鈴、莫札特擲骰子遊戲
  • 機率音樂:markov chain
  • 數據音樂:Google magenta's music transformer
  • Suno、Meta MusicGen

Text-to-music generation, LLM, VAE with RVQ

AI(新科技) 帶來的衝擊與焦慮,三種焦慮

  • 被控制
  • 經濟層面(被取代),mp3 的出現大量取代唱片
  • 傷害尊嚴(人類不是謬思女神唯一眷顧的物種)

問題與限制

  • 會不會 AI 和人類音樂家害怕同一件事?
    • 音樂作品沒人聽
  • 音樂生成:時頻圖比較
    • 從時頻圖上看,目前生成出來的距離完全真實還有蠻大的差距(騙不過音樂專業人士)

結論

「不要輕易得出任何一代不如一代的結論,但我們必須注意那已經吞噬了許多美好事務的機器。如果我想滿足這頭怪獸,就把舊的曲目丟給它吧!」

Below is the part that speaker updated the talk/tutorial after speech
講者於演講後有更新或勘誤投影片的部份

音樂是「聲音粒子」組成的馬可夫鏈

錄音、逐字稿、翻譯與摘要:https://ink.dwave.cc/zh-TW/share/5023