---
title: "你的 code 充滿時間:使用 Python 進入聲音訊號的世界 - 蘇黎"
tags: PyConTW2024, 2024-organize, 2024-共筆
---
# 你的 code 充滿時間:使用 Python 進入聲音訊號的世界 - 蘇黎
{%hackmd NY3XkI1xQ1C9TrHQhoy9Vw %}
<iframe src=https://app.sli.do/event/6hDE1PTLbaY6Fi9Z84LaGj height=450 width=100%></iframe>
> Collaborative writing start from below
> 從這裡開始共筆
> Time is what we want most, but what we use worst - William Penn
:::success
- 議程投影片連結:
- [投影片連結](https://drive.google.com/file/d/16VAD43c_7MfCPQ66IO1Vfvo4FKFzbdxB)
- Agenda slide:
- [Slide Link](https://drive.google.com/file/d/16VAD43c_7MfCPQ66IO1Vfvo4FKFzbdxB)
:::
音樂是人類所創造最複雜、具時間性的訊號,其中包含了大量不同的樂器、人聲、旋律,互相交織而成龐雜的時間訊號。
使用 Python 進入音訊處理 ~~音頻處理~~
資料聽覺化(sonification),例如:全球歷年溫度
spectrum(頻譜), spectrogram(時頻圖)、tempogram、spectral flux、...,`librosa` 這個 python 套件都有提供計算以上 feature 的功能
Automatic music transcription 音樂採譯問題,莫札特聽過一次音樂就可以完整重現的概念。omnizart 全能的莫札特 python package
music generation
- 隨機音樂:風鈴、莫札特擲骰子遊戲
- 機率音樂:markov chain
- 數據音樂:Google magenta's music transformer
- Suno、Meta MusicGen
Text-to-music generation, LLM, VAE with RVQ
AI(新科技) 帶來的衝擊與焦慮,三種焦慮
- 被控制
- 經濟層面(被取代),mp3 的出現大量取代唱片
- 傷害尊嚴(人類不是謬思女神唯一眷顧的物種)
問題與限制
- 會不會 AI 和人類音樂家害怕同一件事?
- 音樂作品沒人聽
- 音樂生成:時頻圖比較
- 從時頻圖上看,目前生成出來的距離完全真實還有蠻大的差距(騙不過音樂專業人士)
結論
> 「不要輕易得出任何一代不如一代的結論,但我們必須注意那已經吞噬了許多美好事務的機器。如果我想滿足這頭怪獸,就把舊的曲目丟給它吧!」
Below is the part that speaker updated the talk/tutorial after speech
講者於演講後有更新或勘誤投影片的部份
音樂是「聲音粒子」組成的馬可夫鏈
錄音、逐字稿、翻譯與摘要:https://ink.dwave.cc/zh-TW/share/5023