Mapping from Frame-Driven to Frame-Free Event-Driven Vision Systems by Low-Rate Rate Coding and Coincidence Processing—A

## **1. 目標 (Objective)** 本論文的主要目標是： - **提出一種方法，將傳統基於影像幀 (frame-driven) 的卷積神經網路 (ConvNet) 映射到基於事件的 (event-driven) 視覺系統**。 - **利用低速率編碼 (Low-Rate Rate Coding) 和時間同調處理 (Coincidence Processing)，建立高效的事件驅動 (event-driven) 卷積神經網路 (Event-Driven ConvNet, ED-ConvNet)**。 - **實作與測試基於事件驅動視覺感測器 (DVS, Dynamic Vision Sensor) 的卷積神經網路架構**，用於： - 旋轉人形輪廓的角度識別 (rotated human silhouettes) - 高速撲克牌符號識別 (high-speed poker card symbols) - **驗證事件驅動神經網路的性能與即時性**，特別是在高幀率與高速度場景中相較於傳統影像幀驅動 (frame-driven) 系統的優勢。本研究的核心目標是建立一個 **將現有的影像幀驅動卷積網路 (Frame-Driven ConvNet) 轉換為事件驅動版本 (Event-Driven ConvNet) 的方法**，使其能夠運行在事件驅動視覺感測器 (DVS) 上，以提高識別速度和計算效率。 --- ## **2. 問題定義 (Problem Definition)** 本論文處理的主要問題在於： 1. **傳統影像處理系統的限制** - 傳統 **影像幀驅動 (frame-driven) 處理方式** 會將視覺資訊分割成固定時間間隔的影像幀，每個幀都需要完整地被處理。 - 這種方式的主要問題： - **時間分辨率低**：當真實世界變化速度高於幀率時，可能導致資訊遺失或無法即時處理 (例如高幀率運動追蹤)。 - **數據冗餘**：即使場景沒有變化，相機仍然會產生大量幀，造成不必要的計算負擔。 - **計算資源消耗大**：影像幀驅動 CNN 需要處理大量靜態影像，佔用大量記憶體與計算資源。 2. **事件驅動視覺系統 (Event-Driven Vision Systems, EDVS) 的優勢** - 事件驅動視覺感測器 (DVS) **不依賴影像幀**，而是當光強變化時才觸發像素產生事件，形成**時間同步**的事件流。 - 這樣的設計可以： - **降低計算負擔**，僅針對發生變化的區域進行處理。 - **提高即時性**，因為事件發生時會立即傳遞，而不需要等待完整的影像幀。 - **適用於高速視覺應用**，如快速物體追蹤或即時影像識別。 3. **如何將影像幀驅動的 CNN 轉換為事件驅動 CNN？** - 目前的 CNN 訓練方法大多基於影像幀，如何將 **影像幀驅動 ConvNet 的權重與架構轉換為事件驅動架構**，是一個未解決的問題。 - 本研究提出了一種方法，透過： - **低速率編碼 (Low-Rate Rate Coding)**：將像素強度對應到事件驅動神經元的脈衝頻率。 - **時間同調處理 (Coincidence Processing)**：利用事件流的時間特性來進行特徵學習與分類。 - 透過這種方法，使得 **影像幀驅動 CNN 的權重與神經元行為可以直接對應到事件驅動 CNN**，從而無需重新訓練。 --- ## **3. 限制條件 (Constraints)** 雖然事件驅動 CNN (ED-ConvNet) 具有即時性與高效計算的優勢，但仍然受到以下限制條件的影響： ### **(1) 訓練數據與模型適配** - **目前的 CNN 訓練主要依賴靜態影像資料集**，但事件驅動神經網路 (SNN, Spiking Neural Networks) 缺乏大規模的事件驅動訓練資料。 - 因此，本研究的解決方案是： - **利用 DVS 記錄傳統影像資料集的事件流，並用來訓練影像幀驅動 CNN**，然後再映射到事件驅動 CNN。 ### **(2) 計算與記憶體限制** - 事件驅動 CNN 雖然降低了計算負擔，但仍需考量： - **記憶體頻寬**：由於事件處理是隨機發生的，可能導致記憶體存取頻寬的瓶頸。 - **即時處理能力**：處理模組需要能夠即時處理高頻率事件，否則可能會導致事件遺失或延遲。 ### **(3) 系統的可擴展性** - 雖然事件驅動 CNN 模組化設計可以擴展，但： - 當網路層數增加時，需要確保**AER (Address Event Representation) 匯流排不會成為瓶頸**。 - 事件驅動神經元之間的同步與時間調整仍然是一個挑戰。 ### **(4) 適用場景的限制** - 本研究的方法適用於**高速動態場景 (High-Speed Vision Applications)**，如： - **快速物體識別** (如撲克牌符號識別) - **動態手勢識別** - **自動駕駛感測** - 但對於 **靜態影像處理或慢速應用**，事件驅動方法可能沒有顯著優勢。 ### **(5) 事件驅動網路的學習限制** - **目前的深度學習框架 (如 TensorFlow, PyTorch) 主要針對傳統 CNN**，對事件驅動神經網路的支援較少。 - 事件驅動神經網路的訓練方法，如 **Spiking-Timing Dependent Plasticity (STDP)**，仍處於研究階段，難以應用於大規模深度學習模型。 --- ## **總結** | 類別 | 內容 | |------|------| | **目標 (Objective)** | 提出一種方法，將影像幀驅動 CNN 轉換為事件驅動 CNN，並應用於 DVS 進行高速視覺識別。 | | **問題定義 (Problem Definition)** | 傳統 CNN 依賴影像幀，無法充分利用事件驅動感測器的特性，導致即時性與計算效率受限。本研究提出低速率編碼與時間同調處理來解決這個問題。 | | **限制條件 (Constraints)** | 1. 缺乏事件驅動的訓練數據集。 2. 記憶體頻寬與即時處理能力的限制。 3. 系統可擴展性受 AER 通訊頻寬影響。 4. 適用於高速動態場景，但不適用靜態影像。 5. 事件驅動神經網路的訓練方法仍在發展中。 | 這篇論文提供了一個將影像幀驅動 CNN 轉換為事件驅動 CNN 的方法，使得基於事件驅動視覺感測器的即時識別成為可能。