# Eksperymenty - model głęboki - 100x100 - najmniejszy wymiar klatki w zbiorze - jeśli video zbyt krótkie (poniżej 36 ramek) padowane jest przy pomocy ostatniej ramki - Normalizacja: ```python MEAN_IMAGE = [0.485, 0.456, 0.406] STD_IMAGE = [0.229, 0.224, 0.225] ``` 1. Podzbiór klas (8 wybranych klas) | Model | Normalizacja | CenterCrop | |--------|--------------|------------| | 3D-CNN | NIE | 100x100 | | 3D-CNN | TAK | 84x84 | 3. Pełny zbiór | Model | Normalizacja | CenterCrop | Optimizer | LR | batch size | |--------|--------------|------------|-----------|------------------|------------| | 3D-CNN | TAK | 84x84 | Adam | 1e-3 | 10 | | 3D-CNN | TAK | 84x84 | Adam | warmup (1e-6) | 10 | | 3D-CNN | TAK | 84x84 | Adam | multistep (1e-3) | 10 | | 3D-CNN | TAK | 84x84 | Adam | multistep (1e-5) | 24 | | 3D-CNN | TAK | 84x84 | Adam | multistep (1e-3) | 24 | 4. Plan (na pełnym zbiorze) *!Po analizie błędów może ulec zmianie!* - [ ] warmup + btach_size=24 - [x] multi_step=(1e-3) + btach_size=24 - [ ] CenterCrop=100 - [ ] mniejsza wersja sieci - [ ] najlepszy setup + sampler balansujący klasy - [ ] jeśli starczy czasu (ewentualnie do raportu): - [ ] padding przy pomocy powtarzania rekursywnego ramek, jak [w tej pracy](https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8803152) - [ ] data augmentation - [ ] greyscale ??? - [ ] LSTM-CNN