### Prinzipien der Sinneswahrnehmung
***
#### Wunderwerk Sinne
<!-- .slide: data-background="#b79a2b" -->
---
### Fehleinschätzung der frühen "angewandten KI"
- 1970er Jahre, Ziel: eine (1) wahrnehmende und (2) denkende Maschine
- Annahme: Phase 1, Wahrnehmung, ist leicht zu implementieren
- Jetzt: 50 Jahre später und das "Sommerprojekt" ist noch nicht wirklich abgeschlossen
<!-- .slide: data-background="#b79a2b" -->
---
### Fortschritte bis heute:
Erkennung von
- gedrucktem Text
- Sprache
- bewegten Objekten
- Gesichtern
- aber schon eine Brille kann alles kaputtmachen
<!-- .slide: data-background="#b79a2b" -->
---
> Für Menschen ist diese Art von Wahrnehmung kein Problem...:
> Die aktuell besten KIs werden heute noch in den meisten Wahrnehmungs-Aufgaben von **Dreijährigen** geschlagen
<!-- .slide: data-background="#b79a2b" -->
---
## Faszination: Alle Sinne
- winzige Fluktuationen des Energiemusters an den Sinnesrezeptoren
- ⇒ innerhalb von Millisekunden ⇒
- reichhaltiges Wahrnehmungserleben der Welt um uns
<!-- .slide: data-background="#b79a2b" -->
---
Wahrnehmung fühlt sich leicht und automatisch an
- ist es aber nicht
- Transparenzillusion
<!-- .slide: data-background="#b79a2b" -->
---
## 5 Sinne?
viel mehr! z.B. Fühlen: zahlreiche völlig unabh. Sinne:
- Druck
- Temperatur
- Oberfläche (Vibration)
- etc
<!-- .slide: data-background="#b79a2b" -->
---
## Sehsystem
- am besten untersucht
- Warum?
- einfachere Experimente, als z.B. für das Riechen
- Primaten visuell dominiert: Bis zu 80% der Neuronen unserer Großhirnrinde reagieren auf visuelle Stimulation
- Gut: Viele grundlegende Operationsprinzipien, die wir aus dem Sehsystem verstanden haben, gelten auch für die anderen Sinne allgemein (Aufbau bestimmter Neuronaler Netze usw)
<!-- .slide: data-background="#b79a2b" -->
---
## Themen heute:
1. Wahrnehmung ist faszinierend
2. Wahrnehmung ist inhärent inferentiell
3. Prinzip der Opponentenprozesse
<!-- .slide: data-background="#b79a2b" -->
---
### Beispiel: RSVP
***
#### Rapid Serial Visual Presentation
<!-- .slide: data-background="#b79a2b" -->
---
# RSVP
200 ms
<!-- .slide: data-background="#b79a2b" -->
---

<!-- .slide: data-background="#000" -->
---
# RSVP
100 ms
<!-- .slide: data-background="#b79a2b" -->
---

<!-- .slide: data-background="#000" -->
---
### RSVP
Aufgabe:
- 10 Bilder pro Sekunde, 100ms pro Bild
Erkenntnisse: Obwohl Stimuli so kurz:
1. Man kann die Objekte erkennen!
2. Man kann sich eine Menge davon merken
<!-- .slide: data-background="#b79a2b" -->
---
Das bedeutet
- zusätzlich schnelles Memory Encoding
- erfolgreiches Retrieval und
- Übersetzen der Objektbilder in lexikalische Objektnamen
<!-- .slide: data-background="#b79a2b" -->
---
> Innerhalb von 100ms kann man aus dem Lichtmuster ein Objekt wahrnehmen und mit einem verbalen Label assoziieren, auch wenn nicht mal Zeit für ein Nachprozessing ist, weil direkt das nächste Bild kommt.
<!-- .slide: data-background="#b79a2b" -->
---
Nicht Memory ist hier wichtig sondern die assoziative, erkennende Wahrnehmung (Recognition)
BEWEIS: Probe Word
<!-- .slide: data-background="#b79a2b" -->
---
# "Haus"
# "Flugzeug"
<!-- .slide: data-background="#b79a2b" -->
---

<!-- .slide: data-background="#000" -->
---
- Es geht!
- fällt sogar relativ leicht
- Performance vielleicht nicht 100%, aber dafür auch kein spürbarer Cognitive Load
Es funktioniert sogar, wenn zugleich eine Einordnung in breitere Kategorien erfolgen muss:
<!-- .slide: data-background="#b79a2b" -->
---
# "Essen"
# "Musikinstrument"
<!-- .slide: data-background="#b79a2b" -->
---

<!-- .slide: data-background="#000" -->
---
Funktioniert auch für:
- Objekt-Features: "Dinge oder Wesen die fliegen"
- abstraktes Klassifizieren in Fotos und Cartoons zB
<!-- .slide: data-background="#b79a2b" -->
---
Fantastisch weil:
- so kurze Zeit pro Bild
- keine realistischen Objekte, sondern abstrahierte Versionen ohne Details
- Keines der konkreten Bilder haben wir je zuvor gesehen,
- also kein "Wiedererkennen" eines visuellen Musters
<!-- .slide: data-background="#b79a2b" -->
---
> D.h. das visuelle System muss zusätzlich auch noch eine assoziative Pattern Recognition mit Prototypen durchführen.
<!-- .slide: data-background="#b79a2b" -->
---
# 50 ms
<!-- .slide: data-background="#b79a2b" -->
---

<!-- .slide: data-background="#000" -->
---
## RSVP
- mit 50ms, also 20 Bilder pro Sekunde
- Zielwort (Probe Word): "Musikinstrument"
<!-- .slide: data-background="#b79a2b" -->
---
## Auswertung
- schon schwerer
- Sehsystem ist nicht beliebig schnell!
- Bis 100ms ist es recht leicht
<!-- .slide: data-background="#b79a2b" -->
---
> Bisher ist kein Informationsverarbeitungssystem bekannt, dass dies so schnell kann wie das menschliche Gehirn - Kein derzeitiger Supercomputer, keine andere Tierart.
<!-- .slide: data-background="#b79a2b" -->
---
#### Aber: *"Attentional Blink"*
<!-- .slide: data-background="#b79a2b" -->
---
# Seht Ihr Elon Musk?
<!-- .slide: data-background="#b79a2b" -->
---

<!-- .slide: data-background="#000" -->
---
##### *"Attentional Blink"*
- Aufmerksamkeitsfokus auf Elon Musk führt dazu, dass im Experiment die Bilder unmittelbar *nach* Elon Musk nicht wahrgenommen werden
- Sobald das Target der Aufmerksamkeit erscheint, setzen zusätzliche kognitive Prozesse ein
- Während eines kurzen Zeitfensters, in dem diese Kognition stattfinden muss, ist der Wahrnehmungsapparat komplett "blind" für alles andere, was direkt vor den offenen Augen geschieht
<!-- .slide: data-background="#b79a2b" -->
---
### AUDITIVE WAHRNEHMUNG
***
#### Bsp Sprachverständnis
<!-- .slide: data-background="#b79a2b" -->
---
### Sprachverständnis
- mehrere Dutzend Sound Units pro Sekunde
- Wahrgenommen werden individuelle Worte
- tatsächlich ist Sprache ein kontinuierlicher Stream
- Bsp. Wortgrenzen-Detektion in einer unbekannten Fremdsprache problematisch
- Kantenparadox, Analogie Sehsystem: Figur-Hintergrund-Grenzen
<!-- .slide: data-background="#b79a2b" -->
---
#### Hörsystem: Processing ist...
- sehr schnell
- direkt im auditiven "Livestream"
- Wahrgenommenes wirkt rückwirkend!
<!-- .slide: data-background="#b79a2b" -->
---
### Konsonanten B/P
- Druck hinter Lippen, schlagartig Luft entlassen
- "gleichzeitig" Stimmbandvokalisation
- Unterschied
- nicht Härte des Konsonanten
- sondern "voice onset time"
- P Latenz 15 ms länger als B !
> Solche Timing-Feinheiten analysiert das Ohr Dutzende Male pro Sekunde ohne Unterbrechung
<!-- .slide: data-background="#b79a2b" -->
---
### Fühlen
- Nicht nur Druck
- Vibration
- Explorieren einer Oberflächenstruktur
- Bsp.: Wühlen in eine voller Tasche - Vibrationsinfo im Millisekundenbereich!
<!-- .slide: data-background="#b79a2b" -->
---
### Allgemein
- Sinne sammeln in Echtzeit eine Flut an sensorischer Inforrmation im ms-Bereich
- UND: Unmittelbar wird mit bereits bekannter, gespeicherter Information in Beziehung gesetzt und assoziiert
- UND: Kontextinformation wird einbezogen
-- Dabei wird durch Aufmeksamkeit Wahrnehmung für relevante Feaures verstärkt (gelb bei Bananenkauf) und andere Information weggefiltert (Autofahren)
<!-- .slide: data-background="#b79a2b" -->
---
### Perzeptionsprozess ist
- massiv
- komplex
- flexibel
- automatisch
- interaktiv
- präzise
- in jedem wachen Moment
<!-- .slide: data-background="#b79a2b" -->
---
#### Wie kann das erreicht werden?
- Ein Schlüsselkonzept: **Inferenz**
- Wohlinformierte Vermutungen über die Umgebung, basierend auf Sinnesinformation
- Was wir "wahr nehmen", sind diese Vermutungen/Inferenzen, NICHT die ursprüngliche Sinnesinformation!
- Sinne sind **"perzeptuell intelligent"**
- weil die Inferenzen so gut sind, macht das die Sinne so faszinierend
<!-- .slide: data-background="#b79a2b" -->
---
### Inferenz ist kein "kognitiver" Prozess.
Inferenz =
- Automatisch
- Unbewusst
- schnell
- basiert auf komplexer Integration verschiedener Informationsquellen
- passiert nicht erst auf höheren kognitiven Ebenen, sondern schon ab direkt an den Sinnesorganen selbst (Bsp Hörbahn)
<!-- .slide: data-background="#b79a2b" -->
---
### Filling-In-Prozesse
- Bsp. f. automatische, unbewusste Inferenz
- Bsp. Retina und Blind Spot - Versuch mit Stift/Papier
- Zwei Punkte, rechte Hand, rechtes Auge, linkes zu, linken Punkt fixieren
- Analogie JPG und Fax
- Obwohl der Punkt noch da ist, macht Retina eine Inferenz
- am wahrscheinlichsten
- Veridikales Vorwissen: Punkt da, bringt nichts
- Inferenz schon auf Retina!
<!-- .slide: data-background="#b79a2b" -->
---
### Erste Unterschiede Auge - Ohr:
- Hören: kognitive Inferenz oft stärker als sensorische Interpretation
- Sehen oft umgekehrt
<!-- .slide: data-background="#b79a2b" -->
---
### Filling-In-Prozesse
*Retina und Blind Spot - Fortsetzung*
- Ca. 1 Million Axone treten aus den Photorezeptoren in den Sehnerv (im Blinden Fleck); Sehnerv wiederum 1 Million Neurone
- nicht blind, sondern "gut geraten":
- Nicht schwarz, sondern imitiert Umgebungsinfo
- Experiment: mit anderen Hintrgrundfarben
- Experiment: mit delikatem Streifen- oder Karomuster hinter dem Punkt
<!-- .slide: data-background="#b79a2b" -->
----
- Retina übrigens auch "blind" überall dort, wo retinale Venen verlaufen
----
### Bsp. Pathologie: Macula-Degeneration
- beginnt in der Mitte und breitet sich langsam nach außen aus
- wird aber meist anfangs gar nicht bemerkt
- erst wenn schon recht weit fortgeschritten
- bis dahin Filling-In
Umgekehrt: Retinitis Pigmentosa
- beginnt peripher und wandert dann nach innen
- bleibt oft über Jahre unbemerkt
<!-- .slide: data-background="#b79a2b" -->
---
### Opponenten-Prozesse
***
#### ein dynamisches Grundprinzip des Gehirns
<!-- .slide: data-background="#b79a2b" -->
---
### Opponenten-Prozesse
***
- Ständiger Wettbewerb um Ressourcen
- dynamische neuronale Gleichgewichte nicht durch gemeinsames Aktivieren, sondern durch gegenseitiges Ausbremsen
<!-- .slide: data-background="#b79a2b" -->
---
#### Grundprinzip auf Mikro- und Makroebenen:
- Laterale Inhibition
- Plastizität von Arealen und Repräsentationen
- Handlungssteuerung als Gleichgewicht aus Impulsen und Hemmungen
<!-- .slide: data-background="#b79a2b" -->
---
#### Laterale Inhibition

<!-- .slide: data-background="#fff" -->
---
#### Plastizität von Arealen und Repräsentationen
![alttext][pictag]
[pictag]: https://www.researchgate.net/profile/Paul_Van_Donkelaar/publication/14600319/figure/fig1/AS:401277285617664@1472683368586/Figure-J-A-Map-of-a-portion-of-the-somatosensory-cortex-in-an-adult-owl-monkey-showing.png
<!-- .slide: data-background="#fff" -->
---
#### Plastizität von Arealen und Repräsentationen
![alttext][pictag]
[pictag]: https://i1.wp.com/images.theconversation.com/files/291807/original/file-20190910-190012-179d9d9.jpg?w=1110&ssl=1
<!-- .slide: data-background="#fff" -->
---
#### Plastizität von Arealen und Repräsentationen

<!-- .slide: data-background="#fff" -->
---
#### Handlungssteuerung als Gleichgewicht aus Impulsen und Hemmungen

<!-- .slide: data-background="#fff" -->
----
#### Handlungssteuerung als Gleichgewicht aus Impulsen und Hemmungen

<!-- .slide: data-background="#fff" -->
---
### Take Home
Unsere Sinne sind
- Bandbreiten**höchstleister**
- **intelligent** vor jeder Kognition
<!-- .slide: data-background="#b79a2b" -->
---
[EoT]
<!-- .slide: data-background="#b79a2b" -->
---
<!-- .slide: data-background="#b79a2b" -->
---
---




XXX

{"metaMigratedAt":"2023-06-17T10:55:14.894Z","metaMigratedFrom":"YAML","breaks":true,"slideOptions":"{\"theme\":\"dark\",\"transition\":\"convex\",\"allottedMinutes\":80,\"width\":\"120%\",\"height\":\"160%\",\"pause\":true,\"fragments\":true}","title":"MMG23 1.06 Prinzipien der Sinneswahrnehmung [p]","description":"type: slidetitle: MMG23 1.06 Prinzipien der Sinneswahrnehmungtags: edit,MMG,MMG1,VLslideOptions:theme: ‘dark’transition: ‘convex’allottedMinutes: 80width: 120%height: 160%","contributors":"[{\"id\":\"ea18ebc2-f16c-4ce7-b7b7-974565f2922e\",\"add\":38152,\"del\":24505}]"}