# ws22 Anfängerpraktikum
```mermaid
gantt
title Timeline
dateFormat YYYY-MM-DD
section Deadlines
Start :milestone, m1,2022-10-27, 1d
End :milestone, m2,2022-12-06, 1d
Abgabe :milestone, m2,2022-12-20, 1d
Meeting :milestone, m2,2022-11-08, 1d
Meeting :milestone, m3,2022-11-15, 1d
Meeting :milestone, m1,2022-11-22, 1d
Meeting :milestone, m1,2022-11-29, 1d
section Tasks
Create Timeline :a1,2022-10-27,2d
Setup Github: a1,2022-10-28,2d
Tidy Data :a1,2022-10-30,7d
Analyze Data: a1,2022-11-06,14d
Visualize Data: a1,2022-11-13,8d
Answer Questions(expose): a1,2022-11-18,7d
placeholder/problems: a1,2022-11-24,7d
Create Zusammenfasung :a1,2022-12-06,14d
section Presentation
Presentation :a1,2022-12-06,1d
Practice/create :a1,2022-11-30,6d
```
:::info
## Group meeting
weekly Thursday 10:00
:::
---
Github: https://github.com/czycs/ws22airbnb
---
## Software
R
github/gitlab
(hackmd)
overleaf
### Namenskonvention
YYYY-MM-DD_"aussagekräftiger Name"
---
## Tasks
- [x] Create Timeline
- [x] Contact Project Partner
- [x] read data
- [x] Tidy Data und Plausibilitätskontrollen
- [ ] Vorheriges Quartal Anschauen, ob es auswirkungen vom Oktoberfest zu sehen sind.
- [ ] Analyze Data
- [ ] (Wie) Unterscheiden sich die beiden Städte im Bezug auf die angebotenen Objekte?
- [ ] Wie wichtig sind Lage, Ausstattung und Reviews/Hosteigenschaften jeweils in den beiden Städten für den Mietpreis?
- [ ] Sind die Zusammenhänge zwischen diesen Variablen in beiden Städten ähnlich stark bzw. ähnlich strukturiert?
- [ ] create the presentation
- [ ] create summary
### Tidy data
- [ ] Fehler in den Daten?
- [ ] 0 Euro angebote entfernen
- [ ] Flowchart über geaänderte oder gelöschte Daten
- [ ] weiter verarbeitung möglich?
- [ ] Tabellen arbeitsfähig machen
- [ ] Plausibilitätskontrolle
### Analyze Data
- [ ] Graphische Darstellung
- [ ] Vergleichen von Variablen
- [ ] Finden von Zusammenhängen
- [ ]
---
## Questions to Scheipl
~~Intressenkonflikt, Fehlerhafte Daten expiernces/rooms
https://arxiv.org/ftp/arxiv/papers/2007/2007.03019.pdf
*"Interessenkonflikte aller Art sind offen zu legen. Diese können zu einem Rückzug von einer Studie führen."* (Folien # 16)~~
~~Wie funktioniert die zusammenarbeit mit David Ruegamer?(tidy berliner daten??)~~
## Vortrag
- min 20min max 25min



## Zusammenfassung
- 
## Abgabe
- 
## Lage
- gute/schlechte lage?
- mietspiegel bezirke
- entfernung zentrum?
- [] Daten aus Bezirken rausnehmen, schauen ob mietpreise stark schwanken (-> Lage nicht wichtig)
## Ausstattung
- gute/schlechte ausstattung
## Kennzahlanalyse
- Arithmetisches Mittel.
- Kurtosis.
- Median.
- Modalwert.
- Schiefe einer Verteilung.
- Varianz etc.
## Ameneties
- Groupen von Sinnvollen Variablen
z.B.
- Wifi
- Haushaltsgägenstände wie (Seife, Schampoo)
- zusammenhang zwischen n_reviews und mietpreis
- zusammenhand zwischen n_reviews, score_accuracy und mietpreis
## Grafiken
- ja
## Research
- https://towardsdatascience.com/exploring-machine-learning-for-airbnb-listings-in-toronto-efdbdeba2644
- https://www.kaggle.com/code/labdmitriy/inside-airbnb-london
- https://arxiv.org/pdf/1711.09196
- https://www.datacamp.com/tutorial/sentiment-analysis-R
- https://github.com/priyadarsanshankar/AirBnbPricePrediction/blob/master/code/EDA.ipynb
## Presentation
1. Fragestellung
2. Gliederung
3. Datensatz
4. Fragestellung
5. Vergleich unterscheide angeboten objekte "(Wie) Unterscheiden sich die beiden Städte im Bezug auf die angebotenen Objekte?"+ Zusammenhang
### Titelseite