###### tags: `Machine Learning` `semestr 5`
# Projekt
### Pomysły
**Focus:** *data collection* czy *data processing*?
**Może?**
* generator st00pek :negative_squared_cross_mark:
* [Top 50 Machine Learning Ideas for Beginners](https://www.projectpro.io/article/top-10-machine-learning-projects-for-beginners-in-2021/397)
* jakiś *web scraping* z Amazona (np. badanie sekcji "Others have also purchased") i statystyki/rekomendacje na podstawie tych danych - czytałam o tym na [seminarium z wizualizacji danych](https://hackmd.io/jWrRFeLqQ4iuzGCukk8qsw)
* prosty klasyfikator *fake news*/spamu
* predyktor cen ciuchów (zbadać jaki wpływ na cenę ma np. marka, kolor, typ, pogoda czy pora roku, może uwzględnienie na mediach społecznościowych marki?)
* **Czy potrafimy na podstawie samej listy składników zgadnąć, na co to jest przepis** (można brać pod uwagę tylko kilka możliwych pozycji)**?** Istnieją gotowe zbiory danych na ten temat np. w [Kaggle](https://www.kaggle.com/datasets/shuyangli94/food-com-recipes-and-user-interactions).



* [Zgadywanie potrawy i jej wartości kalorycznej na podstawie zdjęcia](https://github.com/OlgaRomanova0709/Machine-Learning-project)
* [Wyświetlenie listy przepisów na potrawę ze zdjęcia](https://github.com/Murgio/Food-Recipe-CNN)
* [Klasyfikator potraw](https://simonb83.github.io/machine-learning-food-classification.html)
* [Generating recipes that actually work - Medium](https://towardsdatascience.com/using-machine-learning-to-generate-recipes-that-actually-works-b2331c85ab72)
**Przykładowe prace z poprzednich lat:**
* coś od Adamczyka - [2020](https://uniwroc.sharepoint.com/:p:/r/sites/MachineLearning202223/_layouts/15/Doc.aspx?sourcedoc=%7B3603A337-A7C5-41EA-8A71-506667648501%7D&file=2020_FinalPresentations.pptx&action=edit&mobileredirect=true) & [2021](https://uniwroc.sharepoint.com/:p:/r/sites/MachineLearning202223/_layouts/15/Doc.aspx?sourcedoc=%7B5670904B-BDC0-4049-9B21-2F2D29A7955D%7D&file=2021_FinalPresentations.pptx&action=edit&mobileredirect=true)
* [Github]()
* ...
### Narzędzia
* TensorFlow
* *scraping* danych ze sklepów internetowych/mediów społecznościowych za pomocą prostych skryptów np. pythonowych
* ...
$$dist = \sum_{i=1}^{3 \cdot size^2} |x\_train^{(i)} - x\_test^{(i)}|$$