# Tymczasowa ściągawka Wikicytaty: https://dumps.wikimedia.org/plwikiquote/20231220/ ## Indeks: Wikipedia ```python { "title": tytuł artykułu, "text_1k": pierwsze 1000 znaków tekstu, "text_10k": pierwsze 10 000 znaków tekstu, "text": cały tekst } ``` ## Wykonywanie zapytań ```python !pip install elasticsearch import elasticsearch ``` ```python ES = elasticsearch.Elasticsearch( ['http://budujemywyszukiwarke.kazet.cc:9200'], basic_auth=( 'elastic', 'b97c3f906bb3cf05c97fcc84d58d92c9f45d43dd') ) search_query = { "query": { "match" : {"title" : "Warszawa"} } } result = ES.search(index="wikipedia", body=search_query) ``` ## Przykładowe wyniki ``` { "took": 4, "timed_out": false, "_shards": { "total": 1, "successful": 1, "skipped": 0, "failed": 0 }, "hits": { "total": { "value": 1295, "relation": "eq" }, "max_score": 10.431456, "hits": [ { "_index": "wikipedia", "_id": "5aab708fb8", "_score": 10.431456, "_ignored": [ "text_10k.keyword", "text.keyword", "text_1k.keyword" ], "_source": { "id": "5aab708fb8", "title": "Warszawa", "text_1k": "{{Inne znaczenia|miasta|[[Warszawa (ujednoznacznie...", "text_10k": "{{Inne znaczenia|miasta|[[Warszawa (ujednoznacznie...", "text": "{{Inne znaczenia|miasta|[[Warszawa (ujednoznacznie..." } }, ``` ## Wrzucanie do Elasticsearcha ``` ES.index(index='kzajac-test', id=1, body={"title": "title1", "content": "content jeden"}) ES.index(index='kzajac-test', id=2, body={"title": "title2", "content": "content dwa"}) ES.index(index='kzajac-test', id=3, body={"title": "title3", "content": "content trzy"}) ```