DATENSATZKONFIGURATION
Intelligente Suche mit Elasticsearch für Shopware

Der Name des Feldes

Die Tabelle von den gewünschten Produkt Namen.

Wird benötigt Wenn sie pro Channel das Feld unterschiedlich konfguriert haben wollen

Bei der Auswahl no select wird der Datensatz für alle Sprachen verwendet
Falls Sie den Datensatz für ihre Sprache unterschiedlich konfguriert haben wollen,
sollte hier diese Option mit der Auswahl der Sprache genutzt werden

Ist in der regel Text. Zahlen können zwar auch indexiert werden wird aber
nur individuell Abfragen benötigt

Bevorzugung beim Ranking

Rechtschreibung

Defniert die Art wie die Daten im Elasticsearch Server gespeichert werden.

➢Bei Auswahlmöglichkeit Classic tokenizer: Dieser tokenizer speichert gesamte Wörter und ist besonders bei englischer Sprache zu empfehlen.
➢Bei Auswahlmöglichkeit Lowercase tokenizer: Dieser tokenizer speichert gesamte Wörter in Kleinbuchstaben.
➢Bei Auswahlmöglichkeit: Edge_n-gram_tokenizer: Dieser tokenizer trennt Wörter in kleinere Abschnitte und speichert diese. (Die Abschnitte können individuell angepasst werden – siehe hierzu unten stehend die Erläuterung zu Min-Edge und Max-Edge)
➢Bei Auswahlmöglichkeit Ngram: Dieser Tokenizer trennt Wörter ebenfalls in kleinere Abschnitte und speichert diese. Findet im Gegensatz zum Edge_n-gram_tokenizer aber auch Abschnitte mitten im Wort.(Link eintragen zum Ngram tokenizer)
➢Old Ngram wird beim nächsten Update ausgebaut ➢Auswahlmöglichkeit Simple Pattern: Dieser tokenizer ist nur für Programmierer angedacht. Es können regex und lucene regular expressions verwendet werden, um seine token zu speichern.
➢Auswahlmöglichkeit Letter tokenizer: Dieser tokenizer speichert ganze Wörter und extrahiert Sonderzeichen zwischen den Wörtern. Nachteil: Dieser tokenizer speichert keine Zahlen.
➢Auswahlmöglichkeit Standard tokenizer: Dieser tokenizer speichert ganze Wörter, Zahlen und Sonderzeichen.
➢Auswahlmöglichkeit Whitespace: Der Whitespace speichert ganze Wörter und trennt diese nach dem Leerzeichen. Ist besonders gut geeignet für Artikelnummern da Sonderzeichen wie - ; , ; ` mitgespeichert werden
➢Auswahlmöglichkeit Keywords: Der Keyword tokenizer speichert 1 zu 1 das Wort

3 Filter stehen zur Auswahl, in den häufgsten Fällen werden allerdings nur 1oder 2 Filter benötigt.

➢Filter Lowercase sollte immer verwendet werden um groß und klein Schreibung zu ignorieren.
➢Filter Classic entfernt Sonderzeichen wie zum Beispiel: - / . / ` etc.
➢Filter Truncate kürzt Wortabschnitte die mehr als 10 Zeichen beinhalten.
➢Filter Autocomplete vervollständigt Wortabschnitte, EMPFEHLUNG: Dieser Filter sollte nur beim Produktnamen verwendet werden, da es sonst zu viele Treffer bzw. Suchergebnisse gibt und die Suche an Geschwindigkeit verliert
➢Filter Synonyme bietet die Möglichkeit alternative Schlagwörter in der Suche zu verwenden. HINWEIS: Dieser Filterist nicht nutzbar in Verbindung mit dem Autocomplete Filter oder dem Edge Tokenizer.
➢Alternativ können die Shopwareschlagwörter als Synonyme verwendet werden, indem sie in ein eigenes Feld indexiert werden. Hierfür müsste ein neuer Datennsatz angelegt werden / Feldname: Keyword / Tabellenname: Search / Tokenizer: Standard / Filter: Lowercase
➢Filter Word_delimiter:graph entfernt Sonderzeichen und splittet in exakte Wortabschnitte. Der Filter sollte immer inVerbindung mit dem Keyword Tokenizer verwendet werden.


EMPFEHLUNG: Dieser Tokenizer ist ein sehr guter Tokenizer, für evtl. auftretende Findungslücken,
müsste in der Pluginconfg der Suggester aktiviert und indexiert werden.

Zumeist wird die Kombination folgender Filter verwendet:
Tokenizer Standard +Autocomplete Filter & Lowercase Filter oder alternativ
Tokenizer Keyword + Lowercase Filter & Word_delimiter_graph Filter (+ Aktivierung des Suggesters in der Pluginconfg, sowie Indexierung in der Elasticsearch)

bei der erst Einrichtung bitte nicht verstellen weil es leeren Suchergebnissen kommen kann
Bestimmt wie viele Wörter da zwischen sein dürfen

Ist fine tunning sollte bei der erst Einrichtung nicht verstellt werden
Bei der Suche mehrere Felder kann eine Prozentzahl angeben werden bei wie vielen Felder es matchen soll

Und oder oder Verknüpfung innerhalb des Feldes

Bei Auswahl Ja versucht Elasticsearch eine automatisierte Synonym-Erstellung. Funktioniert allerdings nicht in
Verbindung mit der Abschnittssuche (Autocomplete Filter bzw. Edge Tokenizer)

Fine Einstellung rechtschreib- Prüfung

Schlagwörter die angeben werden können

Der Bedarf der Einstellung kommt in den seltensten Szenarien vor. Falls Stopwörter verwendet werden sollen, muss die Sprache im Channel angegeben werden, um die automatisierten Stopwörter der jeweiligen Sprache zu verwenden.

Hier können eigene Stopwörter (Bindewörter) der Elasticsearch hinzugefügt werden, diese müssen immer durch Kommasgetrennt werden.

Sollte bei HTML Tags entfernen die Auswahlmöglichkeit ja getroffen worden sein, können in diesem Feld spezifsche
HTML Tags kommasepariert eingegeben werden, welche dann in der Suche ausgegeben werden.

Bei Auswahl ja wird der Produktname um die Werte, die auf der Produktebene vergeben wurden, erweitert.

Beispiel: In dem Datensatz Manufacturer wird die Auswahl „ja“ gewählt. Ein Produkt (Kugelschreiber) wurde dem Hersteller signundsinn zugewiesen. Der Frontenduser (Shopbesucher) gibt in das Suchfeld „Kugelschreiber signundsinn“ ein, so werden nur Produkte die dem Manufacturer signundsinn zugewiesen sind, angezeigt – vorausgesetzt im Datensatz „Produktname“ wird die „und-Verknüpfung“ ausgewählt.

Um die Ergebnisdarstellung noch zu verbessern, sollte im Feld „Treffer Hervorhebung“ die Auswahl „Treffer hervorheben wenn Sie mehrere Felder in den Produktnamen indexieren“ verwendet werden.Sonderzeichen entfernen aus dem Index. Sehr gut kombinierbar mit dem Whitespace Tokenizer. Alle Sonderzeichen mit einem Zeilenumbruch eingeben.Beispiel: Artikelbezeichnung: Autoreifen-5 205/55 R16 91V Der Frontenduser würde gewöhnlicherweise in das Suchfeld Autoreifen 5 205 55 R16 91V eingeben.Damit dieses Produkt gefunden werden kann, müsste in diesem Feld die Sonderzeichen – und / per Zeilenumbruch untereinander eingefügt werden.Dokumentenversion: 0.1Datei: Elastisearch_doku_Datensatze_20.12.2021signundsinn GmbHDatum: 20. Dezember 2021