Как добавить словарь в цепочку обработки слов в конфигурации полнотекстового поиска PostgreSQL
Смотрим конфигурацию для полнотекстового поиска, например, на английском:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 |
laradrom=# \dF+ english Text search configuration "pg_catalog.english" Parser: "pg_catalog.default" Token | Dictionaries -----------------+-------------- asciihword | english_stem asciiword | english_stem email | simple file | simple float | simple host | simple hword | english_stem hword_asciipart | english_stem hword_numpart | simple hword_part | english_stem int | simple numhword | simple numword | simple sfloat | simple uint | simple url | simple url_path | simple version | simple word | english_stem |
Видим, в последней строчке, что слова обрабатываются словарем english_stem.
А нам, допустим, нужно убирать диакритические знаки (умляуты) из слов.
Для этого укажем перед english_stem словарь unaccent.
1 2 |
ALTER TEXT SEARCH CONFIGURATION english ALTER MAPPING FOR word WITH unaccent, english_stem; |
получится:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 |
laradrom=# \dF+ english Text search configuration "pg_catalog.english" Parser: "pg_catalog.default" Token | Dictionaries -----------------+-------------- asciihword | english_stem asciiword | english_stem email | simple file | simple float | simple host | simple hword | english_stem hword_asciipart | english_stem hword_numpart | simple hword_part | english_stem int | simple numhword | simple numword | simple sfloat | simple uint | simple url | simple url_path | simple version | simple word | unaccent, english_stem |
Recommended Posts
Пояснение конфига для Pgbouncer
12.02.2024
Конфигурационный шаблон jinja2 для Patroni
11.02.2024