rum модуль — расширение PostgreSQL для работы с RUM индексами

18.12.2021

PostgreSQL

Комментариев нет

Какие ограничения индекса GIN позволяет преодолеть RUM?

Во-первых, тип данных tsvector, помимо самих лексем, содержит информацию об их позициях внутри документа. В GIN-индексе эта информация не сохраняются. Из-за этого операции фразового поиска, появившиеся в версии 9.6, обслуживается GIN-индексом неэффективно и вынуждены обращаться к исходным данным для перепроверки.

Во-вторых, поисковые системы обычно возвращают результаты в порядке релевантности (что бы это ни означало). Для этого можно пользоваться функциями ранжирования ts_rank и ts_rank_cd, но их приходится вычислять для каждой строки результата, что, конечно, медленно.

Метод доступа RUM в первом приближении можно рассматривать как GIN, в который добавлена позиционная информация, и который поддерживает выдачу результата в нужном порядке (аналогично тому, как GiST умеет выдавать ближайших соседей). Пойдем по порядку.

https://github.com/postgrespro/rum

postgresql rum

rum модуль — расширение PostgreSQL для работы с RUM индексами

18.12.2021

PostgreSQL

Комментариев нет

Recommended Posts

SKIP LOCKED в PostgreSQL

Transactional Outbox таблица PostgreSQL

Описание плейбука Ansible по развертыванию кластера Postgresql + Patroni + Pgbouncer

Добавить комментарий Отменить ответ