]> git.openstreetmap.org Git - nominatim.git/blob - src/nominatim_api/search/query_analyzer_factory.py
Merge remote-tracking branch 'upstream/master'
[nominatim.git] / src / nominatim_api / search / query_analyzer_factory.py
1 # SPDX-License-Identifier: GPL-3.0-or-later
2 #
3 # This file is part of Nominatim. (https://nominatim.org)
4 #
5 # Copyright (C) 2024 by the Nominatim developer community.
6 # For a full list of authors see the git log.
7 """
8 Factory for creating a query analyzer for the configured tokenizer.
9 """
10 from typing import List, cast, TYPE_CHECKING
11 from abc import ABC, abstractmethod
12 from pathlib import Path
13 import importlib
14
15 from ..logging import log
16 from ..connection import SearchConnection
17
18 if TYPE_CHECKING:
19     from .query import Phrase, QueryStruct
20
21
22 class AbstractQueryAnalyzer(ABC):
23     """ Class for analysing incoming queries.
24
25         Query analyzers are tied to the tokenizer used on import.
26     """
27
28     @abstractmethod
29     async def analyze_query(self, phrases: List['Phrase']) -> 'QueryStruct':
30         """ Analyze the given phrases and return the tokenized query.
31         """
32
33     @abstractmethod
34     def normalize_text(self, text: str) -> str:
35         """ Bring the given text into a normalized form. That is the
36             standardized form search will work with. All information removed
37             at this stage is inevitably lost.
38         """
39
40
41 async def make_query_analyzer(conn: SearchConnection) -> AbstractQueryAnalyzer:
42     """ Create a query analyzer for the tokenizer used by the database.
43     """
44     name = await conn.get_property('tokenizer')
45
46     src_file = Path(__file__).parent / f'{name}_tokenizer.py'
47     if not src_file.is_file():
48         log().comment(f"No tokenizer named '{name}' available. Database not set up properly.")
49         raise RuntimeError('Tokenizer not found')
50
51     module = importlib.import_module(f'nominatim_api.search.{name}_tokenizer')
52
53     return cast(AbstractQueryAnalyzer, await module.create_query_analyzer(conn))