]> git.openstreetmap.org Git - nominatim.git/commitdiff
more agressively reduce expected count for multi-word terms
authorSarah Hoffmann <lonvia@denofr.de>
Mon, 31 Mar 2025 09:06:21 +0000 (11:06 +0200)
committerSarah Hoffmann <lonvia@denofr.de>
Mon, 31 Mar 2025 09:18:22 +0000 (11:18 +0200)
Improves searching of non-latin scripts with forced token spaces.

src/nominatim_api/search/db_search_builder.py

index ddfddaa64878a0d6f05d297d7427cf4416156259..fdf9e2f8f25e25a97b1a997cf10054cf8e2fb262 100644 (file)
@@ -208,7 +208,7 @@ class SearchBuilder:
         addr_partials = [t for r in address for t in self.query.get_partials_list(r)]
         addr_tokens = list({t.token for t in addr_partials})
 
-        exp_count = min(t.count for t in name_partials.values()) / (2**(len(name_partials) - 1))
+        exp_count = min(t.count for t in name_partials.values()) / (3**(len(name_partials) - 1))
 
         if (len(name_partials) > 3 or exp_count < 8000):
             yield penalty, exp_count, dbf.lookup_by_names(list(name_partials.keys()), addr_tokens)