From 3ce123ab69d7f9807867fda5f8b9b6a520e3bc63 Mon Sep 17 00:00:00 2001
From: Sarah Hoffmann <lonvia@denofr.de>
Date: Thu, 20 Jan 2022 20:21:13 +0100
Subject: [PATCH] do not clean housenumbers in reverse-only mode

---
 nominatim/tokenizer/icu_tokenizer.py | 10 ++++++----
 1 file changed, 6 insertions(+), 4 deletions(-)

diff --git a/nominatim/tokenizer/icu_tokenizer.py b/nominatim/tokenizer/icu_tokenizer.py
index 0841300a..f5addd3e 100644
--- a/nominatim/tokenizer/icu_tokenizer.py
+++ b/nominatim/tokenizer/icu_tokenizer.py
@@ -116,20 +116,22 @@ class LegacyICUTokenizer(AbstractTokenizer):
         """ Remove unused house numbers.
         """
         with connect(self.dsn) as conn:
+            if not conn.table_exists('search_name'):
+                return
             with conn.cursor(name="hnr_counter") as cur:
                 cur.execute("""SELECT word_id, word_token FROM word
                                WHERE type = 'H'
                                  AND NOT EXISTS(SELECT * FROM search_name
                                                 WHERE ARRAY[word.word_id] && name_vector)
                                  AND (char_length(word_token) > 6
-                                      OR word_token not similar to '\d+')
+                                      OR word_token not similar to '\\d+')
                             """)
                 candidates = {token: wid for wid, token in cur}
             with conn.cursor(name="hnr_counter") as cur:
                 cur.execute("""SELECT housenumber FROM placex
                                WHERE housenumber is not null
                                      AND (char_length(housenumber) > 6
-                                          OR housenumber not similar to '\d+')
+                                          OR housenumber not similar to '\\d+')
                             """)
                 for row in cur:
                     for hnr in row[0].split(';'):
@@ -146,9 +148,9 @@ class LegacyICUTokenizer(AbstractTokenizer):
     def update_word_tokens(self):
         """ Remove unused tokens.
         """
-        LOG.warn("Cleaning up housenumber tokens.")
+        LOG.warning("Cleaning up housenumber tokens.")
         self._cleanup_housenumbers()
-        LOG.warn("Tokenizer house-keeping done.")
+        LOG.warning("Tokenizer house-keeping done.")
 
 
     def name_analyzer(self):
-- 
2.39.5