export more data for the tokenizer name preparation

[nominatim.git] / test / python / test_tokenizer_icu.py
diff --git a/test/python/test_tokenizer_icu.py b/test/python/test_tokenizer_icu.py

index ed079269561ff8ba8a19b56ecaff840ec0bd0c93..bbfc0b120d0a98405fb77aabdc1e48266ae541a2 100644 (file)
--- a/test/python/test_tokenizer_icu.py
+++ b/test/python/test_tokenizer_icu.py
@@ -11,6 +11,7 @@ from nominatim.tokenizer.icu_name_processor import ICUNameProcessorRules
  from nominatim.tokenizer.icu_rule_loader import ICURuleLoader
  from nominatim.db import properties
  from nominatim.db.sql_preprocessor import SQLPreprocessor
+from nominatim.indexer.place_info import PlaceInfo
  
  from mock_icu_word_table import MockIcuWordTable
  
@@ -322,30 +323,41 @@ class TestPlaceNames:
          assert eval(info['names']) == set((t[2] for t in tokens))
  
  
+    def process_named_place(self, names):
+        place = {'name': names}
+
+        return self.analyzer.process_place(PlaceInfo(place))
+
+
      def test_simple_names(self):
-        info = self.analyzer.process_place({'name': {'name': 'Soft bAr', 'ref': '34'}})
+        info = self.process_named_place({'name': 'Soft bAr', 'ref': '34'})
  
          self.expect_name_terms(info, '#Soft bAr', '#34', 'Soft', 'bAr', '34')
  
  
      @pytest.mark.parametrize('sep', [',' , ';'])
      def test_names_with_separator(self, sep):
-        info = self.analyzer.process_place({'name': {'name': sep.join(('New York', 'Big Apple'))}})
+        info = self.process_named_place({'name': sep.join(('New York', 'Big Apple'))})
  
          self.expect_name_terms(info, '#New York', '#Big Apple',
                                       'new', 'york', 'big', 'apple')
  
  
      def test_full_names_with_bracket(self):
-        info = self.analyzer.process_place({'name': {'name': 'Houseboat (left)'}})
+        info = self.process_named_place({'name': 'Houseboat (left)'})
  
          self.expect_name_terms(info, '#Houseboat (left)', '#Houseboat',
                                       'houseboat', 'left')
  
  
      def test_country_name(self, word_table):
-        info = self.analyzer.process_place({'name': {'name': 'Norge'},
-                                           'country_feature': 'no'})
+        place = PlaceInfo({'name' : {'name': 'Norge'},
+                           'country_code': 'no',
+                           'rank_address': 4,
+                           'class': 'boundary',
+                           'type': 'administrative'})
+
+        info = self.analyzer.process_place(place)
  
          self.expect_name_terms(info, '#norge', 'norge')
          assert word_table.get_country() == {('no', 'NORGE')}
@@ -361,7 +373,7 @@ class TestPlaceAddress:
  
  
      def process_address(self, **kwargs):
-        return self.analyzer.process_place({'address': kwargs})
+        return self.analyzer.process_place(PlaceInfo({'address': kwargs}))
  
  
      def name_token_set(self, *expected_terms):