]> git.openstreetmap.org Git - nominatim.git/blobdiff - nominatim/tokenizer/sanitizers/split_name_list.py
Vagrant and CI tests for Ubuntu 22.04
[nominatim.git] / nominatim / tokenizer / sanitizers / split_name_list.py
index 93651f3e8b3283d1095c58d9b357332f24b6d7e6..c9db0a9da83b2e7878133dc5e63e4477dfff29e5 100644 (file)
@@ -1,15 +1,21 @@
+# SPDX-License-Identifier: GPL-2.0-only
+#
+# This file is part of Nominatim. (https://nominatim.org)
+#
+# Copyright (C) 2022 by the Nominatim developer community.
+# For a full list of authors see the git log.
 """
 """
-Name processor that splits name values with multiple values into their components.
-"""
-import re
+Sanitizer that splits lists of names into their components.
 
 
-def create(func):
+Arguments:
+    delimiters: Define the set of characters to be used for
+                splitting the list. (default: ',;')
+"""
+def create(config):
     """ Create a name processing function that splits name values with
     """ Create a name processing function that splits name values with
-        multiple values into their components. The optional parameter
-        'delimiters' can be used to define the characters that should be used
-        for splitting. The default is ',;'.
+        multiple values into their components.
     """
     """
-    regexp = re.compile('[{}]'.format(func.get('delimiters', ',;')))
+    regexp = config.get_delimiter()
 
     def _process(obj):
         if not obj.names:
 
     def _process(obj):
         if not obj.names:
@@ -21,7 +27,7 @@ def create(func):
             if len(split_names) == 1:
                 new_names.append(name)
             else:
             if len(split_names) == 1:
                 new_names.append(name)
             else:
-                new_names.extend(name.clone(name=n) for n in split_names)
+                new_names.extend(name.clone(name=n) for n in split_names if n)
 
         obj.names = new_names
 
 
         obj.names = new_names