]> git.openstreetmap.org Git - nominatim.git/blob - nominatim/tools/country_info.py
1b61ae685cc6106ac522b00c9c08d582983e2039
[nominatim.git] / nominatim / tools / country_info.py
1 """
2 Functions for importing and managing static country information.
3 """
4 import psycopg2.extras
5
6 from nominatim.db import utils as db_utils
7 from nominatim.db.connection import connect
8
9 def setup_country_tables(dsn, sql_dir, ignore_partitions=False):
10     """ Create and populate the tables with basic static data that provides
11         the background for geocoding. Data is assumed to not yet exist.
12     """
13     db_utils.execute_file(dsn, sql_dir / 'country_name.sql')
14     db_utils.execute_file(dsn, sql_dir / 'country_osm_grid.sql.gz')
15
16     if ignore_partitions:
17         with connect(dsn) as conn:
18             with conn.cursor() as cur:
19                 cur.execute('UPDATE country_name SET partition = 0')
20             conn.commit()
21
22
23 def create_country_names(conn, tokenizer, languages=None):
24     """ Add default country names to search index. `languages` is a comma-
25         separated list of language codes as used in OSM. If `languages` is not
26         empty then only name translations for the given languages are added
27         to the index.
28     """
29     if languages:
30         languages = languages.split(',')
31
32     def _include_key(key):
33         return key == 'name' or \
34                (key.startswith('name:') and (not languages or key[5:] in languages))
35
36     with conn.cursor() as cur:
37         psycopg2.extras.register_hstore(cur)
38         cur.execute("""SELECT country_code, name FROM country_name
39                        WHERE country_code is not null""")
40
41         with tokenizer.name_analyzer() as analyzer:
42             for code, name in cur:
43                 names = {'countrycode': code}
44                 if code == 'gb':
45                     names['short_name'] = 'UK'
46                 if code == 'us':
47                     names['short_name'] = 'United States'
48
49                 # country names (only in languages as provided)
50                 if name:
51                     names.update(((k, v) for k, v in name.items() if _include_key(k)))
52
53                 analyzer.add_country_names(code, names)
54
55     conn.commit()