]> git.openstreetmap.org Git - nominatim.git/blob - utils/specialphrases.php
Merge pull request #2115 from lonvia/use-dotenv
[nominatim.git] / utils / specialphrases.php
1 <?php
2
3 require_once(CONST_LibDir.'/init-cmd.php');
4 ini_set('memory_limit', '800M');
5 ini_set('display_errors', 'stderr');
6
7 $aCMDOptions
8 = array(
9    'Import and export special phrases',
10    array('help', 'h', 0, 1, 0, 0, false, 'Show Help'),
11    array('quiet', 'q', 0, 1, 0, 0, 'bool', 'Quiet output'),
12    array('verbose', 'v', 0, 1, 0, 0, 'bool', 'Verbose output'),
13    array('wiki-import', '', 0, 1, 0, 0, 'bool', 'Create import script for search phrases '),
14    array('project-dir', '', 0, 1, 1, 1, 'realpath', 'Base directory of the Nominatim installation (default: .)'),
15   );
16 getCmdOpt($_SERVER['argv'], $aCMDOptions, $aCMDResult, true, true);
17
18 loadSettings($aCMDResult['project-dir'] ?? getcwd());
19 setupHTTPProxy();
20
21 include(getSettingConfig('PHRASE_CONFIG', 'phrase_settings.php'));
22
23 if ($aCMDResult['wiki-import']) {
24     $oNormalizer = Transliterator::createFromRules(getSetting('TERM_NORMALIZATION'));
25     $aPairs = array();
26
27     $sLanguageIn = getSetting(
28         'LANGUAGES',
29         'af,ar,br,ca,cs,de,en,es,et,eu,fa,fi,fr,gl,hr,hu,'.
30         'ia,is,it,ja,mk,nl,no,pl,ps,pt,ru,sk,sl,sv,uk,vi'
31     );
32
33     foreach (explode(',', $sLanguageIn) as $sLanguage) {
34         $sURL = 'https://wiki.openstreetmap.org/wiki/Special:Export/Nominatim/Special_Phrases/'.strtoupper($sLanguage);
35         $sWikiPageXML = file_get_contents($sURL);
36
37         if (!preg_match_all(
38             '#\\| ([^|]+) \\|\\| ([^|]+) \\|\\| ([^|]+) \\|\\| ([^|]+) \\|\\| ([\\-YN])#',
39             $sWikiPageXML,
40             $aMatches,
41             PREG_SET_ORDER
42         )) {
43             continue;
44         }
45
46         foreach ($aMatches as $aMatch) {
47             $sLabel = trim($aMatch[1]);
48             if ($oNormalizer !== null) {
49                 $sTrans = pg_escape_string($oNormalizer->transliterate($sLabel));
50             } else {
51                 $sTrans = null;
52             }
53             $sClass = trim($aMatch[2]);
54             $sType = trim($aMatch[3]);
55             // hack around a bug where building=yes was imported with
56             // quotes into the wiki
57             $sType = preg_replace('/(&quot;|")/', '', $sType);
58             // sanity check, in case somebody added garbage in the wiki
59             if (preg_match('/^\\w+$/', $sClass) < 1
60                 || preg_match('/^\\w+$/', $sType) < 1
61             ) {
62                 trigger_error("Bad class/type for language $sLanguage: $sClass=$sType");
63                 exit;
64             }
65             // blacklisting: disallow certain class/type combinations
66             if (isset($aTagsBlacklist[$sClass]) && in_array($sType, $aTagsBlacklist[$sClass])) {
67                 // fwrite(STDERR, "Blacklisted: ".$sClass."/".$sType."\n");
68                 continue;
69             }
70             // whitelisting: if class is in whitelist, allow only tags in the list
71             if (isset($aTagsWhitelist[$sClass]) && !in_array($sType, $aTagsWhitelist[$sClass])) {
72                 // fwrite(STDERR, "Non-Whitelisted: ".$sClass."/".$sType."\n");
73                 continue;
74             }
75             $aPairs[$sClass.'|'.$sType] = array($sClass, $sType);
76
77             switch (trim($aMatch[4])) {
78                 case 'near':
79                     printf(
80                         "SELECT getorcreate_amenityoperator(make_standard_name('%s'), '%s', '%s', '%s', 'near');\n",
81                         pg_escape_string($sLabel),
82                         $sTrans,
83                         $sClass,
84                         $sType
85                     );
86                     break;
87                 case 'in':
88                     printf(
89                         "SELECT getorcreate_amenityoperator(make_standard_name('%s'), '%s', '%s', '%s', 'in');\n",
90                         pg_escape_string($sLabel),
91                         $sTrans,
92                         $sClass,
93                         $sType
94                     );
95                     break;
96                 default:
97                     printf(
98                         "SELECT getorcreate_amenity(make_standard_name('%s'), '%s', '%s', '%s');\n",
99                         pg_escape_string($sLabel),
100                         $sTrans,
101                         $sClass,
102                         $sType
103                     );
104                     break;
105             }
106         }
107     }
108
109     echo 'CREATE INDEX idx_placex_classtype ON placex (class, type);';
110
111     foreach ($aPairs as $aPair) {
112         $sql_tablespace = getSetting('TABLESPACE_AUX_DATA');
113         if ($sql_tablespace) {
114             $sql_tablespace = ' TABLESPACE '.$sql_tablespace;
115         }
116
117         printf(
118             'CREATE TABLE place_classtype_%s_%s'
119             . $sql_tablespace
120             . ' AS'
121             . ' SELECT place_id AS place_id,st_centroid(geometry) AS centroid FROM placex'
122             . " WHERE class = '%s' AND type = '%s'"
123             . ";\n",
124             pg_escape_string($aPair[0]),
125             pg_escape_string($aPair[1]),
126             pg_escape_string($aPair[0]),
127             pg_escape_string($aPair[1])
128         );
129
130         printf(
131             'CREATE INDEX idx_place_classtype_%s_%s_centroid'
132             . ' ON place_classtype_%s_%s USING GIST (centroid)'
133             . $sql_tablespace
134             . ";\n",
135             pg_escape_string($aPair[0]),
136             pg_escape_string($aPair[1]),
137             pg_escape_string($aPair[0]),
138             pg_escape_string($aPair[1])
139         );
140
141         printf(
142             'CREATE INDEX idx_place_classtype_%s_%s_place_id'
143             . ' ON place_classtype_%s_%s USING btree(place_id)'
144             . $sql_tablespace
145             . ";\n",
146             pg_escape_string($aPair[0]),
147             pg_escape_string($aPair[1]),
148             pg_escape_string($aPair[0]),
149             pg_escape_string($aPair[1])
150         );
151
152         printf(
153             'GRANT SELECT ON place_classtype_%s_%s TO "%s"'
154             . ";\n",
155             pg_escape_string($aPair[0]),
156             pg_escape_string($aPair[1]),
157             getSetting('DATABASE_WEBUSER')
158         );
159     }
160
161     echo 'DROP INDEX idx_placex_classtype;';
162 }