]> git.openstreetmap.org Git - nominatim.git/blob - sql/functions.sql
5b17f6d034a927e17460d6d9e4f692addb21bd08
[nominatim.git] / sql / functions.sql
1 --DROP TRIGGER IF EXISTS place_before_insert on placex;
2 --DROP TRIGGER IF EXISTS place_before_update on placex;
3 --CREATE TYPE addresscalculationtype AS (
4 --  word text,
5 --  score integer
6 --);
7
8 CREATE OR REPLACE FUNCTION getclasstypekey(c text, t text) RETURNS TEXT
9   AS $$
10 DECLARE
11 BEGIN
12   RETURN c||'|'||t;
13 END;
14 $$
15 LANGUAGE plpgsql IMMUTABLE;
16
17 CREATE OR REPLACE FUNCTION isbrokengeometry(place geometry) RETURNS BOOLEAN
18   AS $$
19 DECLARE
20   NEWgeometry geometry;
21 BEGIN
22   NEWgeometry := place;
23   IF ST_IsEmpty(NEWgeometry) OR NOT ST_IsValid(NEWgeometry) OR ST_X(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') THEN  
24     RETURN true;
25   END IF;
26   RETURN false;
27 END;
28 $$
29 LANGUAGE plpgsql IMMUTABLE;
30
31 CREATE OR REPLACE FUNCTION clean_geometry(place geometry) RETURNS geometry
32   AS $$
33 DECLARE
34   NEWgeometry geometry;
35 BEGIN
36   NEWgeometry := place;
37   IF ST_X(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') THEN  
38     NEWgeometry := ST_buffer(NEWgeometry,0);
39     IF ST_X(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') THEN  
40       RETURN ST_SetSRID(ST_Point(0,0),4326);
41     END IF;
42   END IF;
43   RETURN NEWgeometry;
44 END;
45 $$
46 LANGUAGE plpgsql IMMUTABLE;
47
48 CREATE OR REPLACE FUNCTION geometry_sector(partition INTEGER, place geometry) RETURNS INTEGER
49   AS $$
50 DECLARE
51   NEWgeometry geometry;
52 BEGIN
53 --  RAISE WARNING '%',place;
54   NEWgeometry := ST_PointOnSurface(place);
55 --  IF ST_IsEmpty(NEWgeometry) OR NOT ST_IsValid(NEWgeometry) OR ST_X(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') THEN  
56 --    NEWgeometry := ST_buffer(NEWgeometry,0);
57 --    IF ST_IsEmpty(NEWgeometry) OR NOT ST_IsValid(NEWgeometry) OR ST_X(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') THEN  
58 --      RETURN 0;
59 --    END IF;
60 --  END IF;
61   RETURN (partition*1000000) + (500-ST_X(NEWgeometry)::integer)*1000 + (500-ST_Y(NEWgeometry)::integer);
62 END;
63 $$
64 LANGUAGE plpgsql IMMUTABLE;
65
66 CREATE OR REPLACE FUNCTION transliteration(text) RETURNS text
67   AS '{modulepath}/nominatim.so', 'transliteration'
68 LANGUAGE c IMMUTABLE STRICT;
69
70 CREATE OR REPLACE FUNCTION gettokenstring(text) RETURNS text
71   AS '{modulepath}/nominatim.so', 'gettokenstring'
72 LANGUAGE c IMMUTABLE STRICT;
73
74 CREATE OR REPLACE FUNCTION make_standard_name(name TEXT) RETURNS TEXT
75   AS $$
76 DECLARE
77   o TEXT;
78 BEGIN
79   o := gettokenstring(transliteration(name));
80   RETURN trim(substr(o,1,length(o)));
81 END;
82 $$
83 LANGUAGE 'plpgsql' IMMUTABLE;
84
85 -- returns NULL if the word is too common
86 CREATE OR REPLACE FUNCTION getorcreate_word_id(lookup_word TEXT) 
87   RETURNS INTEGER
88   AS $$
89 DECLARE
90   lookup_token TEXT;
91   return_word_id INTEGER;
92   count INTEGER;
93 BEGIN
94   lookup_token := trim(lookup_word);
95   SELECT min(word_id), max(search_name_count) FROM word WHERE word_token = lookup_token and class is null and type is null into return_word_id, count;
96   IF return_word_id IS NULL THEN
97     return_word_id := nextval('seq_word');
98     INSERT INTO word VALUES (return_word_id, lookup_token, regexp_replace(lookup_token,E'([^0-9])\\1+',E'\\1','g'), null, null, null, null, 0, null);
99   ELSE
100     IF count > get_maxwordfreq() THEN
101       return_word_id := NULL;
102     END IF;
103   END IF;
104   RETURN return_word_id;
105 END;
106 $$
107 LANGUAGE plpgsql;
108
109 CREATE OR REPLACE FUNCTION getorcreate_housenumber_id(lookup_word TEXT)
110   RETURNS INTEGER
111   AS $$
112 DECLARE
113   lookup_token TEXT;
114   return_word_id INTEGER;
115 BEGIN
116   lookup_token := ' '||trim(lookup_word);
117   SELECT min(word_id) FROM word WHERE word_token = lookup_token and class='place' and type='house' into return_word_id;
118   IF return_word_id IS NULL THEN
119     return_word_id := nextval('seq_word');
120     INSERT INTO word VALUES (return_word_id, lookup_token, null, null, 'place', 'house', null, 0, null);
121   END IF;
122   RETURN return_word_id;
123 END;
124 $$
125 LANGUAGE plpgsql;
126
127 CREATE OR REPLACE FUNCTION getorcreate_country(lookup_word TEXT, lookup_country_code varchar(2))
128   RETURNS INTEGER
129   AS $$
130 DECLARE
131   lookup_token TEXT;
132   return_word_id INTEGER;
133 BEGIN
134   lookup_token := ' '||trim(lookup_word);
135   SELECT min(word_id) FROM word WHERE word_token = lookup_token and country_code=lookup_country_code into return_word_id;
136   IF return_word_id IS NULL THEN
137     return_word_id := nextval('seq_word');
138     INSERT INTO word VALUES (return_word_id, lookup_token, null, null, null, null, lookup_country_code, 0, null);
139   END IF;
140   RETURN return_word_id;
141 END;
142 $$
143 LANGUAGE plpgsql;
144
145 CREATE OR REPLACE FUNCTION getorcreate_amenity(lookup_word TEXT, lookup_class text, lookup_type text)
146   RETURNS INTEGER
147   AS $$
148 DECLARE
149   lookup_token TEXT;
150   return_word_id INTEGER;
151 BEGIN
152   lookup_token := ' '||trim(lookup_word);
153   SELECT min(word_id) FROM word WHERE word_token = lookup_token and class=lookup_class and type = lookup_type into return_word_id;
154   IF return_word_id IS NULL THEN
155     return_word_id := nextval('seq_word');
156     INSERT INTO word VALUES (return_word_id, lookup_token, null, null, lookup_class, lookup_type, null, 0, null);
157   END IF;
158   RETURN return_word_id;
159 END;
160 $$
161 LANGUAGE plpgsql;
162
163 CREATE OR REPLACE FUNCTION getorcreate_tagpair(lookup_class text, lookup_type text)
164   RETURNS INTEGER
165   AS $$
166 DECLARE
167   lookup_token TEXT;
168   return_word_id INTEGER;
169 BEGIN
170   lookup_token := lookup_class||'='||lookup_type;
171   SELECT min(word_id) FROM word WHERE word_token = lookup_token into return_word_id;
172   IF return_word_id IS NULL THEN
173     return_word_id := nextval('seq_word');
174     INSERT INTO word VALUES (return_word_id, lookup_token, null, null, null, null, null, 0, null);
175   END IF;
176   RETURN return_word_id;
177 END;
178 $$
179 LANGUAGE plpgsql;
180
181 CREATE OR REPLACE FUNCTION get_tagpair(lookup_class text, lookup_type text)
182   RETURNS INTEGER
183   AS $$
184 DECLARE
185   lookup_token TEXT;
186   return_word_id INTEGER;
187 BEGIN
188   lookup_token := lookup_class||'='||lookup_type;
189   SELECT min(word_id) FROM word WHERE word_token = lookup_token into return_word_id;
190   RETURN return_word_id;
191 END;
192 $$
193 LANGUAGE plpgsql;
194
195 CREATE OR REPLACE FUNCTION getorcreate_amenityoperator(lookup_word TEXT, lookup_class text, lookup_type text, op text)
196   RETURNS INTEGER
197   AS $$
198 DECLARE
199   lookup_token TEXT;
200   return_word_id INTEGER;
201 BEGIN
202   lookup_token := ' '||trim(lookup_word);
203   SELECT min(word_id) FROM word WHERE word_token = lookup_token and class=lookup_class and type = lookup_type and operator = op into return_word_id;
204   IF return_word_id IS NULL THEN
205     return_word_id := nextval('seq_word');
206     INSERT INTO word VALUES (return_word_id, lookup_token, null, null, lookup_class, lookup_type, null, 0, op, null);
207   END IF;
208   RETURN return_word_id;
209 END;
210 $$
211 LANGUAGE plpgsql;
212
213 CREATE OR REPLACE FUNCTION getorcreate_name_id(lookup_word TEXT, src_word TEXT) 
214   RETURNS INTEGER
215   AS $$
216 DECLARE
217   lookup_token TEXT;
218   nospace_lookup_token TEXT;
219   return_word_id INTEGER;
220 BEGIN
221   lookup_token := ' '||trim(lookup_word);
222   SELECT min(word_id) FROM word WHERE word_token = lookup_token and class is null and type is null into return_word_id;
223   IF return_word_id IS NULL THEN
224     return_word_id := nextval('seq_word');
225     INSERT INTO word VALUES (return_word_id, lookup_token, regexp_replace(lookup_token,E'([^0-9])\\1+',E'\\1','g'), src_word, null, null, null, 0, null);
226 --    nospace_lookup_token := replace(replace(lookup_token, '-',''), ' ','');
227 --    IF ' '||nospace_lookup_token != lookup_token THEN
228 --      INSERT INTO word VALUES (return_word_id, '-'||nospace_lookup_token, null, src_word, null, null, null, 0, null);
229 --    END IF;
230   END IF;
231   RETURN return_word_id;
232 END;
233 $$
234 LANGUAGE plpgsql;
235
236 CREATE OR REPLACE FUNCTION getorcreate_name_id(lookup_word TEXT) 
237   RETURNS INTEGER
238   AS $$
239 DECLARE
240 BEGIN
241   RETURN getorcreate_name_id(lookup_word, '');
242 END;
243 $$
244 LANGUAGE plpgsql;
245
246 CREATE OR REPLACE FUNCTION get_word_id(lookup_word TEXT) 
247   RETURNS INTEGER
248   AS $$
249 DECLARE
250   lookup_token TEXT;
251   return_word_id INTEGER;
252 BEGIN
253   lookup_token := trim(lookup_word);
254   SELECT min(word_id) FROM word WHERE word_token = lookup_token and class is null and type is null into return_word_id;
255   RETURN return_word_id;
256 END;
257 $$
258 LANGUAGE plpgsql IMMUTABLE;
259
260 CREATE OR REPLACE FUNCTION get_name_id(lookup_word TEXT) 
261   RETURNS INTEGER
262   AS $$
263 DECLARE
264   lookup_token TEXT;
265   return_word_id INTEGER;
266 BEGIN
267   lookup_token := ' '||trim(lookup_word);
268   SELECT min(word_id) FROM word WHERE word_token = lookup_token and class is null and type is null into return_word_id;
269   RETURN return_word_id;
270 END;
271 $$
272 LANGUAGE plpgsql IMMUTABLE;
273
274 CREATE OR REPLACE FUNCTION array_merge(a INTEGER[], b INTEGER[])
275   RETURNS INTEGER[]
276   AS $$
277 DECLARE
278   i INTEGER;
279   r INTEGER[];
280 BEGIN
281   IF array_upper(a, 1) IS NULL THEN
282     RETURN b;
283   END IF;
284   IF array_upper(b, 1) IS NULL THEN
285     RETURN a;
286   END IF;
287   r := a;
288   FOR i IN 1..array_upper(b, 1) LOOP  
289     IF NOT (ARRAY[b[i]] <@ r) THEN
290       r := r || b[i];
291     END IF;
292   END LOOP;
293   RETURN r;
294 END;
295 $$
296 LANGUAGE plpgsql IMMUTABLE;
297
298 CREATE OR REPLACE FUNCTION create_country(src HSTORE, lookup_country_code varchar(2)) RETURNS VOID
299   AS $$
300 DECLARE
301   s TEXT;
302   w INTEGER;
303   words TEXT[];
304   item RECORD;
305   j INTEGER;
306 BEGIN
307   FOR item IN SELECT (each(src)).* LOOP
308
309     s := make_standard_name(item.value);
310     w := getorcreate_country(s, lookup_country_code);
311
312     words := regexp_split_to_array(item.value, E'[,;()]');
313     IF array_upper(words, 1) != 1 THEN
314       FOR j IN 1..array_upper(words, 1) LOOP
315         s := make_standard_name(words[j]);
316         IF s != '' THEN
317           w := getorcreate_country(s, lookup_country_code);
318         END IF;
319       END LOOP;
320     END IF;
321   END LOOP;
322 END;
323 $$
324 LANGUAGE plpgsql;
325
326 CREATE OR REPLACE FUNCTION make_keywords(src HSTORE) RETURNS INTEGER[]
327   AS $$
328 DECLARE
329   result INTEGER[];
330   s TEXT;
331   w INTEGER;
332   words TEXT[];
333   item RECORD;
334   j INTEGER;
335 BEGIN
336   result := '{}'::INTEGER[];
337
338   FOR item IN SELECT (each(src)).* LOOP
339
340     s := make_standard_name(item.value);
341
342     w := getorcreate_name_id(s, item.value);
343
344     IF not(ARRAY[w] <@ result) THEN
345       result := result || w;
346     END IF;
347
348     words := string_to_array(s, ' ');
349     IF array_upper(words, 1) IS NOT NULL THEN
350       FOR j IN 1..array_upper(words, 1) LOOP
351         IF (words[j] != '') THEN
352           w = getorcreate_word_id(words[j]);
353           IF w IS NOT NULL AND NOT (ARRAY[w] <@ result) THEN
354             result := result || w;
355           END IF;
356         END IF;
357       END LOOP;
358     END IF;
359
360     words := regexp_split_to_array(item.value, E'[,;()]');
361     IF array_upper(words, 1) != 1 THEN
362       FOR j IN 1..array_upper(words, 1) LOOP
363         s := make_standard_name(words[j]);
364         IF s != '' THEN
365           w := getorcreate_word_id(s);
366           IF w IS NOT NULL AND NOT (ARRAY[w] <@ result) THEN
367             result := result || w;
368           END IF;
369         END IF;
370       END LOOP;
371     END IF;
372
373     s := regexp_replace(item.value, '市$', '');
374     IF s != item.value THEN
375       s := make_standard_name(s);
376       IF s != '' THEN
377         w := getorcreate_name_id(s, item.value);
378         IF NOT (ARRAY[w] <@ result) THEN
379           result := result || w;
380         END IF;
381       END IF;
382     END IF;
383
384   END LOOP;
385
386   RETURN result;
387 END;
388 $$
389 LANGUAGE plpgsql IMMUTABLE;
390
391 CREATE OR REPLACE FUNCTION make_keywords(src TEXT) RETURNS INTEGER[]
392   AS $$
393 DECLARE
394   result INTEGER[];
395   s TEXT;
396   w INTEGER;
397   words TEXT[];
398   i INTEGER;
399   j INTEGER;
400 BEGIN
401   result := '{}'::INTEGER[];
402
403   s := make_standard_name(src);
404   w := getorcreate_name_id(s, src);
405
406   IF NOT (ARRAY[w] <@ result) THEN
407     result := result || w;
408   END IF;
409
410   words := string_to_array(s, ' ');
411   IF array_upper(words, 1) IS NOT NULL THEN
412     FOR j IN 1..array_upper(words, 1) LOOP
413       IF (words[j] != '') THEN
414         w = getorcreate_word_id(words[j]);
415         IF w IS NOT NULL AND NOT (ARRAY[w] <@ result) THEN
416           result := result || w;
417         END IF;
418       END IF;
419     END LOOP;
420   END IF;
421
422   words := regexp_split_to_array(src, E'[,;()]');
423   IF array_upper(words, 1) != 1 THEN
424     FOR j IN 1..array_upper(words, 1) LOOP
425       s := make_standard_name(words[j]);
426       IF s != '' THEN
427         w := getorcreate_word_id(s);
428         IF w IS NOT NULL AND NOT (ARRAY[w] <@ result) THEN
429           result := result || w;
430         END IF;
431       END IF;
432     END LOOP;
433   END IF;
434
435   s := regexp_replace(src, '市$', '');
436   IF s != src THEN
437     s := make_standard_name(s);
438     IF s != '' THEN
439       w := getorcreate_name_id(s, src);
440       IF NOT (ARRAY[w] <@ result) THEN
441         result := result || w;
442       END IF;
443     END IF;
444   END IF;
445
446   RETURN result;
447 END;
448 $$
449 LANGUAGE plpgsql IMMUTABLE;
450
451 CREATE OR REPLACE FUNCTION get_word_score(wordscores wordscore[], words text[]) RETURNS integer
452   AS $$
453 DECLARE
454   idxword integer;
455   idxscores integer;
456   result integer;
457 BEGIN
458   IF (wordscores is null OR words is null) THEN
459     RETURN 0;
460   END IF;
461
462   result := 0;
463   FOR idxword in 1 .. array_upper(words, 1) LOOP
464     FOR idxscores in 1 .. array_upper(wordscores, 1) LOOP
465       IF wordscores[idxscores].word = words[idxword] THEN
466         result := result + wordscores[idxscores].score;
467       END IF;
468     END LOOP;
469   END LOOP;
470
471   RETURN result;
472 END;
473 $$
474 LANGUAGE plpgsql IMMUTABLE;
475
476 CREATE OR REPLACE FUNCTION get_country_code(place geometry) RETURNS TEXT
477   AS $$
478 DECLARE
479   place_centre GEOMETRY;
480   nearcountry RECORD;
481 BEGIN
482   place_centre := ST_PointOnSurface(place);
483
484 --DEBUG: RAISE WARNING 'get_country_code, start: %', ST_AsText(place_centre);
485
486 --DEBUG: RAISE WARNING 'osm fallback: %', ST_AsText(place_centre);
487
488   -- Try for OSM fallback data
489   -- The order is to deal with places like HongKong that are 'states' within another polygon
490   FOR nearcountry IN select country_code from country_osm_grid where st_covers(geometry, place_centre) order by area asc limit 1
491   LOOP
492     RETURN nearcountry.country_code;
493   END LOOP;
494
495   -- Try for a OSM polygon
496   FOR nearcountry IN select country_code from location_area_country where country_code is not null and not isguess and st_covers(geometry, place_centre) limit 1
497   LOOP
498     RETURN nearcountry.country_code;
499   END LOOP;
500
501 --DEBUG: RAISE WARNING 'natural earth: %', ST_AsText(place_centre);
502
503   -- Natural earth data
504   FOR nearcountry IN select country_code from country_naturalearthdata where st_covers(geometry, place_centre) limit 1
505   LOOP
506     RETURN nearcountry.country_code;
507   END LOOP;
508
509 --DEBUG: RAISE WARNING 'near osm fallback: %', ST_AsText(place_centre);
510
511   -- 
512   FOR nearcountry IN select country_code from country_osm_grid where st_dwithin(geometry, place_centre, 0.5) order by st_distance(geometry, place_centre) asc, area asc limit 1
513   LOOP
514     RETURN nearcountry.country_code;
515   END LOOP;
516
517 --DEBUG: RAISE WARNING 'near natural earth: %', ST_AsText(place_centre);
518
519   -- Natural earth data 
520   FOR nearcountry IN select country_code from country_naturalearthdata where st_dwithin(geometry, place_centre, 0.5) limit 1
521   LOOP
522     RETURN nearcountry.country_code;
523   END LOOP;
524
525   -- WorldBoundaries data (second fallback - think there might be something broken in this data)
526 --  FOR nearcountry IN select country_code from country where st_covers(geometry, place_centre) limit 1
527 --  LOOP
528 --    RETURN nearcountry.country_code;
529 --  END LOOP;
530
531 --RAISE WARNING 'near country: %', ST_AsText(place_centre);
532
533   -- Still not in a country - try nearest within ~12 miles of a country
534 --  FOR nearcountry IN select country_code from country where st_distance(geometry, place_centre) < 0.5 
535 --    order by st_distance(geometry, place) limit 1
536 --  LOOP
537 --    RETURN nearcountry.country_code;
538 --  END LOOP;
539
540   RETURN NULL;
541 END;
542 $$
543 LANGUAGE plpgsql IMMUTABLE;
544
545 CREATE OR REPLACE FUNCTION get_country_code(place geometry, in_country_code VARCHAR(2)) RETURNS TEXT
546   AS $$
547 DECLARE
548   nearcountry RECORD;
549 BEGIN
550   FOR nearcountry IN select country_code from country_name where country_code = lower(in_country_code)
551   LOOP
552     RETURN nearcountry.country_code;
553   END LOOP;
554   RETURN get_country_code(place);
555 END;
556 $$
557 LANGUAGE plpgsql IMMUTABLE;
558
559 CREATE OR REPLACE FUNCTION get_country_language_code(search_country_code VARCHAR(2)) RETURNS TEXT
560   AS $$
561 DECLARE
562   nearcountry RECORD;
563 BEGIN
564   FOR nearcountry IN select distinct country_default_language_code from country_name where country_code = search_country_code limit 1
565   LOOP
566     RETURN lower(nearcountry.country_default_language_code);
567   END LOOP;
568   RETURN NULL;
569 END;
570 $$
571 LANGUAGE plpgsql IMMUTABLE;
572
573 CREATE OR REPLACE FUNCTION get_country_language_codes(search_country_code VARCHAR(2)) RETURNS TEXT[]
574   AS $$
575 DECLARE
576   nearcountry RECORD;
577 BEGIN
578   FOR nearcountry IN select country_default_language_codes from country_name where country_code = search_country_code limit 1
579   LOOP
580     RETURN lower(nearcountry.country_default_language_codes);
581   END LOOP;
582   RETURN NULL;
583 END;
584 $$
585 LANGUAGE plpgsql IMMUTABLE;
586
587 CREATE OR REPLACE FUNCTION get_partition(place geometry, in_country_code VARCHAR(10)) RETURNS INTEGER
588   AS $$
589 DECLARE
590   place_centre GEOMETRY;
591   nearcountry RECORD;
592 BEGIN
593   FOR nearcountry IN select partition from country_name where country_code = in_country_code
594   LOOP
595     RETURN nearcountry.partition;
596   END LOOP;
597   RETURN 0;
598 END;
599 $$
600 LANGUAGE plpgsql IMMUTABLE;
601
602 CREATE OR REPLACE FUNCTION delete_location(OLD_place_id BIGINT) RETURNS BOOLEAN
603   AS $$
604 DECLARE
605 BEGIN
606   DELETE FROM location_area where place_id = OLD_place_id;
607 -- TODO:location_area
608   RETURN true;
609 END;
610 $$
611 LANGUAGE plpgsql;
612
613 CREATE OR REPLACE FUNCTION add_location(
614     place_id BIGINT,
615     country_code varchar(2),
616     partition INTEGER,
617     keywords INTEGER[],
618     rank_search INTEGER,
619     rank_address INTEGER,
620     geometry GEOMETRY
621   ) 
622   RETURNS BOOLEAN
623   AS $$
624 DECLARE
625   locationid INTEGER;
626   isarea BOOLEAN;
627   centroid GEOMETRY;
628   diameter FLOAT;
629   x BOOLEAN;
630   splitGeom RECORD;
631   secgeo GEOMETRY;
632 BEGIN
633
634   IF rank_search > 25 THEN
635     RAISE EXCEPTION 'Adding location with rank > 25 (% rank %)', place_id, rank_search;
636   END IF;
637
638 --  RAISE WARNING 'Adding location with rank > 25 (% rank %)', place_id, rank_search;
639
640   x := deleteLocationArea(partition, place_id, rank_search);
641
642   isarea := false;
643   IF (ST_GeometryType(geometry) in ('ST_Polygon','ST_MultiPolygon') AND ST_IsValid(geometry)) THEN
644
645     isArea := true;
646     centroid := ST_Centroid(geometry);
647
648     FOR secgeo IN select split_geometry(geometry) AS geom LOOP
649       x := insertLocationAreaLarge(partition, place_id, country_code, keywords, rank_search, rank_address, false, centroid, secgeo);
650     END LOOP;
651
652   ELSEIF rank_search < 26 THEN
653
654     diameter := 0.02;
655     IF rank_address = 0 THEN
656       diameter := 0.02;
657     ELSEIF rank_search <= 14 THEN
658       diameter := 1.2;
659     ELSEIF rank_search <= 15 THEN
660       diameter := 1;
661     ELSEIF rank_search <= 16 THEN
662       diameter := 0.5;
663     ELSEIF rank_search <= 17 THEN
664       diameter := 0.2;
665     ELSEIF rank_search <= 21 THEN
666       diameter := 0.05;
667     ELSEIF rank_search = 25 THEN
668       diameter := 0.005;
669     END IF;
670
671 --    RAISE WARNING 'adding % diameter %', place_id, diameter;
672
673     secgeo := ST_Buffer(geometry, diameter);
674     x := insertLocationAreaLarge(partition, place_id, country_code, keywords, rank_search, rank_address, true, ST_Centroid(geometry), secgeo);
675
676   ELSE
677
678     -- ~ 20meters
679     secgeo := ST_Buffer(geometry, 0.0002);
680     x := insertLocationAreaRoadNear(partition, place_id, country_code, keywords, rank_search, rank_address, true, ST_Centroid(geometry), secgeo);
681
682     -- ~ 100meters
683     secgeo := ST_Buffer(geometry, 0.001);
684     x := insertLocationAreaRoadFar(partition, place_id, country_code, keywords, rank_search, rank_address, true, ST_Centroid(geometry), secgeo);
685
686   END IF;
687
688   RETURN true;
689 END;
690 $$
691 LANGUAGE plpgsql;
692
693 CREATE OR REPLACE FUNCTION update_location(
694     partition INTEGER,
695     place_id BIGINT,
696     place_country_code varchar(2),
697     name hstore,
698     rank_search INTEGER,
699     rank_address INTEGER,
700     geometry GEOMETRY
701   ) 
702   RETURNS BOOLEAN
703   AS $$
704 DECLARE
705   b BOOLEAN;
706 BEGIN
707   b := deleteLocationArea(partition, place_id, rank_search);
708 --  result := add_location(NEW.place_id, NEW.country_code, NEW.partition, name_vector, NEW.rank_search, NEW.rank_address, NEW.geometry);
709   RETURN add_location(place_id, place_country_code, name, rank_search, rank_address, geometry);
710 END;
711 $$
712 LANGUAGE plpgsql;
713
714 CREATE OR REPLACE FUNCTION search_name_add_words(parent_place_id BIGINT, to_add INTEGER[])
715   RETURNS BOOLEAN
716   AS $$
717 DECLARE
718   childplace RECORD;
719 BEGIN
720
721   IF #to_add = 0 THEN
722     RETURN true;
723   END IF;
724
725   -- this should just be an update, but it seems to do insane things to the index size (delete and insert doesn't)
726   FOR childplace IN select * from search_name,place_addressline 
727     where  address_place_id = parent_place_id
728       and search_name.place_id = place_addressline.place_id
729   LOOP
730     delete from search_name where place_id = childplace.place_id;
731     IF not (ARRAY[to_add] <@ childplace.nameaddress_vector) THEN
732       childplace.nameaddress_vector := childplace.nameaddress_vector || to_add;
733     END IF;
734     IF childplace.place_id = parent_place_id and not (ARRAY[to_add] <@ childplace.name_vector) THEN
735       childplace.name_vector := childplace.name_vector || to_add;
736     END IF;
737     insert into search_name (place_id, search_rank, address_rank, country_code, name_vector, nameaddress_vector, centroid) 
738       values (childplace.place_id, childplace.search_rank, childplace.address_rank, childplace.country_code, 
739         childplace.name_vector, childplace.nameaddress_vector, childplace.centroid);
740   END LOOP;
741
742   RETURN true;
743 END;
744 $$
745 LANGUAGE plpgsql;
746
747 CREATE OR REPLACE FUNCTION update_location_nameonly(partition INTEGER, OLD_place_id BIGINT, name hstore) RETURNS BOOLEAN
748   AS $$
749 DECLARE
750   newkeywords INTEGER[];
751   addedkeywords INTEGER[];
752   removedkeywords INTEGER[];
753 BEGIN
754
755   -- what has changed?
756   newkeywords := make_keywords(name);
757   select coalesce(newkeywords,'{}'::INTEGER[]) - coalesce(location_point.keywords,'{}'::INTEGER[]), 
758     coalesce(location_point.keywords,'{}'::INTEGER[]) - coalesce(newkeywords,'{}'::INTEGER[]) from location_point 
759     where place_id = OLD_place_id into addedkeywords, removedkeywords;
760
761 --  RAISE WARNING 'update_location_nameonly for %: new:% added:% removed:%', OLD_place_id, newkeywords, addedkeywords, removedkeywords;
762
763   IF #removedkeywords > 0 THEN
764     -- abort due to tokens removed
765     RETURN false;
766   END IF;
767   
768   IF #addedkeywords > 0 THEN
769     -- short circuit - no changes
770     RETURN true;
771   END IF;
772
773   UPDATE location_area set keywords = newkeywords where place_id = OLD_place_id;
774   RETURN search_name_add_words(OLD_place_id, addedkeywords);
775 END;
776 $$
777 LANGUAGE plpgsql;
778
779
780 CREATE OR REPLACE FUNCTION create_interpolation(wayid BIGINT, interpolationtype TEXT) RETURNS INTEGER
781   AS $$
782 DECLARE
783   
784   newpoints INTEGER;
785   waynodes integer[];
786   nodeid INTEGER;
787   prevnode RECORD;
788   nextnode RECORD;
789   startnumber INTEGER;
790   endnumber INTEGER;
791   stepsize INTEGER;
792   orginalstartnumber INTEGER;
793   originalnumberrange INTEGER;
794   housenum INTEGER;
795   linegeo GEOMETRY;
796   search_place_id BIGINT;
797   defpostalcode TEXT;
798
799   havefirstpoint BOOLEAN;
800   linestr TEXT;
801 BEGIN
802   newpoints := 0;
803   IF interpolationtype = 'odd' OR interpolationtype = 'even' OR interpolationtype = 'all' THEN
804
805     select postcode from placex where osm_type = 'W' and osm_id = wayid INTO defpostalcode;
806     select nodes from planet_osm_ways where id = wayid INTO waynodes;
807 --RAISE WARNING 'interpolation % % %',wayid,interpolationtype,waynodes;
808     IF array_upper(waynodes, 1) IS NOT NULL THEN
809
810       havefirstpoint := false;
811
812       FOR nodeidpos in 1..array_upper(waynodes, 1) LOOP
813
814         select min(place_id) from placex where osm_type = 'N' and osm_id = waynodes[nodeidpos]::INTEGER and type = 'house' INTO search_place_id;
815         IF search_place_id IS NULL THEN
816           -- null record of right type
817           select * from placex where osm_type = 'N' and osm_id = waynodes[nodeidpos]::INTEGER and type = 'house' limit 1 INTO nextnode;
818           select ST_SetSRID(ST_Point(lon::float/10000000,lat::float/10000000),4326) from planet_osm_nodes where id = waynodes[nodeidpos] INTO nextnode.geometry;
819           IF nextnode.geometry IS NULL THEN
820             -- we don't have any information about this point, most likely
821             -- because an excerpt was updated and the node never imported
822             -- because the interpolation is outside the region of the excerpt.
823             -- Give up.
824             RETURN newpoints;
825           END IF;
826         ELSE
827           select * from placex where place_id = search_place_id INTO nextnode;
828         END IF;
829
830 --RAISE WARNING 'interpolation node % % % ',nextnode.housenumber,ST_X(nextnode.geometry),ST_Y(nextnode.geometry);
831       
832         IF havefirstpoint THEN
833
834           -- add point to the line string
835           linestr := linestr||','||ST_X(nextnode.geometry)||' '||ST_Y(nextnode.geometry);
836           endnumber := ('0'||substring(nextnode.housenumber,'[0-9]+'))::integer;
837
838           IF startnumber IS NOT NULL and startnumber > 0 AND endnumber IS NOT NULL and endnumber > 0 AND @(startnumber - endnumber) < 1000 THEN
839
840 --RAISE WARNING 'interpolation end % % ',nextnode.place_id,endnumber;
841
842             IF startnumber != endnumber THEN
843
844               linestr := linestr || ')';
845 --RAISE WARNING 'linestr %',linestr;
846               linegeo := ST_GeomFromText(linestr,4326);
847               linestr := 'LINESTRING('||ST_X(nextnode.geometry)||' '||ST_Y(nextnode.geometry);
848               IF (startnumber > endnumber) THEN
849                 housenum := endnumber;
850                 endnumber := startnumber;
851                 startnumber := housenum;
852                 linegeo := ST_Reverse(linegeo);
853               END IF;
854               orginalstartnumber := startnumber;
855               originalnumberrange := endnumber - startnumber;
856
857 -- Too much broken data worldwide for this test to be worth using
858 --              IF originalnumberrange > 500 THEN
859 --                RAISE WARNING 'Number block of % while processing % %', originalnumberrange, prevnode, nextnode;
860 --              END IF;
861
862               IF (interpolationtype = 'odd' AND startnumber%2 = 0) OR (interpolationtype = 'even' AND startnumber%2 = 1) THEN
863                 startnumber := startnumber + 1;
864                 stepsize := 2;
865               ELSE
866                 IF (interpolationtype = 'odd' OR interpolationtype = 'even') THEN
867                   startnumber := startnumber + 2;
868                   stepsize := 2;
869                 ELSE -- everything else assumed to be 'all'
870                   startnumber := startnumber + 1;
871                   stepsize := 1;
872                 END IF;
873               END IF;
874               endnumber := endnumber - 1;
875               delete from placex where osm_type = 'N' and osm_id = prevnode.osm_id and type = 'house' and place_id != prevnode.place_id;
876               FOR housenum IN startnumber..endnumber BY stepsize LOOP
877                 -- this should really copy postcodes but it puts a huge burdon on the system for no big benefit
878                 -- ideally postcodes should move up to the way
879                 insert into placex (osm_type, osm_id, class, type, admin_level, housenumber, street, isin, postcode,
880                   country_code, parent_place_id, rank_address, rank_search, indexed_status, geometry)
881                   values ('N',prevnode.osm_id, prevnode.class, prevnode.type, prevnode.admin_level, housenum, prevnode.street, prevnode.isin, coalesce(prevnode.postcode, defpostalcode),
882                   prevnode.country_code, prevnode.parent_place_id, prevnode.rank_address, prevnode.rank_search, 1, ST_Line_Interpolate_Point(linegeo, (housenum::float-orginalstartnumber::float)/originalnumberrange::float));
883                 newpoints := newpoints + 1;
884 --RAISE WARNING 'interpolation number % % ',prevnode.place_id,housenum;
885               END LOOP;
886             END IF;
887             havefirstpoint := false;
888           END IF;
889         END IF;
890
891         IF NOT havefirstpoint THEN
892           startnumber := ('0'||substring(nextnode.housenumber,'[0-9]+'))::integer;
893           IF startnumber IS NOT NULL AND startnumber > 0 THEN
894             havefirstpoint := true;
895             linestr := 'LINESTRING('||ST_X(nextnode.geometry)||' '||ST_Y(nextnode.geometry);
896             prevnode := nextnode;
897           END IF;
898 --RAISE WARNING 'interpolation start % % ',nextnode.place_id,startnumber;
899         END IF;
900       END LOOP;
901     END IF;
902   END IF;
903
904 --RAISE WARNING 'interpolation points % ',newpoints;
905
906   RETURN newpoints;
907 END;
908 $$
909 LANGUAGE plpgsql;
910
911 CREATE OR REPLACE FUNCTION placex_insert() RETURNS TRIGGER
912   AS $$
913 DECLARE
914   i INTEGER;
915   postcode TEXT;
916   result BOOLEAN;
917   country_code VARCHAR(2);
918   default_language VARCHAR(10);
919   diameter FLOAT;
920   classtable TEXT;
921 BEGIN
922   --DEBUG: RAISE WARNING '% %',NEW.osm_type,NEW.osm_id;
923
924   -- just block these
925   IF NEW.class = 'highway' and NEW.type in ('turning_circle','traffic_signals','mini_roundabout','noexit','crossing') THEN
926 --    RAISE WARNING 'bad highway %',NEW.osm_id;
927     RETURN null;
928   END IF;
929   IF NEW.class in ('landuse','natural') and NEW.name is null THEN
930 --    RAISE WARNING 'empty landuse %',NEW.osm_id;
931     RETURN null;
932   END IF;
933
934   IF ST_IsEmpty(NEW.geometry) OR NOT ST_IsValid(NEW.geometry) OR ST_X(ST_Centroid(NEW.geometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEW.geometry))::text in ('NaN','Infinity','-Infinity') THEN  
935     -- block all invalid geometary - just not worth the risk.  seg faults are causing serious problems.
936     RAISE WARNING 'invalid geometry %',NEW.osm_id;
937     RETURN NULL;
938
939     -- Dead code
940     IF NEW.osm_type = 'R' THEN
941       -- invalid multipolygons can crash postgis, don't even bother to try!
942       RETURN NULL;
943     END IF;
944     NEW.geometry := ST_buffer(NEW.geometry,0);
945     IF ST_IsEmpty(NEW.geometry) OR NOT ST_IsValid(NEW.geometry) OR ST_X(ST_Centroid(NEW.geometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEW.geometry))::text in ('NaN','Infinity','-Infinity') THEN  
946       RAISE WARNING 'Invalid geometary, rejecting: % %', NEW.osm_type, NEW.osm_id;
947       RETURN NULL;
948     END IF;
949   END IF;
950
951   --DEBUG: RAISE WARNING '% % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type;
952
953   NEW.place_id := nextval('seq_place');
954   NEW.indexed_status := 1; --STATUS_NEW
955
956   NEW.calculated_country_code := lower(get_country_code(NEW.geometry, NEW.country_code));
957
958   NEW.partition := get_partition(NEW.geometry, NEW.calculated_country_code);
959   NEW.geometry_sector := geometry_sector(NEW.partition, NEW.geometry);
960
961   -- copy 'name' to or from the default language (if there is a default language)
962   IF NEW.name is not null AND array_upper(akeys(NEW.name),1) > 1 THEN
963     default_language := get_country_language_code(NEW.calculated_country_code);
964     IF default_language IS NOT NULL THEN
965       IF NEW.name ? 'name' AND NOT NEW.name ? ('name:'||default_language) THEN
966         NEW.name := NEW.name || hstore(('name:'||default_language), (NEW.name -> 'name'));
967       ELSEIF NEW.name ? ('name:'||default_language) AND NOT NEW.name ? 'name' THEN
968         NEW.name := NEW.name || hstore('name', (NEW.name -> ('name:'||default_language)));
969       END IF;
970     END IF;
971   END IF;
972
973   IF NEW.admin_level > 15 THEN
974     NEW.admin_level := 15;
975   END IF;
976
977   IF NEW.housenumber IS NOT NULL THEN
978     i := getorcreate_housenumber_id(make_standard_name(NEW.housenumber));
979   END IF;
980
981   IF NEW.osm_type = 'X' THEN
982     -- E'X'ternal records should already be in the right format so do nothing
983   ELSE
984     NEW.rank_search := 30;
985     NEW.rank_address := NEW.rank_search;
986
987     -- By doing in postgres we have the country available to us - currently only used for postcode
988     IF NEW.class in ('place','boundary') AND NEW.type in ('postcode','postal_code') THEN
989
990         IF NEW.postcode IS NULL THEN
991             -- most likely just a part of a multipolygon postcode boundary, throw it away
992             RETURN NULL;
993         END IF;
994
995         NEW.name := hstore('ref', NEW.postcode);
996
997         IF NEW.calculated_country_code = 'gb' THEN
998
999           IF NEW.postcode ~ '^([A-Z][A-Z]?[0-9][0-9A-Z]? [0-9][A-Z][A-Z])$' THEN
1000             NEW.rank_search := 25;
1001             NEW.rank_address := 5;
1002           ELSEIF NEW.postcode ~ '^([A-Z][A-Z]?[0-9][0-9A-Z]? [0-9])$' THEN
1003             NEW.rank_search := 23;
1004             NEW.rank_address := 5;
1005           ELSEIF NEW.postcode ~ '^([A-Z][A-Z]?[0-9][0-9A-Z])$' THEN
1006             NEW.rank_search := 21;
1007             NEW.rank_address := 5;
1008           END IF;
1009
1010         ELSEIF NEW.calculated_country_code = 'de' THEN
1011
1012           IF NEW.postcode ~ '^([0-9]{5})$' THEN
1013             NEW.rank_search := 21;
1014             NEW.rank_address := 11;
1015           END IF;
1016
1017         ELSE
1018           -- Guess at the postcode format and coverage (!)
1019           IF upper(NEW.postcode) ~ '^[A-Z0-9]{1,5}$' THEN -- Probably too short to be very local
1020             NEW.rank_search := 21;
1021             NEW.rank_address := 11;
1022           ELSE
1023             -- Does it look splitable into and area and local code?
1024             postcode := substring(upper(NEW.postcode) from '^([- :A-Z0-9]+)([- :][A-Z0-9]+)$');
1025
1026             IF postcode IS NOT NULL THEN
1027               NEW.rank_search := 25;
1028               NEW.rank_address := 11;
1029             ELSEIF NEW.postcode ~ '^[- :A-Z0-9]{6,}$' THEN
1030               NEW.rank_search := 21;
1031               NEW.rank_address := 11;
1032             END IF;
1033           END IF;
1034         END IF;
1035
1036     ELSEIF NEW.class = 'place' THEN
1037       IF NEW.type in ('continent') THEN
1038         NEW.rank_search := 2;
1039         NEW.rank_address := NEW.rank_search;
1040         NEW.calculated_country_code := NULL;
1041       ELSEIF NEW.type in ('sea') THEN
1042         NEW.rank_search := 2;
1043         NEW.rank_address := 0;
1044         NEW.calculated_country_code := NULL;
1045       ELSEIF NEW.type in ('country') THEN
1046         NEW.rank_search := 4;
1047         NEW.rank_address := NEW.rank_search;
1048       ELSEIF NEW.type in ('state') THEN
1049         NEW.rank_search := 8;
1050         NEW.rank_address := NEW.rank_search;
1051       ELSEIF NEW.type in ('region') THEN
1052         NEW.rank_search := 18; -- dropped from previous value of 10
1053         NEW.rank_address := 0; -- So badly miss-used that better to just drop it!
1054       ELSEIF NEW.type in ('county') THEN
1055         NEW.rank_search := 12;
1056         NEW.rank_address := NEW.rank_search;
1057       ELSEIF NEW.type in ('city') THEN
1058         NEW.rank_search := 16;
1059         NEW.rank_address := NEW.rank_search;
1060       ELSEIF NEW.type in ('island') THEN
1061         NEW.rank_search := 17;
1062         NEW.rank_address := 0;
1063       ELSEIF NEW.type in ('town') THEN
1064         NEW.rank_search := 18;
1065         NEW.rank_address := 16;
1066       ELSEIF NEW.type in ('village','hamlet','municipality','district','unincorporated_area','borough') THEN
1067         NEW.rank_search := 19;
1068         NEW.rank_address := 16;
1069       ELSEIF NEW.type in ('airport') AND ST_GeometryType(NEW.geometry) in ('ST_Polygon','ST_MultiPolygon') THEN
1070         NEW.rank_search := 18;
1071         NEW.rank_address := 17;
1072       ELSEIF NEW.type in ('moor') AND ST_GeometryType(NEW.geometry) in ('ST_Polygon','ST_MultiPolygon') THEN
1073         NEW.rank_search := 17;
1074         NEW.rank_address := 18;
1075       ELSEIF NEW.type in ('moor') THEN
1076         NEW.rank_search := 17;
1077         NEW.rank_address := 0;
1078       ELSEIF NEW.type in ('national_park') THEN
1079         NEW.rank_search := 18;
1080         NEW.rank_address := 18;
1081       ELSEIF NEW.type in ('suburb','croft','subdivision') THEN
1082         NEW.rank_search := 20;
1083         NEW.rank_address := NEW.rank_search;
1084       ELSEIF NEW.type in ('farm','locality','islet','isolated_dwelling','mountain_pass') THEN
1085         NEW.rank_search := 20;
1086         NEW.rank_address := 0;
1087         -- Irish townlands, tagged as place=locality and locality=townland
1088         IF (NEW.extratags -> 'locality') = 'townland' THEN
1089           NEW.rank_address := 20;
1090         END IF;
1091       ELSEIF NEW.type in ('hall_of_residence','neighbourhood','housing_estate','nature_reserve') THEN
1092         NEW.rank_search := 22;
1093         NEW.rank_address := 22;
1094       ELSEIF NEW.type in ('airport','street') THEN
1095         NEW.rank_search := 26;
1096         NEW.rank_address := NEW.rank_search;
1097       ELSEIF NEW.type in ('house','building') THEN
1098         NEW.rank_search := 30;
1099         NEW.rank_address := NEW.rank_search;
1100       ELSEIF NEW.type in ('houses') THEN
1101         -- can't guarantee all required nodes loaded yet due to caching in osm2pgsql
1102         -- insert new point into place for each derived building
1103         --i := create_interpolation(NEW.osm_id, NEW.housenumber);
1104         NEW.rank_search := 28;
1105         NEW.rank_address := 0;
1106       END IF;
1107
1108     ELSEIF NEW.class = 'boundary' THEN
1109       IF ST_GeometryType(NEW.geometry) NOT IN ('ST_Polygon','ST_MultiPolygon') THEN
1110 --        RAISE WARNING 'invalid boundary %',NEW.osm_id;
1111         return NULL;
1112       END IF;
1113       NEW.rank_search := NEW.admin_level * 2;
1114       NEW.rank_address := NEW.rank_search;
1115     ELSEIF NEW.class = 'landuse' AND ST_GeometryType(NEW.geometry) in ('ST_Polygon','ST_MultiPolygon') THEN
1116       NEW.rank_search := 22;
1117       NEW.rank_address := NEW.rank_search;
1118     ELSEIF NEW.class = 'natural' and NEW.type in ('peak','volcano','mountain_range') THEN
1119       NEW.rank_search := 18;
1120       NEW.rank_address := 0;
1121     -- any feature more than 5 square miles is probably worth indexing
1122     ELSEIF ST_GeometryType(NEW.geometry) in ('ST_Polygon','ST_MultiPolygon') AND ST_Area(NEW.geometry) > 0.1 THEN
1123       NEW.rank_search := 22;
1124       NEW.rank_address := NEW.rank_search;
1125     ELSEIF NEW.class = 'highway' AND NEW.name is NULL AND 
1126            NEW.type in ('service','cycleway','path','footway','steps','bridleway','track','byway','motorway_link','primary_link','trunk_link','secondary_link','tertiary_link') THEN
1127 --      RAISE WARNING 'unnamed minor feature %',NEW.osm_id;
1128       RETURN NULL;
1129     ELSEIF NEW.class = 'railway' AND NEW.type in ('rail') THEN
1130       RETURN NULL;
1131     ELSEIF NEW.class = 'waterway' AND NEW.name is NULL THEN
1132       RETURN NULL;
1133     ELSEIF NEW.class = 'waterway' THEN
1134       NEW.rank_address := 17;
1135     ELSEIF NEW.class = 'highway' AND NEW.osm_type != 'N' AND NEW.type in ('service','cycleway','path','footway','steps','bridleway','motorway_link','primary_link','trunk_link','secondary_link','tertiary_link') THEN
1136       NEW.rank_search := 27;
1137       NEW.rank_address := NEW.rank_search;
1138     ELSEIF NEW.class = 'highway' AND NEW.osm_type != 'N' THEN
1139       NEW.rank_search := 26;
1140       NEW.rank_address := NEW.rank_search;
1141     ELSEIF NEW.class = 'natural' and NEW.type = 'sea' THEN
1142       NEW.rank_search := 4;
1143       NEW.rank_address := NEW.rank_search;
1144     ELSEIF NEW.class = 'natural' and NEW.type in ('coastline') THEN
1145       RETURN NULL;
1146     END IF;
1147
1148   END IF;
1149
1150   IF NEW.rank_search > 30 THEN
1151     NEW.rank_search := 30;
1152   END IF;
1153
1154   IF NEW.rank_address > 30 THEN
1155     NEW.rank_address := 30;
1156   END IF;
1157
1158   IF (NEW.extratags -> 'capital') = 'yes' THEN
1159     NEW.rank_search := NEW.rank_search - 1;
1160   END IF;
1161
1162   -- a country code make no sense below rank 4 (country)
1163   IF NEW.rank_address < 4 THEN
1164     NEW.calculated_country_code := NULL;
1165   END IF;
1166
1167 -- Block import below rank 22
1168 --  IF NEW.rank_search > 22 THEN
1169 --    RETURN NULL;
1170 --  END IF;
1171
1172   --DEBUG: RAISE WARNING 'placex_insert:END: % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type;
1173
1174   RETURN NEW; -- @DIFFUPDATES@ The following is not needed until doing diff updates, and slows the main index process down
1175
1176   IF (ST_GeometryType(NEW.geometry) in ('ST_Polygon','ST_MultiPolygon') AND ST_IsValid(NEW.geometry)) THEN
1177     -- Performance: We just can't handle re-indexing for country level changes
1178     IF st_area(NEW.geometry) < 1 THEN
1179       -- mark items within the geometry for re-indexing
1180 --    RAISE WARNING 'placex poly insert: % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type;
1181
1182       -- work around bug in postgis, this may have been fixed in 2.0.0 (see http://trac.osgeo.org/postgis/ticket/547)
1183       update placex set indexed_status = 2 where (st_covers(NEW.geometry, placex.geometry) OR ST_Intersects(NEW.geometry, placex.geometry)) 
1184        AND rank_search > NEW.rank_search and indexed_status = 0 and ST_geometrytype(placex.geometry) = 'ST_Point' and (rank_search < 28 or name is not null);
1185       update placex set indexed_status = 2 where (st_covers(NEW.geometry, placex.geometry) OR ST_Intersects(NEW.geometry, placex.geometry)) 
1186        AND rank_search > NEW.rank_search and indexed_status = 0 and ST_geometrytype(placex.geometry) != 'ST_Point' and (rank_search < 28 or name is not null);
1187     END IF;
1188   ELSE
1189     -- mark nearby items for re-indexing, where 'nearby' depends on the features rank_search and is a complete guess :(
1190     diameter := 0;
1191     -- 16 = city, anything higher than city is effectively ignored (polygon required!)
1192     IF NEW.type='postcode' THEN
1193       diameter := 0.05;
1194     ELSEIF NEW.rank_search < 16 THEN
1195       diameter := 0;
1196     ELSEIF NEW.rank_search < 18 THEN
1197       diameter := 0.1;
1198     ELSEIF NEW.rank_search < 20 THEN
1199       diameter := 0.05;
1200     ELSEIF NEW.rank_search = 21 THEN
1201       diameter := 0.001;
1202     ELSEIF NEW.rank_search < 24 THEN
1203       diameter := 0.02;
1204     ELSEIF NEW.rank_search < 26 THEN
1205       diameter := 0.002; -- 100 to 200 meters
1206     ELSEIF NEW.rank_search < 28 THEN
1207       diameter := 0.001; -- 50 to 100 meters
1208     END IF;
1209     IF diameter > 0 THEN
1210 --      RAISE WARNING 'placex point insert: % % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type,diameter;
1211       IF NEW.rank_search >= 26 THEN
1212         -- roads may cause reparenting for >27 rank places
1213         update placex set indexed_status = 2 where indexed_status = 0 and rank_search > NEW.rank_search and ST_DWithin(placex.geometry, NEW.geometry, diameter);
1214       ELSE
1215         -- for all other places the search terms may change as well
1216         update placex set indexed_status = 2 where indexed_status = 0 and rank_search > NEW.rank_search and ST_DWithin(placex.geometry, NEW.geometry, diameter) and (rank_search < 28 or name is not null);
1217       END IF;
1218     END IF;
1219
1220   END IF;
1221
1222    -- add to tables for special search
1223    -- Note: won't work on initial import because the classtype tables
1224    -- do not yet exist. It won't hurt either.
1225   classtable := 'place_classtype_' || NEW.class || '_' || NEW.type;
1226   SELECT count(*)>0 FROM pg_tables WHERE tablename = classtable INTO result;
1227   IF result THEN
1228     EXECUTE 'INSERT INTO ' || classtable::regclass || ' (place_id, centroid) VALUES ($1,$2)' 
1229     USING NEW.place_id, ST_Centroid(NEW.geometry);
1230   END IF;
1231
1232
1233 --  IF NEW.rank_search < 26 THEN
1234 --    RAISE WARNING 'placex insert: % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type;
1235 --  END IF;
1236
1237   RETURN NEW;
1238
1239 END;
1240 $$
1241 LANGUAGE plpgsql;
1242
1243 CREATE OR REPLACE FUNCTION placex_update() RETURNS 
1244 TRIGGER
1245   AS $$
1246 DECLARE
1247
1248   place_centroid GEOMETRY;
1249
1250   search_maxdistance FLOAT[];
1251   search_mindistance FLOAT[];
1252   address_havelevel BOOLEAN[];
1253 --  search_scores wordscore[];
1254 --  search_scores_pos INTEGER;
1255
1256   i INTEGER;
1257   iMax FLOAT;
1258   location RECORD;
1259   way RECORD;
1260   relation RECORD;
1261   relation_members TEXT[];
1262   relMember RECORD;
1263   linkedplacex RECORD;
1264   search_diameter FLOAT;
1265   search_prevdiameter FLOAT;
1266   search_maxrank INTEGER;
1267   address_maxrank INTEGER;
1268   address_street_word_id INTEGER;
1269   parent_place_id_rank BIGINT;
1270   
1271   isin TEXT[];
1272   isin_tokens INT[];
1273
1274   location_rank_search INTEGER;
1275   location_distance FLOAT;
1276   location_parent GEOMETRY;
1277   location_isaddress BOOLEAN;
1278
1279   tagpairid INTEGER;
1280
1281   default_language TEXT;
1282   name_vector INTEGER[];
1283   nameaddress_vector INTEGER[];
1284
1285   linked_node_id BIGINT;
1286
1287   result BOOLEAN;
1288 BEGIN
1289
1290   -- deferred delete
1291   IF OLD.indexed_status = 100 THEN
1292     --DEBUG: RAISE WARNING 'placex_update_delete % %',NEW.osm_type,NEW.osm_id;
1293     delete from placex where place_id = OLD.place_id;
1294     RETURN NULL;
1295   END IF;
1296
1297   IF NEW.indexed_status != 0 OR OLD.indexed_status = 0 THEN
1298     RETURN NEW;
1299   END IF;
1300
1301   --DEBUG: RAISE WARNING 'placex_update % %',NEW.osm_type,NEW.osm_id;
1302
1303 --RAISE WARNING '%',NEW.place_id;
1304 --RAISE WARNING '%', NEW;
1305
1306   IF NEW.class = 'place' AND NEW.type = 'postcodearea' THEN
1307     -- Silently do nothing
1308     RETURN NEW;
1309   END IF;
1310
1311   -- TODO: this test is now redundant?
1312   IF OLD.indexed_status != 0 THEN
1313
1314     NEW.indexed_date = now();
1315
1316     result := deleteSearchName(NEW.partition, NEW.place_id);
1317     DELETE FROM place_addressline WHERE place_id = NEW.place_id;
1318     DELETE FROM place_boundingbox where place_id = NEW.place_id;
1319     result := deleteRoad(NEW.partition, NEW.place_id);
1320     result := deleteLocationArea(NEW.partition, NEW.place_id, NEW.rank_search);
1321     UPDATE placex set linked_place_id = null where linked_place_id = NEW.place_id;
1322
1323     IF NEW.linked_place_id is not null THEN
1324       RETURN NEW;
1325     END IF;
1326
1327     IF NEW.class = 'place' AND NEW.type = 'houses' THEN
1328       i := create_interpolation(NEW.osm_id, NEW.housenumber);
1329       RETURN NEW;
1330     END IF;
1331
1332     -- Speed up searches - just use the centroid of the feature
1333     -- cheaper but less acurate
1334     place_centroid := ST_PointOnSurface(NEW.geometry);
1335     NEW.centroid := null;
1336
1337     -- reclaculate country and partition
1338     IF NEW.rank_search >= 4 THEN
1339       --NEW.calculated_country_code := lower(get_country_code(NEW.geometry, NEW.country_code));
1340       NEW.calculated_country_code := lower(get_country_code(place_centroid));
1341     ELSE
1342       NEW.calculated_country_code := NULL;
1343     END IF;
1344     NEW.partition := get_partition(place_centroid, NEW.calculated_country_code);
1345     NEW.geometry_sector := geometry_sector(NEW.partition, place_centroid);
1346
1347     -- Adding ourselves to the list simplifies address calculations later
1348     INSERT INTO place_addressline VALUES (NEW.place_id, NEW.place_id, true, true, 0, NEW.rank_address); 
1349
1350     -- What level are we searching from
1351     search_maxrank := NEW.rank_search;
1352
1353     -- Thought this wasn't needed but when we add new languages to the country_name table
1354     -- we need to update the existing names
1355     IF NEW.name is not null AND array_upper(akeys(NEW.name),1) > 1 THEN
1356       default_language := get_country_language_code(NEW.calculated_country_code);
1357       IF default_language IS NOT NULL THEN
1358         IF NEW.name ? 'name' AND NOT NEW.name ? ('name:'||default_language) THEN
1359           NEW.name := NEW.name || hstore(('name:'||default_language), (NEW.name -> 'name'));
1360         ELSEIF NEW.name ? ('name:'||default_language) AND NOT NEW.name ? 'name' THEN
1361           NEW.name := NEW.name || hstore('name', (NEW.name -> ('name:'||default_language)));
1362         END IF;
1363       END IF;
1364     END IF;
1365
1366     -- Initialise the name vector using our name
1367     name_vector := make_keywords(NEW.name);
1368     nameaddress_vector := '{}'::int[];
1369
1370     -- some tag combinations add a special id for search
1371     tagpairid := get_tagpair(NEW.class,NEW.type);
1372     IF tagpairid IS NOT NULL THEN
1373       name_vector := name_vector + tagpairid;
1374     END IF;
1375
1376     FOR i IN 1..28 LOOP
1377       address_havelevel[i] := false;
1378     END LOOP;
1379
1380     NEW.importance := null;
1381     select language||':'||title,importance from get_wikipedia_match(NEW.extratags, NEW.calculated_country_code) INTO NEW.wikipedia,NEW.importance;
1382     IF NEW.importance IS NULL THEN
1383       select language||':'||title,importance from wikipedia_article where osm_type = NEW.osm_type and osm_id = NEW.osm_id order by importance desc limit 1 INTO NEW.wikipedia,NEW.importance;
1384     END IF;
1385
1386 --RAISE WARNING 'before low level% %', NEW.place_id, NEW.rank_search;
1387
1388     -- For low level elements we inherit from our parent road
1389     IF (NEW.rank_search > 27 OR (NEW.type = 'postcode' AND NEW.rank_search = 25)) THEN
1390
1391 --RAISE WARNING 'finding street for %', NEW;
1392
1393       -- We won't get a better centroid, besides these places are too small to care
1394       NEW.centroid := place_centroid;
1395
1396       NEW.parent_place_id := null;
1397
1398       -- to do that we have to find our parent road
1399       -- Copy data from linked items (points on ways, addr:street links, relations)
1400       -- Note that addr:street links can only be indexed once the street itself is indexed
1401       IF NEW.parent_place_id IS NULL AND NEW.osm_type = 'N' THEN
1402
1403         -- Is this node part of a relation?
1404         FOR relation IN select * from planet_osm_rels where parts @> ARRAY[NEW.osm_id] and members @> ARRAY['n'||NEW.osm_id]
1405         LOOP
1406           -- At the moment we only process one type of relation - associatedStreet
1407           IF relation.tags @> ARRAY['associatedStreet'] AND array_upper(relation.members, 1) IS NOT NULL THEN
1408             FOR i IN 1..array_upper(relation.members, 1) BY 2 LOOP
1409               IF NEW.parent_place_id IS NULL AND relation.members[i+1] = 'street' THEN
1410 --RAISE WARNING 'node in relation %',relation;
1411                 SELECT place_id from placex where osm_type='W' and osm_id = substring(relation.members[i],2,200)::integer 
1412                   and rank_search = 26 INTO NEW.parent_place_id;
1413               END IF;
1414             END LOOP;
1415           END IF;
1416         END LOOP;      
1417
1418 --RAISE WARNING 'x1';
1419         -- Is this node part of a way?
1420         FOR way IN select id from planet_osm_ways where nodes @> ARRAY[NEW.osm_id] LOOP
1421 --RAISE WARNING '%', way;
1422         FOR location IN select * from placex where osm_type = 'W' and osm_id = way.id
1423         LOOP
1424 --RAISE WARNING '%', location;
1425           -- Way IS a road then we are on it - that must be our road
1426           IF location.rank_search = 26 AND NEW.parent_place_id IS NULL THEN
1427 --RAISE WARNING 'node in way that is a street %',location;
1428             NEW.parent_place_id := location.place_id;
1429           END IF;
1430
1431           -- Is the WAY part of a relation
1432           IF NEW.parent_place_id IS NULL THEN
1433               FOR relation IN select * from planet_osm_rels where parts @> ARRAY[location.osm_id] and members @> ARRAY['w'||location.osm_id]
1434               LOOP
1435                 -- At the moment we only process one type of relation - associatedStreet
1436                 IF relation.tags @> ARRAY['associatedStreet'] AND array_upper(relation.members, 1) IS NOT NULL THEN
1437                   FOR i IN 1..array_upper(relation.members, 1) BY 2 LOOP
1438                     IF NEW.parent_place_id IS NULL AND relation.members[i+1] = 'street' THEN
1439     --RAISE WARNING 'node in way that is in a relation %',relation;
1440                       SELECT place_id from placex where osm_type='W' and osm_id = substring(relation.members[i],2,200)::integer 
1441                         and rank_search = 26 INTO NEW.parent_place_id;
1442                     END IF;
1443                   END LOOP;
1444                 END IF;
1445               END LOOP;
1446           END IF;    
1447           
1448           -- If the way contains an explicit name of a street copy it
1449           IF NEW.street IS NULL AND location.street IS NOT NULL THEN
1450 --RAISE WARNING 'node in way that has a streetname %',location;
1451             NEW.street := location.street;
1452           END IF;
1453
1454           -- If this way is a street interpolation line then it is probably as good as we are going to get
1455           IF NEW.parent_place_id IS NULL AND NEW.street IS NULL AND location.class = 'place' and location.type='houses' THEN
1456             -- Try and find a way that is close roughly parellel to this line
1457             FOR relation IN SELECT place_id FROM placex
1458               WHERE ST_DWithin(location.geometry, placex.geometry, 0.001) and placex.rank_search = 26
1459                 and st_geometrytype(location.geometry) in ('ST_LineString')
1460               ORDER BY (ST_distance(placex.geometry, ST_Line_Interpolate_Point(location.geometry,0))+
1461                         ST_distance(placex.geometry, ST_Line_Interpolate_Point(location.geometry,0.5))+
1462                         ST_distance(placex.geometry, ST_Line_Interpolate_Point(location.geometry,1))) ASC limit 1
1463             LOOP
1464 --RAISE WARNING 'using nearest street to address interpolation line,0.001 %',relation;
1465               NEW.parent_place_id := relation.place_id;
1466             END LOOP;
1467           END IF;
1468
1469         END LOOP;
1470         END LOOP;
1471                 
1472       END IF;
1473
1474 --RAISE WARNING 'x2';
1475
1476       IF NEW.parent_place_id IS NULL AND NEW.osm_type = 'W' THEN
1477         -- Is this way part of a relation?
1478         FOR relation IN select * from planet_osm_rels where parts @> ARRAY[NEW.osm_id] and members @> ARRAY['w'||NEW.osm_id]
1479         LOOP
1480           -- At the moment we only process one type of relation - associatedStreet
1481           IF relation.tags @> ARRAY['associatedStreet'] AND array_upper(relation.members, 1) IS NOT NULL THEN
1482             FOR i IN 1..array_upper(relation.members, 1) BY 2 LOOP
1483               IF NEW.parent_place_id IS NULL AND relation.members[i+1] = 'street' THEN
1484 --RAISE WARNING 'way that is in a relation %',relation;
1485                 SELECT place_id from placex where osm_type='W' and osm_id = substring(relation.members[i],2,200)::integer
1486                   and rank_search = 26 INTO NEW.parent_place_id;
1487               END IF;
1488             END LOOP;
1489           END IF;
1490         END LOOP;
1491       END IF;
1492       
1493 --RAISE WARNING 'x3 %',NEW.parent_place_id;
1494
1495       IF NEW.parent_place_id IS NULL AND NEW.street IS NOT NULL THEN
1496         address_street_word_id := get_name_id(make_standard_name(NEW.street));
1497         IF address_street_word_id IS NOT NULL THEN
1498           FOR location IN SELECT * from getNearestNamedRoadFeature(NEW.partition, place_centroid, address_street_word_id) LOOP
1499             NEW.parent_place_id := location.place_id;
1500           END LOOP;
1501         END IF;
1502       END IF;
1503
1504 --RAISE WARNING 'x4 %',NEW.parent_place_id;
1505       -- Still nothing, just use the nearest road
1506       IF NEW.parent_place_id IS NULL THEN
1507         FOR location IN SELECT place_id FROM getNearestRoadFeature(NEW.partition, place_centroid) LOOP
1508           NEW.parent_place_id := location.place_id;
1509         END LOOP;
1510       END IF;
1511
1512 --return NEW;
1513 --RAISE WARNING 'x6 %',NEW.parent_place_id;
1514
1515       -- If we didn't find any road fallback to standard method
1516       IF NEW.parent_place_id IS NOT NULL THEN
1517
1518         -- Add the street to the address as zero distance to force to front of list
1519 --        INSERT INTO place_addressline VALUES (NEW.place_id, NEW.parent_place_id, true, true, 0, 26);
1520         address_havelevel[26] := true;
1521
1522         -- Import address details from parent, reclculating distance in process
1523 --        INSERT INTO place_addressline select NEW.place_id, x.address_place_id, x.fromarea, x.isaddress, ST_distance(NEW.geometry, placex.geometry), placex.rank_address
1524 --          from place_addressline as x join placex on (address_place_id = placex.place_id)
1525 --          where x.place_id = NEW.parent_place_id and x.address_place_id != NEW.parent_place_id;
1526
1527         -- Get the details of the parent road
1528         select * from search_name where place_id = NEW.parent_place_id INTO location;
1529         NEW.calculated_country_code := location.country_code;
1530
1531 --RAISE WARNING '%', NEW.name;
1532         -- If there is no name it isn't searchable, don't bother to create a search record
1533         IF NEW.name is NULL THEN
1534           return NEW;
1535         END IF;
1536
1537         -- Merge address from parent
1538         nameaddress_vector := array_merge(nameaddress_vector, location.nameaddress_vector);
1539         nameaddress_vector := array_merge(nameaddress_vector, location.name_vector);
1540 --return NEW;
1541         -- Performance, it would be more acurate to do all the rest of the import process but it takes too long
1542         -- Just be happy with inheriting from parent road only
1543
1544         IF NEW.rank_search <= 25 THEN
1545           result := add_location(NEW.place_id, NEW.calculated_country_code, NEW.partition, name_vector, NEW.rank_search, NEW.rank_address, NEW.geometry);
1546         END IF;
1547
1548         result := insertSearchName(NEW.partition, NEW.place_id, NEW.calculated_country_code, name_vector, nameaddress_vector, NEW.rank_search, NEW.rank_address, NEW.importance, place_centroid);
1549
1550         return NEW;
1551       END IF;
1552
1553     END IF;
1554
1555 -- RAISE WARNING '  INDEXING Started:';
1556 -- RAISE WARNING '  INDEXING: %',NEW;
1557
1558     IF NEW.osm_type = 'R' AND NEW.rank_search < 26 THEN
1559
1560       -- see if we have any special relation members
1561       select members from planet_osm_rels where id = NEW.osm_id INTO relation_members;
1562
1563 -- RAISE WARNING 'get_osm_rel_members, label';
1564       IF relation_members IS NOT NULL THEN
1565         FOR relMember IN select get_osm_rel_members(relation_members,ARRAY['label']) as member LOOP
1566
1567           FOR linkedPlacex IN select * from placex where osm_type = upper(substring(relMember.member,1,1))::char(1) 
1568             and osm_id = substring(relMember.member,2,10000)::bigint order by rank_search desc limit 1 LOOP
1569
1570             -- If we don't already have one use this as the centre point of the geometry
1571             IF NEW.centroid IS NULL THEN
1572               NEW.centroid := coalesce(linkedPlacex.centroid,st_centroid(linkedPlacex.geometry));
1573             END IF;
1574
1575             -- merge in the label name, re-init word vector
1576             IF NOT linkedPlacex.name IS NULL THEN
1577               NEW.name := linkedPlacex.name || NEW.name;
1578               name_vector := make_keywords(NEW.name);
1579             END IF;
1580
1581             -- merge in extra tags
1582             IF NOT linkedPlacex.extratags IS NULL THEN
1583               NEW.extratags := linkedPlacex.extratags || NEW.extratags;
1584             END IF;
1585
1586             -- mark the linked place (excludes from search results)
1587             UPDATE placex set linked_place_id = NEW.place_id where place_id = linkedPlacex.place_id;
1588
1589           END LOOP;
1590
1591         END LOOP;
1592
1593         IF NEW.centroid IS NULL THEN
1594
1595           FOR relMember IN select get_osm_rel_members(relation_members,ARRAY['admin_center','admin_centre']) as member LOOP
1596
1597             FOR linkedPlacex IN select * from placex where osm_type = upper(substring(relMember.member,1,1))::char(1) 
1598               and osm_id = substring(relMember.member,2,10000)::bigint order by rank_search desc limit 1 LOOP
1599
1600               -- For an admin centre we also want a name match - still not perfect, for example 'new york, new york'
1601               -- But that can be fixed by explicitly setting the label in the data
1602               IF make_standard_name(NEW.name->'name') = make_standard_name(linkedPlacex.name->'name') 
1603                 AND NEW.rank_address = linkedPlacex.rank_address THEN
1604
1605
1606                 -- If we don't already have one use this as the centre point of the geometry
1607                 IF NEW.centroid IS NULL THEN
1608                   NEW.centroid := coalesce(linkedPlacex.centroid,st_centroid(linkedPlacex.geometry));
1609                 END IF;
1610
1611                 -- merge in the name, re-init word vector
1612                 IF NOT linkedPlacex.name IS NULL THEN
1613                   NEW.name := linkedPlacex.name || NEW.name;
1614                   name_vector := make_keywords(NEW.name);
1615                 END IF;
1616
1617                 -- merge in extra tags
1618                 IF NOT linkedPlacex.extratags IS NULL THEN
1619                   NEW.extratags := linkedPlacex.extratags || NEW.extratags;
1620                 END IF;
1621
1622                 -- mark the linked place (excludes from search results)
1623                 UPDATE placex set linked_place_id = NEW.place_id where place_id = linkedPlacex.place_id;
1624
1625                 -- keep a note of the node id in case we need it for wikipedia in a bit
1626                 linked_node_id := linkedPlacex.osm_id;
1627               END IF;
1628
1629             END LOOP;
1630
1631           END LOOP;
1632
1633         END IF;
1634       END IF;
1635
1636       -- not found one yet? how about doing a name search
1637       IF NEW.centroid IS NULL AND (NEW.name->'name') is not null and make_standard_name(NEW.name->'name') != '' THEN
1638
1639         FOR linkedPlacex IN select placex.* from placex WHERE
1640           make_standard_name(name->'name') = make_standard_name(NEW.name->'name')
1641           AND placex.rank_address = NEW.rank_address
1642           AND placex.place_id != NEW.place_id
1643           AND placex.osm_type = 'N'::char(1) AND placex.rank_search < 26
1644           AND st_covers(NEW.geometry, placex.geometry)
1645         LOOP
1646
1647           -- If we don't already have one use this as the centre point of the geometry
1648           IF NEW.centroid IS NULL THEN
1649             NEW.centroid := coalesce(linkedPlacex.centroid,st_centroid(linkedPlacex.geometry));
1650           END IF;
1651
1652           -- merge in the name, re-init word vector
1653           NEW.name := linkedPlacex.name || NEW.name;
1654           name_vector := make_keywords(NEW.name);
1655
1656           -- merge in extra tags
1657           NEW.extratags := linkedPlacex.extratags || NEW.extratags;
1658
1659           -- mark the linked place (excludes from search results)
1660           UPDATE placex set linked_place_id = NEW.place_id where place_id = linkedPlacex.place_id;
1661
1662           -- keep a note of the node id in case we need it for wikipedia in a bit
1663           linked_node_id := linkedPlacex.osm_id;
1664         END LOOP;
1665       END IF;
1666
1667       IF NEW.centroid IS NOT NULL THEN
1668         place_centroid := NEW.centroid;
1669       END IF;
1670
1671       -- Did we gain a wikipedia tag in the process? then we need to recalculate our importance
1672       IF NEW.importance is null THEN
1673         select language||':'||title,importance from get_wikipedia_match(NEW.extratags, NEW.calculated_country_code) INTO NEW.wikipedia,NEW.importance;
1674       END IF;
1675       -- Still null? how about looking it up by the node id
1676       IF NEW.importance IS NULL THEN
1677         select language||':'||title,importance from wikipedia_article where osm_type = 'N'::char(1) and osm_id = linked_node_id order by importance desc limit 1 INTO NEW.wikipedia,NEW.importance;
1678       END IF;
1679
1680     END IF;
1681
1682     -- make sure all names are in the word table
1683     IF NEW.admin_level = 2 AND NEW.class = 'boundary' AND NEW.type = 'administrative' AND NEW.country_code IS NOT NULL THEN
1684       perform create_country(NEW.name, lower(NEW.country_code));
1685     END IF;
1686
1687     NEW.parent_place_id = 0;
1688     parent_place_id_rank = 0;
1689
1690     -- convert isin to array of tokenids
1691     isin_tokens := '{}'::int[];
1692     IF NEW.isin IS NOT NULL THEN
1693       isin := regexp_split_to_array(NEW.isin, E'[;,]');
1694       IF array_upper(isin, 1) IS NOT NULL THEN
1695         FOR i IN 1..array_upper(isin, 1) LOOP
1696           address_street_word_id := get_name_id(make_standard_name(isin[i]));
1697           IF address_street_word_id IS NOT NULL AND NOT(ARRAY[address_street_word_id] <@ isin_tokens) THEN
1698             isin_tokens := isin_tokens || address_street_word_id;
1699           END IF;
1700         END LOOP;
1701       END IF;
1702     END IF;
1703     IF NEW.postcode IS NOT NULL THEN
1704       isin := regexp_split_to_array(NEW.postcode, E'[;,]');
1705       IF array_upper(isin, 1) IS NOT NULL THEN
1706         FOR i IN 1..array_upper(isin, 1) LOOP
1707           address_street_word_id := get_name_id(make_standard_name(isin[i]));
1708           IF address_street_word_id IS NOT NULL AND NOT(ARRAY[address_street_word_id] <@ isin_tokens) THEN
1709             isin_tokens := isin_tokens || address_street_word_id;
1710           END IF;
1711         END LOOP;
1712       END IF;
1713     END IF;
1714
1715     -- for the USA we have an additional address table.  Merge in zip codes from there too
1716     IF NEW.rank_search = 26 AND NEW.calculated_country_code = 'us' THEN
1717       FOR location IN SELECT distinct postcode from location_property_tiger where parent_place_id = NEW.place_id LOOP
1718         address_street_word_id := get_name_id(make_standard_name(location.postcode));
1719         nameaddress_vector := array_merge(nameaddress_vector, ARRAY[address_street_word_id]);
1720         isin_tokens := isin_tokens || address_street_word_id;
1721       END LOOP;
1722     END IF;
1723
1724 -- RAISE WARNING 'ISIN: %', isin_tokens;
1725
1726     -- Process area matches
1727     location_rank_search := 0;
1728     location_distance := 0;
1729     location_parent := NULL;
1730     -- added ourself as address already
1731     address_havelevel[NEW.rank_address] := true;
1732     -- RAISE WARNING '  getNearFeatures(%,''%'',%,''%'')',NEW.partition, place_centroid, search_maxrank, isin_tokens;
1733     FOR location IN SELECT * from getNearFeatures(NEW.partition, place_centroid, search_maxrank, isin_tokens) LOOP
1734
1735 --RAISE WARNING '  AREA: %',location;
1736
1737       IF location.rank_address != location_rank_search THEN
1738         location_rank_search := location.rank_address;
1739         location_distance := location.distance * 1.5;
1740       END IF;
1741
1742       IF location.distance < location_distance OR NOT location.isguess THEN
1743
1744         location_isaddress := NOT address_havelevel[location.rank_address];
1745         IF location_isaddress AND location.isguess AND location_parent IS NOT NULL THEN
1746             location_isaddress := ST_Contains(location_parent,location.centroid);
1747         END IF;
1748
1749         -- RAISE WARNING '% isaddress: %', location.place_id, location_isaddress;
1750         -- Add it to the list of search terms
1751         IF location.rank_search > 4 THEN
1752             nameaddress_vector := array_merge(nameaddress_vector, location.keywords::integer[]);
1753         END IF;
1754         INSERT INTO place_addressline VALUES (NEW.place_id, location.place_id, true, location_isaddress, location.distance, location.rank_address);
1755
1756         IF location_isaddress THEN
1757             address_havelevel[location.rank_address] := true;
1758             IF NOT location.isguess THEN
1759                 SELECT geometry FROM placex WHERE place_id = location.place_id INTO location_parent;
1760             END IF;
1761         END IF;
1762
1763 --RAISE WARNING '  Terms: (%) %',location, nameaddress_vector;
1764
1765         IF location.rank_address > parent_place_id_rank THEN
1766           NEW.parent_place_id = location.place_id;
1767           parent_place_id_rank = location.rank_address;
1768         END IF;
1769
1770       END IF;
1771
1772     END LOOP;
1773
1774     -- try using the isin value to find parent places
1775     IF array_upper(isin_tokens, 1) IS NOT NULL THEN
1776       FOR i IN 1..array_upper(isin_tokens, 1) LOOP
1777 --RAISE WARNING '  getNearestNamedFeature: % % % %',NEW.partition, place_centroid, search_maxrank, isin_tokens[i];
1778         IF NOT ARRAY[isin_tokens[i]] <@ nameaddress_vector THEN
1779
1780           FOR location IN SELECT * from getNearestNamedFeature(NEW.partition, place_centroid, search_maxrank, isin_tokens[i]) LOOP
1781
1782   --RAISE WARNING '  ISIN: %',location;
1783
1784             IF location.rank_search > 4 THEN
1785                 nameaddress_vector := array_merge(nameaddress_vector, location.keywords::integer[]);
1786                 INSERT INTO place_addressline VALUES (NEW.place_id, location.place_id, false, NOT address_havelevel[location.rank_address], location.distance, location.rank_address);
1787                 address_havelevel[location.rank_address] := true;
1788
1789                 IF location.rank_address > parent_place_id_rank THEN
1790                   NEW.parent_place_id = location.place_id;
1791                   parent_place_id_rank = location.rank_address;
1792                 END IF;
1793             END IF;
1794           END LOOP;
1795
1796         END IF;
1797
1798       END LOOP;
1799     END IF;
1800
1801     -- for long ways we should add search terms for the entire length
1802     IF st_length(NEW.geometry) > 0.05 THEN
1803
1804       location_rank_search := 0;
1805       location_distance := 0;
1806
1807       FOR location IN SELECT * from getNearFeatures(NEW.partition, NEW.geometry, search_maxrank, isin_tokens) LOOP
1808
1809         IF location.rank_address != location_rank_search THEN
1810           location_rank_search := location.rank_address;
1811           location_distance := location.distance * 1.5;
1812         END IF;
1813
1814         IF location.rank_search > 4 AND location.distance < location_distance THEN
1815
1816           -- Add it to the list of search terms
1817           nameaddress_vector := array_merge(nameaddress_vector, location.keywords::integer[]);
1818           INSERT INTO place_addressline VALUES (NEW.place_id, location.place_id, true, false, location.distance, location.rank_address); 
1819
1820         END IF;
1821
1822       END LOOP;
1823
1824     END IF;
1825
1826     -- if we have a name add this to the name search table
1827     IF NEW.name IS NOT NULL THEN
1828
1829       IF NEW.rank_search <= 25 THEN
1830         result := add_location(NEW.place_id, NEW.calculated_country_code, NEW.partition, name_vector, NEW.rank_search, NEW.rank_address, NEW.geometry);
1831       END IF;
1832
1833       IF NEW.rank_search between 26 and 27 and NEW.class = 'highway' THEN
1834         result := insertLocationRoad(NEW.partition, NEW.place_id, NEW.calculated_country_code, NEW.geometry);
1835       END IF;
1836
1837       result := insertSearchName(NEW.partition, NEW.place_id, NEW.calculated_country_code, name_vector, nameaddress_vector, NEW.rank_search, NEW.rank_address, NEW.importance, place_centroid);
1838
1839 --      INSERT INTO search_name values (NEW.place_id, NEW.rank_search, NEW.rank_search, 0, NEW.calculated_country_code, name_vector, nameaddress_vector, place_centroid);
1840     END IF;
1841
1842     -- If we've not managed to pick up a better one - default centroid
1843     IF NEW.centroid IS NULL THEN
1844       NEW.centroid := place_centroid;
1845     END IF;
1846
1847   END IF;
1848
1849   RETURN NEW;
1850 END;
1851 $$
1852 LANGUAGE plpgsql;
1853
1854 CREATE OR REPLACE FUNCTION placex_delete() RETURNS TRIGGER
1855   AS $$
1856 DECLARE
1857   b BOOLEAN;
1858   classtable TEXT;
1859 BEGIN
1860   -- RAISE WARNING 'placex_delete % %',OLD.osm_type,OLD.osm_id;
1861
1862   update placex set linked_place_id = null, indexed_status = 2 where linked_place_id = OLD.place_id and indexed_status = 0;
1863   --DEBUG: RAISE WARNING 'placex_delete:01 % %',OLD.osm_type,OLD.osm_id;
1864   update placex set linked_place_id = null where linked_place_id = OLD.place_id;
1865   --DEBUG: RAISE WARNING 'placex_delete:02 % %',OLD.osm_type,OLD.osm_id;
1866
1867   IF OLD.rank_address < 30 THEN
1868
1869     -- mark everything linked to this place for re-indexing
1870     --DEBUG: RAISE WARNING 'placex_delete:03 % %',OLD.osm_type,OLD.osm_id;
1871     UPDATE placex set indexed_status = 2 from place_addressline where address_place_id = OLD.place_id 
1872       and placex.place_id = place_addressline.place_id and indexed_status = 0;
1873
1874     --DEBUG: RAISE WARNING 'placex_delete:04 % %',OLD.osm_type,OLD.osm_id;
1875     DELETE FROM place_addressline where address_place_id = OLD.place_id;
1876
1877     --DEBUG: RAISE WARNING 'placex_delete:05 % %',OLD.osm_type,OLD.osm_id;
1878     b := deleteRoad(OLD.partition, OLD.place_id);
1879
1880     --DEBUG: RAISE WARNING 'placex_delete:06 % %',OLD.osm_type,OLD.osm_id;
1881     update placex set indexed_status = 2 where parent_place_id = OLD.place_id and indexed_status = 0;
1882     --DEBUG: RAISE WARNING 'placex_delete:07 % %',OLD.osm_type,OLD.osm_id;
1883
1884   END IF;
1885
1886   --DEBUG: RAISE WARNING 'placex_delete:08 % %',OLD.osm_type,OLD.osm_id;
1887
1888   IF OLD.rank_address < 26 THEN
1889     b := deleteLocationArea(OLD.partition, OLD.place_id, OLD.rank_search);
1890   END IF;
1891
1892   --DEBUG: RAISE WARNING 'placex_delete:09 % %',OLD.osm_type,OLD.osm_id;
1893
1894   IF OLD.name is not null THEN
1895     b := deleteSearchName(OLD.partition, OLD.place_id);
1896   END IF;
1897
1898   --DEBUG: RAISE WARNING 'placex_delete:10 % %',OLD.osm_type,OLD.osm_id;
1899
1900   DELETE FROM place_addressline where place_id = OLD.place_id;
1901
1902   --DEBUG: RAISE WARNING 'placex_delete:11 % %',OLD.osm_type,OLD.osm_id;
1903
1904   -- remove from tables for special search
1905   classtable := 'place_classtype_' || OLD.class || '_' || OLD.type;
1906   SELECT count(*)>0 FROM pg_tables WHERE tablename = classtable INTO b;
1907   IF b THEN
1908     EXECUTE 'DELETE FROM ' || classtable::regclass || ' WHERE place_id = $1' USING OLD.place_id;
1909   END IF;
1910
1911   --DEBUG: RAISE WARNING 'placex_delete:12 % %',OLD.osm_type,OLD.osm_id;
1912
1913   RETURN OLD;
1914
1915 END;
1916 $$
1917 LANGUAGE plpgsql;
1918
1919 CREATE OR REPLACE FUNCTION place_delete() RETURNS TRIGGER
1920   AS $$
1921 DECLARE
1922   placeid BIGINT;
1923 BEGIN
1924
1925   --DEBUG: RAISE WARNING 'delete: % % % %',OLD.osm_type,OLD.osm_id,OLD.class,OLD.type;
1926
1927   -- deleting large polygons can have a massive effect on the system - require manual intervention to let them through
1928   IF st_area(OLD.geometry) > 2 and st_isvalid(OLD.geometry) THEN
1929     insert into import_polygon_delete values (OLD.osm_type,OLD.osm_id,OLD.class,OLD.type);
1930     RETURN NULL;
1931   END IF;
1932
1933   -- mark for delete
1934   UPDATE placex set indexed_status = 100 where osm_type = OLD.osm_type and osm_id = OLD.osm_id and class = OLD.class and type = OLD.type;
1935
1936   RETURN OLD;
1937
1938 END;
1939 $$
1940 LANGUAGE plpgsql;
1941
1942 CREATE OR REPLACE FUNCTION place_insert() RETURNS TRIGGER
1943   AS $$
1944 DECLARE
1945   i INTEGER;
1946   existing RECORD;
1947   existingplacex RECORD;
1948   existinggeometry GEOMETRY;
1949   existingplace_id BIGINT;
1950   result BOOLEAN;
1951   partition INTEGER;
1952 BEGIN
1953
1954   --DEBUG: RAISE WARNING '-----------------------------------------------------------------------------------';
1955   --DEBUG: RAISE WARNING 'place_insert: % % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type,st_area(NEW.geometry);
1956
1957   IF FALSE and NEW.osm_type = 'R' THEN
1958     select * from placex where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type INTO existingplacex;
1959     --DEBUG: RAISE WARNING '%', existingplacex;
1960   END IF;
1961
1962   -- Just block these - lots and pointless
1963   IF NEW.class = 'highway' and NEW.type in ('turning_circle','traffic_signals','mini_roundabout','noexit','crossing') THEN
1964     RETURN null;
1965   END IF;
1966   IF NEW.class in ('landuse','natural') and NEW.name is null THEN
1967     RETURN null;
1968   END IF;
1969
1970   IF ST_IsEmpty(NEW.geometry) OR NOT ST_IsValid(NEW.geometry) OR ST_X(ST_Centroid(NEW.geometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEW.geometry))::text in ('NaN','Infinity','-Infinity') THEN  
1971     INSERT INTO import_polygon_error values (NEW.osm_type, NEW.osm_id, NEW.class, NEW.type, NEW.name, NEW.country_code, 
1972       now(), ST_IsValidReason(NEW.geometry), null, NEW.geometry);
1973 --    RAISE WARNING 'Invalid Geometry: % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type;
1974     RETURN null;
1975   END IF;
1976
1977   -- Patch in additional country names
1978   IF NEW.admin_level = 2 AND NEW.type = 'administrative' AND NEW.country_code is not null THEN
1979     select coalesce(country_name.name || NEW.name,NEW.name) from country_name where country_name.country_code = lower(NEW.country_code) INTO NEW.name;
1980   END IF;
1981     
1982   -- Have we already done this place?
1983   select * from place where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type INTO existing;
1984
1985   -- Get the existing place_id
1986   select * from placex where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type INTO existingplacex;
1987
1988   -- Handle a place changing type by removing the old data
1989   -- My generated 'place' types are causing havok because they overlap with real keys
1990   -- TODO: move them to their own special purpose key/class to avoid collisions
1991   IF existing.osm_type IS NULL AND (NEW.type not in ('postcode','house','houses')) THEN
1992     DELETE FROM place where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type not in ('postcode','house','houses');
1993   END IF;
1994
1995   --DEBUG: RAISE WARNING 'Existing: %',existing.osm_id;
1996   --DEBUG: RAISE WARNING 'Existing PlaceX: %',existingplacex.place_id;
1997
1998   -- Log and discard 
1999   IF existing.geometry is not null AND st_isvalid(existing.geometry) 
2000     AND st_area(existing.geometry) > 0.02
2001     AND ST_GeometryType(NEW.geometry) in ('ST_Polygon','ST_MultiPolygon')
2002     AND st_area(NEW.geometry) < st_area(existing.geometry)*0.5
2003     THEN
2004     INSERT INTO import_polygon_error values (NEW.osm_type, NEW.osm_id, NEW.class, NEW.type, NEW.name, NEW.country_code, now(), 
2005       'Area reduced from '||st_area(existing.geometry)||' to '||st_area(NEW.geometry), existing.geometry, NEW.geometry);
2006     RETURN null;
2007   END IF;
2008
2009   DELETE from import_polygon_error where osm_type = NEW.osm_type and osm_id = NEW.osm_id;
2010   DELETE from import_polygon_delete where osm_type = NEW.osm_type and osm_id = NEW.osm_id;
2011
2012   -- To paraphrase, if there isn't an existing item, OR if the admin level has changed, OR if it is a major change in geometry
2013   IF existingplacex.osm_type IS NULL THEN
2014
2015     IF existing.osm_type IS NOT NULL THEN
2016       DELETE from place where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type;
2017     END IF;
2018
2019     -- No - process it as a new insertion (hopefully of low rank or it will be slow)
2020     insert into placex (osm_type, osm_id, class, type, name, admin_level, housenumber, 
2021       street, isin, postcode, country_code, extratags, geometry)
2022       values (NEW.osm_type
2023         ,NEW.osm_id
2024         ,NEW.class
2025         ,NEW.type
2026         ,NEW.name
2027         ,NEW.admin_level
2028         ,NEW.housenumber
2029         ,NEW.street
2030         ,NEW.isin
2031         ,NEW.postcode
2032         ,NEW.country_code
2033         ,NEW.extratags
2034         ,NEW.geometry
2035         );
2036
2037     --DEBUG: RAISE WARNING 'insert done % % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type,NEW.name;
2038
2039     RETURN NEW;
2040   END IF;
2041
2042   -- Various ways to do the update
2043
2044   -- Debug, what's changed?
2045   IF FALSE THEN
2046     IF coalesce(existing.name::text, '') != coalesce(NEW.name::text, '') THEN
2047       RAISE WARNING 'update details, name: % % % %',NEW.osm_type,NEW.osm_id,existing.name::text,NEW.name::text;
2048     END IF;
2049     IF coalesce(existing.housenumber, '') != coalesce(NEW.housenumber, '') THEN
2050       RAISE WARNING 'update details, housenumber: % % % %',NEW.osm_type,NEW.osm_id,existing.housenumber,NEW.housenumber;
2051     END IF;
2052     IF coalesce(existing.street, '') != coalesce(NEW.street, '') THEN
2053       RAISE WARNING 'update details, street: % % % %',NEW.osm_type,NEW.osm_id,existing.street,NEW.street;
2054     END IF;
2055     IF coalesce(existing.isin, '') != coalesce(NEW.isin, '') THEN
2056       RAISE WARNING 'update details, isin: % % % %',NEW.osm_type,NEW.osm_id,existing.isin,NEW.isin;
2057     END IF;
2058     IF coalesce(existing.postcode, '') != coalesce(NEW.postcode, '') THEN
2059       RAISE WARNING 'update details, postcode: % % % %',NEW.osm_type,NEW.osm_id,existing.postcode,NEW.postcode;
2060     END IF;
2061     IF coalesce(existing.country_code, '') != coalesce(NEW.country_code, '') THEN
2062       RAISE WARNING 'update details, country_code: % % % %',NEW.osm_type,NEW.osm_id,existing.country_code,NEW.country_code;
2063     END IF;
2064   END IF;
2065
2066   -- Special case for polygon shape changes because they tend to be large and we can be a bit clever about how we handle them
2067   IF existing.geometry::text != NEW.geometry::text 
2068      AND ST_GeometryType(existing.geometry) in ('ST_Polygon','ST_MultiPolygon')
2069      AND ST_GeometryType(NEW.geometry) in ('ST_Polygon','ST_MultiPolygon') 
2070      THEN 
2071
2072     -- Get the version of the geometry actually used (in placex table)
2073     select geometry from placex where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type into existinggeometry;
2074
2075     -- Performance limit
2076     IF st_area(NEW.geometry) < 0.000000001 AND st_area(existinggeometry) < 1 THEN
2077
2078       -- re-index points that have moved in / out of the polygon, could be done as a single query but postgres gets the index usage wrong
2079       update placex set indexed_status = 2 where indexed_status = 0 and 
2080           (st_covers(NEW.geometry, placex.geometry) OR ST_Intersects(NEW.geometry, placex.geometry))
2081           AND NOT (st_covers(existinggeometry, placex.geometry) OR ST_Intersects(existinggeometry, placex.geometry))
2082           AND rank_search > existingplacex.rank_search AND (rank_search < 28 or name is not null);
2083
2084       update placex set indexed_status = 2 where indexed_status = 0 and 
2085           (st_covers(existinggeometry, placex.geometry) OR ST_Intersects(existinggeometry, placex.geometry))
2086           AND NOT (st_covers(NEW.geometry, placex.geometry) OR ST_Intersects(NEW.geometry, placex.geometry))
2087           AND rank_search > existingplacex.rank_search AND (rank_search < 28 or name is not null);
2088
2089     END IF;
2090
2091   END IF;
2092
2093   -- Special case - if we are just adding extra words we hack them into the search_name table rather than reindexing
2094   IF FALSE AND existingplacex.rank_search < 26
2095      AND coalesce(existing.housenumber, '') = coalesce(NEW.housenumber, '')
2096      AND coalesce(existing.street, '') = coalesce(NEW.street, '')
2097      AND coalesce(existing.isin, '') = coalesce(NEW.isin, '')
2098      AND coalesce(existing.postcode, '') = coalesce(NEW.postcode, '')
2099      AND coalesce(existing.country_code, '') = coalesce(NEW.country_code, '')
2100      AND coalesce(existing.name::text, '') != coalesce(NEW.name::text, '') 
2101      THEN
2102
2103     IF NOT update_location_nameonly(existingplacex.place_id, NEW.name) THEN
2104
2105       IF st_area(NEW.geometry) < 0.5 THEN
2106         UPDATE placex set indexed_status = 2 from place_addressline where address_place_id = existingplacex.place_id 
2107           and placex.place_id = place_addressline.place_id and indexed_status = 0
2108           and (rank_search < 28 or name is not null);
2109       END IF;
2110
2111     END IF;
2112   
2113   ELSE
2114
2115     -- Anything else has changed - reindex the lot
2116     IF coalesce(existing.name::text, '') != coalesce(NEW.name::text, '')
2117         OR coalesce(existing.housenumber, '') != coalesce(NEW.housenumber, '')
2118         OR coalesce(existing.street, '') != coalesce(NEW.street, '')
2119         OR coalesce(existing.isin, '') != coalesce(NEW.isin, '')
2120         OR coalesce(existing.postcode, '') != coalesce(NEW.postcode, '')
2121         OR coalesce(existing.country_code, '') != coalesce(NEW.country_code, '') THEN
2122
2123       -- performance, can't take the load of re-indexing a whole country / huge area
2124       IF st_area(NEW.geometry) < 0.5 THEN
2125 --        UPDATE placex set indexed_status = 2 from place_addressline where address_place_id = existingplacex.place_id 
2126 --          and placex.place_id = place_addressline.place_id and indexed_status = 0;
2127       END IF;
2128
2129     END IF;
2130
2131   END IF;
2132
2133   IF coalesce(existing.name::text, '') != coalesce(NEW.name::text, '')
2134      OR coalesce(existing.extratags::text, '') != coalesce(NEW.extratags::text, '')
2135      OR coalesce(existing.housenumber, '') != coalesce(NEW.housenumber, '')
2136      OR coalesce(existing.street, '') != coalesce(NEW.street, '')
2137      OR coalesce(existing.isin, '') != coalesce(NEW.isin, '')
2138      OR coalesce(existing.postcode, '') != coalesce(NEW.postcode, '')
2139      OR coalesce(existing.country_code, '') != coalesce(NEW.country_code, '')
2140      OR coalesce(existing.admin_level, 15) != coalesce(NEW.admin_level, 15)
2141      OR existing.geometry::text != NEW.geometry::text
2142      THEN
2143
2144     update place set 
2145       name = NEW.name,
2146       housenumber  = NEW.housenumber,
2147       street = NEW.street,
2148       isin = NEW.isin,
2149       postcode = NEW.postcode,
2150       country_code = NEW.country_code,
2151       extratags = NEW.extratags,
2152       geometry = NEW.geometry
2153       where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type;
2154
2155     update placex set 
2156       name = NEW.name,
2157       housenumber = NEW.housenumber,
2158       street = NEW.street,
2159       isin = NEW.isin,
2160       postcode = NEW.postcode,
2161       country_code = NEW.country_code,
2162       parent_place_id = null,
2163       extratags = NEW.extratags,
2164       indexed_status = 2,    
2165       geometry = NEW.geometry
2166       where place_id = existingplacex.place_id;
2167
2168   END IF;
2169
2170   -- Abort the add (we modified the existing place instead)
2171   RETURN NULL;
2172
2173 END; 
2174 $$ LANGUAGE plpgsql;
2175
2176 CREATE OR REPLACE FUNCTION get_name_by_language(name hstore, languagepref TEXT[]) RETURNS TEXT
2177   AS $$
2178 DECLARE
2179   search TEXT[];
2180   found BOOLEAN;
2181 BEGIN
2182
2183   IF name is null THEN
2184     RETURN null;
2185   END IF;
2186
2187   search := languagepref;
2188
2189   FOR j IN 1..array_upper(search, 1) LOOP
2190     IF name ? search[j] AND trim(name->search[j]) != '' THEN
2191       return trim(name->search[j]);
2192     END IF;
2193   END LOOP;
2194
2195   -- anything will do as a fallback - just take the first name type thing there is
2196   search := avals(name);
2197   RETURN search[1];
2198 END;
2199 $$
2200 LANGUAGE plpgsql IMMUTABLE;
2201
2202 CREATE OR REPLACE FUNCTION get_connected_ways(way_ids INTEGER[]) RETURNS SETOF planet_osm_ways
2203   AS $$
2204 DECLARE
2205   searchnodes INTEGER[];
2206   location RECORD;
2207   j INTEGER;
2208 BEGIN
2209
2210   searchnodes := '{}';
2211   FOR j IN 1..array_upper(way_ids, 1) LOOP
2212     FOR location IN 
2213       select nodes from planet_osm_ways where id = way_ids[j] LIMIT 1
2214     LOOP
2215       IF not (ARRAY[location.nodes] <@ searchnodes) THEN
2216         searchnodes := searchnodes || location.nodes;
2217       END IF;
2218     END LOOP;
2219   END LOOP;
2220
2221   RETURN QUERY select * from planet_osm_ways where nodes && searchnodes and NOT ARRAY[id] <@ way_ids;
2222 END;
2223 $$
2224 LANGUAGE plpgsql IMMUTABLE;
2225
2226 CREATE OR REPLACE FUNCTION get_address_postcode(for_place_id BIGINT) RETURNS TEXT
2227   AS $$
2228 DECLARE
2229   result TEXT[];
2230   search TEXT[];
2231   for_postcode TEXT;
2232   found INTEGER;
2233   location RECORD;
2234 BEGIN
2235
2236   found := 1000;
2237   search := ARRAY['ref'];
2238   result := '{}';
2239
2240   select postcode from placex where place_id = for_place_id limit 1 into for_postcode;
2241
2242   FOR location IN 
2243     select rank_address,name,distance,length(name::text) as namelength 
2244       from place_addressline join placex on (address_place_id = placex.place_id) 
2245       where place_addressline.place_id = for_place_id and rank_address in (5,11)
2246       order by rank_address desc,rank_search desc,fromarea desc,distance asc,namelength desc
2247   LOOP
2248     IF array_upper(search, 1) IS NOT NULL AND array_upper(location.name, 1) IS NOT NULL THEN
2249       FOR j IN 1..array_upper(search, 1) LOOP
2250         FOR k IN 1..array_upper(location.name, 1) LOOP
2251           IF (found > location.rank_address AND location.name[k].key = search[j] AND location.name[k].value != '') AND NOT result @> ARRAY[trim(location.name[k].value)] AND (for_postcode IS NULL OR location.name[k].value ilike for_postcode||'%') THEN
2252             result[(100 - location.rank_address)] := trim(location.name[k].value);
2253             found := location.rank_address;
2254           END IF;
2255         END LOOP;
2256       END LOOP;
2257     END IF;
2258   END LOOP;
2259
2260   RETURN array_to_string(result,', ');
2261 END;
2262 $$
2263 LANGUAGE plpgsql;
2264
2265 CREATE OR REPLACE FUNCTION get_address_by_language(for_place_id BIGINT, languagepref TEXT[]) RETURNS TEXT
2266   AS $$
2267 DECLARE
2268   result TEXT[];
2269   currresult TEXT;
2270   prevresult TEXT;
2271   location RECORD;
2272 BEGIN
2273
2274   result := '{}';
2275   prevresult := '';
2276
2277   FOR location IN select * from get_addressdata(for_place_id) where isaddress order by rank_address desc LOOP
2278     currresult := trim(get_name_by_language(location.name, languagepref));
2279     IF currresult != prevresult AND currresult IS NOT NULL AND result[(100 - location.rank_address)] IS NULL THEN
2280       result[(100 - location.rank_address)] := trim(get_name_by_language(location.name, languagepref));
2281       prevresult := currresult;
2282     END IF;
2283   END LOOP;
2284
2285   RETURN array_to_string(result,', ');
2286 END;
2287 $$
2288 LANGUAGE plpgsql;
2289
2290 DROP TYPE addressline CASCADE;
2291 create type addressline as (
2292   place_id BIGINT,
2293   osm_type CHAR(1),
2294   osm_id INTEGER,
2295   name HSTORE,
2296   class TEXT,
2297   type TEXT,
2298   admin_level INTEGER,
2299   fromarea BOOLEAN,  
2300   isaddress BOOLEAN,  
2301   rank_address INTEGER,
2302   distance FLOAT
2303 );
2304
2305 CREATE OR REPLACE FUNCTION get_addressdata(in_place_id BIGINT) RETURNS setof addressline 
2306   AS $$
2307 DECLARE
2308   for_place_id BIGINT;
2309   result TEXT[];
2310   search TEXT[];
2311   found INTEGER;
2312   location RECORD;
2313   countrylocation RECORD;
2314   searchcountrycode varchar(2);
2315   searchhousenumber TEXT;
2316   searchhousename HSTORE;
2317   searchrankaddress INTEGER;
2318   searchpostcode TEXT;
2319   searchclass TEXT;
2320   searchtype TEXT;
2321   countryname HSTORE;
2322   hadcountry BOOLEAN;
2323 BEGIN
2324
2325   select parent_place_id,'us', housenumber, 30, postcode, null, 'place', 'house' from location_property_tiger 
2326     WHERE place_id = in_place_id 
2327     INTO for_place_id,searchcountrycode, searchhousenumber, searchrankaddress, searchpostcode, searchhousename, searchclass, searchtype;
2328
2329   IF for_place_id IS NULL THEN
2330     select parent_place_id,'us', housenumber, 30, postcode, null, 'place', 'house' from location_property_aux
2331       WHERE place_id = in_place_id 
2332       INTO for_place_id,searchcountrycode, searchhousenumber, searchrankaddress, searchpostcode, searchhousename, searchclass, searchtype;
2333   END IF;
2334
2335   IF for_place_id IS NULL THEN
2336     select parent_place_id, calculated_country_code, housenumber, rank_search, postcode, name, class, type from placex 
2337       WHERE place_id = in_place_id and rank_address = 30 
2338       INTO for_place_id, searchcountrycode, searchhousenumber, searchrankaddress, searchpostcode, searchhousename, searchclass, searchtype;
2339   END IF;
2340
2341   IF for_place_id IS NULL THEN
2342     for_place_id := in_place_id;
2343     select calculated_country_code, housenumber, rank_search, postcode, null from placex where place_id = for_place_id 
2344       INTO searchcountrycode, searchhousenumber, searchrankaddress, searchpostcode, searchhousename;
2345   END IF;
2346
2347 --RAISE WARNING '% % % %',searchcountrycode, searchhousenumber, searchrankaddress, searchpostcode;
2348
2349   found := 1000;
2350   hadcountry := false;
2351   FOR location IN 
2352     select placex.place_id, osm_type, osm_id,
2353       CASE WHEN class = 'place' and type = 'postcode' THEN hstore('name', postcode) ELSE name END as name,
2354       class, type, admin_level, true as fromarea, true as isaddress,
2355       CASE WHEN rank_address = 0 THEN 100 WHEN rank_address = 11 THEN 5 ELSE rank_address END as rank_address,
2356       0 as distance, calculated_country_code
2357       from placex
2358       where place_id = for_place_id 
2359   LOOP
2360 --RAISE WARNING '%',location;
2361     IF searchcountrycode IS NULL AND location.calculated_country_code IS NOT NULL THEN
2362       searchcountrycode := location.calculated_country_code;
2363     END IF;
2364     IF searchpostcode IS NOT NULL and location.type = 'postcode' THEN
2365       location.isaddress := FALSE;
2366     END IF;
2367     IF location.rank_address = 4 AND location.isaddress THEN
2368       hadcountry := true;
2369     END IF;
2370     IF location.rank_address < 4 AND NOT hadcountry THEN
2371       select name from country_name where country_code = searchcountrycode limit 1 INTO countryname;
2372       IF countryname IS NOT NULL THEN
2373         countrylocation := ROW(null, null, null, countryname, 'place', 'country', null, true, true, 4, 0)::addressline;
2374         RETURN NEXT countrylocation;
2375       END IF;
2376     END IF;
2377     countrylocation := ROW(location.place_id, location.osm_type, location.osm_id, location.name, location.class, 
2378                            location.type, location.admin_level, location.fromarea, location.isaddress, location.rank_address, 
2379                            location.distance)::addressline;
2380     RETURN NEXT countrylocation;
2381     found := location.rank_address;
2382   END LOOP;
2383
2384   FOR location IN 
2385     select placex.place_id, osm_type, osm_id,
2386       CASE WHEN class = 'place' and type = 'postcode' THEN hstore('name', postcode) ELSE name END as name,
2387       class, type, admin_level, fromarea, isaddress,
2388       CASE WHEN address_place_id = for_place_id AND rank_address = 0 THEN 100 WHEN rank_address = 11 THEN 5 ELSE rank_address END as rank_address,
2389       distance,calculated_country_code
2390       from place_addressline join placex on (address_place_id = placex.place_id) 
2391       where place_addressline.place_id = for_place_id 
2392       and (cached_rank_address > 0 AND cached_rank_address < searchrankaddress)
2393       and address_place_id != for_place_id
2394       and (placex.calculated_country_code IS NULL OR searchcountrycode IS NULL OR placex.calculated_country_code = searchcountrycode)
2395       order by rank_address desc,isaddress desc,fromarea desc,distance asc,rank_search desc
2396   LOOP
2397 --RAISE WARNING '%',location;
2398     IF searchcountrycode IS NULL AND location.calculated_country_code IS NOT NULL THEN
2399       searchcountrycode := location.calculated_country_code;
2400     END IF;
2401     IF searchpostcode IS NOT NULL and location.type = 'postcode' THEN
2402       location.isaddress := FALSE;
2403     END IF;
2404     IF location.rank_address = 4 AND location.isaddress THEN
2405       hadcountry := true;
2406     END IF;
2407     IF location.rank_address < 4 AND NOT hadcountry THEN
2408       select name from country_name where country_code = searchcountrycode limit 1 INTO countryname;
2409       IF countryname IS NOT NULL THEN
2410         countrylocation := ROW(null, null, null, countryname, 'place', 'country', null, true, true, 4, 0)::addressline;
2411         RETURN NEXT countrylocation;
2412       END IF;
2413     END IF;
2414     countrylocation := ROW(location.place_id, location.osm_type, location.osm_id, location.name, location.class, 
2415                            location.type, location.admin_level, location.fromarea, location.isaddress, location.rank_address, 
2416                            location.distance)::addressline;
2417     RETURN NEXT countrylocation;
2418     found := location.rank_address;
2419   END LOOP;
2420
2421   IF found > 4 THEN
2422     select name from country_name where country_code = searchcountrycode limit 1 INTO countryname;
2423 --RAISE WARNING '% % %',found,searchcountrycode,countryname;
2424     IF countryname IS NOT NULL THEN
2425       location := ROW(null, null, null, countryname, 'place', 'country', null, true, true, 4, 0)::addressline;
2426       RETURN NEXT location;
2427     END IF;
2428   END IF;
2429
2430   IF searchcountrycode IS NOT NULL THEN
2431     location := ROW(null, null, null, hstore('ref', searchcountrycode), 'place', 'country_code', null, true, false, 4, 0)::addressline;
2432     RETURN NEXT location;
2433   END IF;
2434
2435   IF searchhousename IS NOT NULL THEN
2436     location := ROW(in_place_id, null, null, searchhousename, searchclass, searchtype, null, true, true, 29, 0)::addressline;
2437 --    location := ROW(in_place_id, null, null, searchhousename, 'place', 'house_name', null, true, true, 29, 0)::addressline;
2438     RETURN NEXT location;
2439   END IF;
2440
2441   IF searchhousenumber IS NOT NULL THEN
2442     location := ROW(in_place_id, null, null, hstore('ref', searchhousenumber), 'place', 'house_number', null, true, true, 28, 0)::addressline;
2443     RETURN NEXT location;
2444   END IF;
2445
2446   IF searchpostcode IS NOT NULL THEN
2447     location := ROW(null, null, null, hstore('ref', searchpostcode), 'place', 'postcode', null, true, true, 5, 0)::addressline;
2448     RETURN NEXT location;
2449   END IF;
2450
2451   RETURN;
2452 END;
2453 $$
2454 LANGUAGE plpgsql;
2455
2456 CREATE OR REPLACE FUNCTION get_place_boundingbox(search_place_id BIGINT) RETURNS place_boundingbox
2457   AS $$
2458 DECLARE
2459   result place_boundingbox;
2460   numfeatures integer;
2461 BEGIN
2462   select * from place_boundingbox into result where place_id = search_place_id;
2463   IF result.place_id IS NULL THEN
2464 -- remove  isaddress = true because if there is a matching polygon it always wins
2465     select count(*) from place_addressline where address_place_id = search_place_id into numfeatures;
2466     insert into place_boundingbox select place_id,
2467              ST_Y(ST_PointN(ExteriorRing(ST_Box2D(geometry)),4)),ST_Y(ST_PointN(ExteriorRing(ST_Box2D(geometry)),2)),
2468              ST_X(ST_PointN(ExteriorRing(ST_Box2D(geometry)),1)),ST_X(ST_PointN(ExteriorRing(ST_Box2D(geometry)),3)),
2469              numfeatures, ST_Area(geometry),
2470              geometry as area from location_area where place_id = search_place_id;
2471     select * from place_boundingbox into result where place_id = search_place_id;
2472   END IF;
2473   IF result.place_id IS NULL THEN
2474 -- TODO 0.0001
2475     insert into place_boundingbox select address_place_id,
2476              min(ST_Y(ST_Centroid(geometry))) as minlon,max(ST_Y(ST_Centroid(geometry))) as maxlon,
2477              min(ST_X(ST_Centroid(geometry))) as minlat,max(ST_X(ST_Centroid(geometry))) as maxlat,
2478              count(*), ST_Area(ST_Buffer(ST_Convexhull(ST_Collect(geometry)),0.0001)) as area,
2479              ST_Buffer(ST_Convexhull(ST_Collect(geometry)),0.0001) as boundary 
2480              from (select * from place_addressline where address_place_id = search_place_id order by cached_rank_address limit 4000) as place_addressline join placex using (place_id) 
2481              where address_place_id = search_place_id
2482 --               and (isaddress = true OR place_id = search_place_id)
2483                and (st_length(geometry) < 0.01 or place_id = search_place_id)
2484              group by address_place_id limit 1;
2485     select * from place_boundingbox into result where place_id = search_place_id;
2486   END IF;
2487   return result;
2488 END;
2489 $$
2490 LANGUAGE plpgsql;
2491
2492 -- don't do the operation if it would be slow
2493 CREATE OR REPLACE FUNCTION get_place_boundingbox_quick(search_place_id BIGINT) RETURNS place_boundingbox
2494   AS $$
2495 DECLARE
2496   result place_boundingbox;
2497   numfeatures integer;
2498   rank integer;
2499 BEGIN
2500   select * from place_boundingbox into result where place_id = search_place_id;
2501   IF result IS NULL AND rank > 14 THEN
2502     select count(*) from place_addressline where address_place_id = search_place_id and isaddress = true into numfeatures;
2503     insert into place_boundingbox select place_id,
2504              ST_Y(ST_PointN(ExteriorRing(ST_Box2D(geometry)),4)),ST_Y(ST_PointN(ExteriorRing(ST_Box2D(geometry)),2)),
2505              ST_X(ST_PointN(ExteriorRing(ST_Box2D(geometry)),1)),ST_X(ST_PointN(ExteriorRing(ST_Box2D(geometry)),3)),
2506              numfeatures, ST_Area(geometry),
2507              geometry as area from location_area where place_id = search_place_id;
2508     select * from place_boundingbox into result where place_id = search_place_id;
2509   END IF;
2510   IF result IS NULL THEN
2511     select rank_search from placex where place_id = search_place_id into rank;
2512     IF rank > 20 THEN
2513 -- TODO 0.0001
2514       insert into place_boundingbox select address_place_id,
2515              min(ST_Y(ST_Centroid(geometry))) as minlon,max(ST_Y(ST_Centroid(geometry))) as maxlon,
2516              min(ST_X(ST_Centroid(geometry))) as minlat,max(ST_X(ST_Centroid(geometry))) as maxlat,
2517              count(*), ST_Area(ST_Buffer(ST_Convexhull(ST_Collect(geometry)),0.0001)) as area,
2518              ST_Buffer(ST_Convexhull(ST_Collect(geometry)),0.0001) as boundary 
2519              from place_addressline join placex using (place_id) 
2520              where address_place_id = search_place_id 
2521                and (isaddress = true OR place_id = search_place_id)
2522                and (st_length(geometry) < 0.01 or place_id = search_place_id)
2523              group by address_place_id limit 1;
2524       select * from place_boundingbox into result where place_id = search_place_id;
2525     END IF;
2526   END IF;
2527   return result;
2528 END;
2529 $$
2530 LANGUAGE plpgsql;
2531
2532 CREATE OR REPLACE FUNCTION update_place(search_place_id BIGINT) RETURNS BOOLEAN
2533   AS $$
2534 DECLARE
2535   result place_boundingbox;
2536   numfeatures integer;
2537 BEGIN
2538   update placex set 
2539       name = place.name,
2540       housenumber = place.housenumber,
2541       street = place.street,
2542       isin = place.isin,
2543       postcode = place.postcode,
2544       country_code = place.country_code,
2545       parent_place_id = null
2546       from place
2547       where placex.place_id = search_place_id 
2548         and place.osm_type = placex.osm_type and place.osm_id = placex.osm_id
2549         and place.class = placex.class and place.type = placex.type;
2550   update placex set indexed_status = 2 where place_id = search_place_id;
2551   update placex set indexed_status = 0 where place_id = search_place_id;
2552   return true;
2553 END;
2554 $$
2555 LANGUAGE plpgsql;
2556
2557 CREATE OR REPLACE FUNCTION get_searchrank_label(rank INTEGER) RETURNS TEXT
2558   AS $$
2559 DECLARE
2560 BEGIN
2561   IF rank < 2 THEN
2562     RETURN 'Continent';
2563   ELSEIF rank < 4 THEN
2564     RETURN 'Sea';
2565   ELSEIF rank < 8 THEN
2566     RETURN 'Country';
2567   ELSEIF rank < 12 THEN
2568     RETURN 'State';
2569   ELSEIF rank < 16 THEN
2570     RETURN 'County';
2571   ELSEIF rank = 16 THEN
2572     RETURN 'City';
2573   ELSEIF rank = 17 THEN
2574     RETURN 'Town / Island';
2575   ELSEIF rank = 18 THEN
2576     RETURN 'Village / Hamlet';
2577   ELSEIF rank = 20 THEN
2578     RETURN 'Suburb';
2579   ELSEIF rank = 21 THEN
2580     RETURN 'Postcode Area';
2581   ELSEIF rank = 22 THEN
2582     RETURN 'Croft / Farm / Locality / Islet';
2583   ELSEIF rank = 23 THEN
2584     RETURN 'Postcode Area';
2585   ELSEIF rank = 25 THEN
2586     RETURN 'Postcode Point';
2587   ELSEIF rank = 26 THEN
2588     RETURN 'Street / Major Landmark';
2589   ELSEIF rank = 27 THEN
2590     RETURN 'Minory Street / Path';
2591   ELSEIF rank = 28 THEN
2592     RETURN 'House / Building';
2593   ELSE
2594     RETURN 'Other: '||rank;
2595   END IF;
2596   
2597 END;
2598 $$
2599 LANGUAGE plpgsql;
2600
2601 CREATE OR REPLACE FUNCTION get_addressrank_label(rank INTEGER) RETURNS TEXT
2602   AS $$
2603 DECLARE
2604 BEGIN
2605   IF rank = 0 THEN
2606     RETURN 'None';
2607   ELSEIF rank < 2 THEN
2608     RETURN 'Continent';
2609   ELSEIF rank < 4 THEN
2610     RETURN 'Sea';
2611   ELSEIF rank = 5 THEN
2612     RETURN 'Postcode';
2613   ELSEIF rank < 8 THEN
2614     RETURN 'Country';
2615   ELSEIF rank < 12 THEN
2616     RETURN 'State';
2617   ELSEIF rank < 16 THEN
2618     RETURN 'County';
2619   ELSEIF rank = 16 THEN
2620     RETURN 'City';
2621   ELSEIF rank = 17 THEN
2622     RETURN 'Town / Village / Hamlet';
2623   ELSEIF rank = 20 THEN
2624     RETURN 'Suburb';
2625   ELSEIF rank = 21 THEN
2626     RETURN 'Postcode Area';
2627   ELSEIF rank = 22 THEN
2628     RETURN 'Croft / Farm / Locality / Islet';
2629   ELSEIF rank = 23 THEN
2630     RETURN 'Postcode Area';
2631   ELSEIF rank = 25 THEN
2632     RETURN 'Postcode Point';
2633   ELSEIF rank = 26 THEN
2634     RETURN 'Street / Major Landmark';
2635   ELSEIF rank = 27 THEN
2636     RETURN 'Minory Street / Path';
2637   ELSEIF rank = 28 THEN
2638     RETURN 'House / Building';
2639   ELSE
2640     RETURN 'Other: '||rank;
2641   END IF;
2642   
2643 END;
2644 $$
2645 LANGUAGE plpgsql;
2646
2647 CREATE OR REPLACE FUNCTION get_word_suggestion(srcword TEXT) RETURNS TEXT
2648   AS $$
2649 DECLARE
2650   trigramtoken TEXT;
2651   result TEXT;
2652 BEGIN
2653
2654   trigramtoken := regexp_replace(make_standard_name(srcword),E'([^0-9])\\1+',E'\\1','g');
2655   SELECT word FROM word WHERE word_trigram like ' %' and word_trigram % trigramtoken ORDER BY similarity(word_trigram, trigramtoken) DESC, word limit 1 into result;
2656
2657   return result;
2658 END;
2659 $$
2660 LANGUAGE plpgsql;
2661
2662 CREATE OR REPLACE FUNCTION get_word_suggestions(srcword TEXT) RETURNS TEXT[]
2663   AS $$
2664 DECLARE
2665   trigramtoken TEXT;
2666   result TEXT[];
2667   r RECORD;
2668 BEGIN
2669
2670   trigramtoken := regexp_replace(make_standard_name(srcword),E'([^0-9])\\1+',E'\\1','g');
2671
2672   FOR r IN SELECT word,similarity(word_trigram, trigramtoken) as score FROM word 
2673     WHERE word_trigram like ' %' and word_trigram % trigramtoken ORDER BY similarity(word_trigram, trigramtoken) DESC, word limit 4
2674   LOOP
2675     result[coalesce(array_upper(result,1)+1,1)] := r.word;
2676   END LOOP;
2677
2678   return result;
2679 END;
2680 $$
2681 LANGUAGE plpgsql;
2682
2683 CREATE OR REPLACE FUNCTION aux_create_property(pointgeo GEOMETRY, in_housenumber TEXT, 
2684   in_street TEXT, in_isin TEXT, in_postcode TEXT, in_countrycode char(2)) RETURNS INTEGER
2685   AS $$
2686 DECLARE
2687
2688   newpoints INTEGER;
2689   place_centroid GEOMETRY;
2690   out_partition INTEGER;
2691   out_parent_place_id BIGINT;
2692   location RECORD;
2693   address_street_word_id INTEGER;  
2694   out_postcode TEXT;
2695
2696 BEGIN
2697
2698   place_centroid := ST_Centroid(pointgeo);
2699   out_partition := get_partition(place_centroid, in_countrycode);
2700   out_parent_place_id := null;
2701
2702   address_street_word_id := get_name_id(make_standard_name(in_street));
2703   IF address_street_word_id IS NOT NULL THEN
2704     FOR location IN SELECT * from getNearestNamedRoadFeature(out_partition, place_centroid, address_street_word_id) LOOP
2705       out_parent_place_id := location.place_id;
2706     END LOOP;
2707   END IF;
2708
2709   IF out_parent_place_id IS NULL THEN
2710     FOR location IN SELECT place_id FROM getNearestRoadFeature(out_partition, place_centroid) LOOP
2711       out_parent_place_id := location.place_id;
2712     END LOOP;    
2713   END IF;
2714
2715   out_postcode := in_postcode;
2716   IF out_postcode IS NULL THEN
2717     SELECT postcode from placex where place_id = out_parent_place_id INTO out_postcode;
2718   END IF;
2719   IF out_postcode IS NULL THEN
2720     out_postcode := getNearestPostcode(out_partition, place_centroid);
2721   END IF;
2722
2723   newpoints := 0;
2724   insert into location_property_aux (place_id, partition, parent_place_id, housenumber, postcode, centroid)
2725     values (nextval('seq_place'), out_partition, out_parent_place_id, in_housenumber, out_postcode, place_centroid);
2726   newpoints := newpoints + 1;
2727
2728   RETURN newpoints;
2729 END;
2730 $$
2731 LANGUAGE plpgsql;
2732
2733 CREATE OR REPLACE FUNCTION get_osm_rel_members(members TEXT[], member TEXT) RETURNS TEXT[]
2734   AS $$
2735 DECLARE
2736   result TEXT[];
2737   i INTEGER;
2738 BEGIN
2739
2740   FOR i IN 1..ARRAY_UPPER(members,1) BY 2 LOOP
2741     IF members[i+1] = member THEN
2742       result := result || members[i];
2743     END IF;
2744   END LOOP;
2745
2746   return result;
2747 END;
2748 $$
2749 LANGUAGE plpgsql;
2750
2751 CREATE OR REPLACE FUNCTION get_osm_rel_members(members TEXT[], memberLabels TEXT[]) RETURNS SETOF TEXT
2752   AS $$
2753 DECLARE
2754   i INTEGER;
2755 BEGIN
2756
2757   FOR i IN 1..ARRAY_UPPER(members,1) BY 2 LOOP
2758     IF members[i+1] = ANY(memberLabels) THEN
2759       RETURN NEXT members[i];
2760     END IF;
2761   END LOOP;
2762
2763   RETURN;
2764 END;
2765 $$
2766 LANGUAGE plpgsql;
2767
2768 -- See: http://stackoverflow.com/questions/6410088/how-can-i-mimic-the-php-urldecode-function-in-postgresql
2769 CREATE OR REPLACE FUNCTION decode_url_part(p varchar) RETURNS varchar 
2770   AS $$
2771 SELECT convert_from(CAST(E'\\x' || array_to_string(ARRAY(
2772     SELECT CASE WHEN length(r.m[1]) = 1 THEN encode(convert_to(r.m[1], 'SQL_ASCII'), 'hex') ELSE substring(r.m[1] from 2 for 2) END
2773     FROM regexp_matches($1, '%[0-9a-f][0-9a-f]|.', 'gi') AS r(m)
2774 ), '') AS bytea), 'UTF8');
2775 $$ 
2776 LANGUAGE SQL IMMUTABLE STRICT;
2777
2778 CREATE OR REPLACE FUNCTION catch_decode_url_part(p varchar) RETURNS varchar
2779   AS $$
2780 DECLARE
2781 BEGIN
2782   RETURN decode_url_part(p);
2783 EXCEPTION
2784   WHEN others THEN return null;
2785 END;
2786 $$
2787 LANGUAGE plpgsql IMMUTABLE;
2788
2789 DROP TYPE wikipedia_article_match CASCADE;
2790 create type wikipedia_article_match as (
2791   language TEXT,
2792   title TEXT,
2793   importance FLOAT
2794 );
2795
2796 CREATE OR REPLACE FUNCTION get_wikipedia_match(extratags HSTORE, country_code varchar(2)) RETURNS wikipedia_article_match
2797   AS $$
2798 DECLARE
2799   langs TEXT[];
2800   i INT;
2801   wiki_article TEXT;
2802   wiki_article_title TEXT;
2803   wiki_article_language TEXT;
2804   result wikipedia_article_match;
2805 BEGIN
2806   langs := ARRAY['english','country','ar','bg','ca','cs','da','de','en','es','eo','eu','fa','fr','ko','hi','hr','id','it','he','lt','hu','ms','nl','ja','no','pl','pt','kk','ro','ru','sk','sl','sr','fi','sv','tr','uk','vi','vo','war','zh'];
2807   i := 1;
2808   WHILE langs[i] IS NOT NULL LOOP
2809     wiki_article := extratags->(case when langs[i] in ('english','country') THEN 'wikipedia' ELSE 'wikipedia:'||langs[i] END);
2810     IF wiki_article is not null THEN
2811       wiki_article := regexp_replace(wiki_article,E'^(.*?)([a-z]{2,3}).wikipedia.org/wiki/',E'\\2:');
2812       wiki_article := regexp_replace(wiki_article,E'^(.*?)([a-z]{2,3}).wikipedia.org/w/index.php\\?title=',E'\\2:');
2813       wiki_article := regexp_replace(wiki_article,E'^(.*?)/([a-z]{2,3})/wiki/',E'\\2:');
2814       wiki_article := regexp_replace(wiki_article,E'^(.*?)([a-z]{2,3})[=:]',E'\\2:');
2815       wiki_article := replace(wiki_article,' ','_');
2816       wiki_article_title := trim(split_part(wiki_article, ':', 2));
2817       IF wiki_article_title IS NULL OR wiki_article_title = '' THEN
2818         wiki_article_title := trim(wiki_article);
2819         wiki_article_language := CASE WHEN langs[i] = 'english' THEN 'en' WHEN langs[i] = 'country' THEN get_country_language_code(country_code) ELSE langs[i] END;
2820       ELSE
2821         wiki_article_language := lower(trim(split_part(wiki_article, ':', 1)));
2822       END IF;
2823
2824       select wikipedia_article.language,wikipedia_article.title,wikipedia_article.importance
2825         from wikipedia_article 
2826         where language = wiki_article_language and 
2827         (title = wiki_article_title OR title = catch_decode_url_part(wiki_article_title) OR title = replace(catch_decode_url_part(wiki_article_title),E'\\',''))
2828       UNION ALL
2829       select wikipedia_article.language,wikipedia_article.title,wikipedia_article.importance
2830         from wikipedia_redirect join wikipedia_article on (wikipedia_redirect.language = wikipedia_article.language and wikipedia_redirect.to_title = wikipedia_article.title)
2831         where wikipedia_redirect.language = wiki_article_language and 
2832         (from_title = wiki_article_title OR from_title = catch_decode_url_part(wiki_article_title) OR from_title = replace(catch_decode_url_part(wiki_article_title),E'\\',''))
2833       order by importance desc limit 1 INTO result;
2834
2835       IF result.language is not null THEN
2836         return result;
2837       END IF;
2838     END IF;
2839     i := i + 1;
2840   END LOOP;
2841   RETURN NULL;
2842 END;
2843 $$
2844 LANGUAGE plpgsql;
2845
2846 CREATE OR REPLACE FUNCTION quad_split_geometry(geometry GEOMETRY, maxarea FLOAT, maxdepth INTEGER) 
2847   RETURNS SETOF GEOMETRY
2848   AS $$
2849 DECLARE
2850   xmin FLOAT;
2851   ymin FLOAT;
2852   xmax FLOAT;
2853   ymax FLOAT;
2854   xmid FLOAT;
2855   ymid FLOAT;
2856   secgeo GEOMETRY;
2857   secbox GEOMETRY;
2858   seg INTEGER;
2859   geo RECORD;
2860   area FLOAT;
2861   remainingdepth INTEGER;
2862   added INTEGER;
2863   
2864 BEGIN
2865
2866 --  RAISE WARNING 'quad_split_geometry: maxarea=%, depth=%',maxarea,maxdepth;
2867
2868   IF (ST_GeometryType(geometry) not in ('ST_Polygon','ST_MultiPolygon') OR NOT ST_IsValid(geometry)) THEN
2869     RETURN NEXT geometry;
2870     RETURN;
2871   END IF;
2872
2873   remainingdepth := maxdepth - 1;
2874   area := ST_AREA(geometry);
2875   IF remainingdepth < 1 OR area < maxarea THEN
2876     RETURN NEXT geometry;
2877     RETURN;
2878   END IF;
2879
2880   xmin := st_xmin(geometry);
2881   xmax := st_xmax(geometry);
2882   ymin := st_ymin(geometry);
2883   ymax := st_ymax(geometry);
2884   secbox := ST_SetSRID(ST_MakeBox2D(ST_Point(ymin,xmin),ST_Point(ymax,xmax)),4326);
2885
2886   -- if the geometry completely covers the box don't bother to slice any more
2887   IF ST_AREA(secbox) = area THEN
2888     RETURN NEXT geometry;
2889     RETURN;
2890   END IF;
2891
2892   xmid := (xmin+xmax)/2;
2893   ymid := (ymin+ymax)/2;
2894
2895   added := 0;
2896   FOR seg IN 1..4 LOOP
2897
2898     IF seg = 1 THEN
2899       secbox := ST_SetSRID(ST_MakeBox2D(ST_Point(xmin,ymin),ST_Point(xmid,ymid)),4326);
2900     END IF;
2901     IF seg = 2 THEN
2902       secbox := ST_SetSRID(ST_MakeBox2D(ST_Point(xmin,ymid),ST_Point(xmid,ymax)),4326);
2903     END IF;
2904     IF seg = 3 THEN
2905       secbox := ST_SetSRID(ST_MakeBox2D(ST_Point(xmid,ymin),ST_Point(xmax,ymid)),4326);
2906     END IF;
2907     IF seg = 4 THEN
2908       secbox := ST_SetSRID(ST_MakeBox2D(ST_Point(xmid,ymid),ST_Point(xmax,ymax)),4326);
2909     END IF;
2910
2911     IF st_intersects(geometry, secbox) THEN
2912       secgeo := st_intersection(geometry, secbox);
2913       IF NOT ST_IsEmpty(secgeo) AND ST_GeometryType(secgeo) in ('ST_Polygon','ST_MultiPolygon') THEN
2914         FOR geo IN select quad_split_geometry(secgeo, maxarea, remainingdepth) as geom LOOP
2915           IF NOT ST_IsEmpty(geo.geom) AND ST_GeometryType(geo.geom) in ('ST_Polygon','ST_MultiPolygon') THEN
2916             added := added + 1;
2917             RETURN NEXT geo.geom;
2918           END IF;
2919         END LOOP;
2920       END IF;
2921     END IF;
2922   END LOOP;
2923
2924   RETURN;
2925 END;
2926 $$
2927 LANGUAGE plpgsql;
2928
2929 CREATE OR REPLACE FUNCTION split_geometry(geometry GEOMETRY) 
2930   RETURNS SETOF GEOMETRY
2931   AS $$
2932 DECLARE
2933   geo RECORD;
2934 BEGIN
2935   -- 10000000000 is ~~ 1x1 degree
2936   FOR geo IN select quad_split_geometry(geometry, 0.25, 20) as geom LOOP
2937     RETURN NEXT geo.geom;
2938   END LOOP;
2939   RETURN;
2940 END;
2941 $$
2942 LANGUAGE plpgsql;
2943
2944
2945 CREATE OR REPLACE FUNCTION place_force_delete(placeid BIGINT) RETURNS BOOLEAN
2946   AS $$
2947 DECLARE
2948     osmid BIGINT;
2949     osmtype character(1);
2950     pclass text;
2951     ptype text;
2952 BEGIN
2953   SELECT osm_type, osm_id, class, type FROM placex WHERE place_id = placeid INTO osmtype, osmid, pclass, ptype;
2954   DELETE FROM import_polygon_delete where osm_type = osmtype and osm_id = osmid and class = pclass and type = ptype;
2955   DELETE FROM import_polygon_error where osm_type = osmtype and osm_id = osmid and class = pclass and type = ptype;
2956   -- force delete from place/placex by making it a very small geometry
2957   UPDATE place set geometry = ST_SetSRID(ST_Point(0,0), 4326) where osm_type = osmtype and osm_id = osmid and class = pclass and type = ptype;
2958   DELETE FROM place where osm_type = osmtype and osm_id = osmid and class = pclass and type = ptype;
2959
2960   RETURN TRUE;
2961 END;
2962 $$
2963 LANGUAGE plpgsql;
2964
2965 CREATE OR REPLACE FUNCTION place_force_update(placeid BIGINT) RETURNS BOOLEAN
2966   AS $$
2967 DECLARE
2968   placegeom GEOMETRY;
2969   geom GEOMETRY;
2970   diameter FLOAT;
2971   rank INTEGER;
2972 BEGIN
2973   SELECT geometry, rank_search FROM placex WHERE place_id = placeid INTO placegeom, rank;
2974   IF placegeom IS NOT NULL AND ST_IsValid(placegeom) THEN
2975     IF ST_GeometryType(placegeom) in ('ST_Polygon','ST_MultiPolygon') THEN
2976       FOR geom IN select split_geometry(placegeom) FROM placex WHERE place_id = placeid LOOP
2977         update placex set indexed_status = 2 where (st_covers(geom, placex.geometry) OR ST_Intersects(geom, placex.geometry)) 
2978         AND rank_search > rank and indexed_status = 0 and ST_geometrytype(placex.geometry) = 'ST_Point' and (rank_search < 28 or name is not null);
2979         update placex set indexed_status = 2 where (st_covers(geom, placex.geometry) OR ST_Intersects(geom, placex.geometry)) 
2980         AND rank_search > rank and indexed_status = 0 and ST_geometrytype(placex.geometry) != 'ST_Point' and (rank_search < 28 or name is not null);
2981       END LOOP;
2982     ELSE
2983         diameter := 0;
2984         IF rank = 11 THEN
2985           diameter := 0.05;
2986         ELSEIF rank < 18 THEN
2987           diameter := 0.1;
2988         ELSEIF rank < 20 THEN
2989           diameter := 0.05;
2990         ELSEIF rank = 21 THEN
2991           diameter := 0.001;
2992         ELSEIF rank < 24 THEN
2993           diameter := 0.02;
2994         ELSEIF rank < 26 THEN
2995           diameter := 0.002; -- 100 to 200 meters
2996         ELSEIF rank < 28 THEN
2997           diameter := 0.001; -- 50 to 100 meters
2998         END IF;
2999         IF diameter > 0 THEN
3000           update placex set indexed_status = 2 where indexed_status = 0 and rank_search > rank and ST_DWithin(placex.geometry, placegeom, diameter) and (rank_search < 28 or name is not null);
3001         END IF;
3002     END IF;
3003     RETURN TRUE;
3004   END IF;
3005
3006   RETURN FALSE;
3007 END;
3008 $$
3009 LANGUAGE plpgsql;