]> git.openstreetmap.org Git - nominatim.git/blob - wikidata/import.sh
replace slow strptime with regex, fix typos
[nominatim.git] / wikidata / import.sh
1 PSQL=/usr/lib/postgresql/9.2/bin/psql -d wikidata
2
3 cat create.sql | $PSQL
4
5 cat entity.csv | $PSQL -c "COPY entity from STDIN WITH CSV"
6 cat entity_label.csv | $PSQL -c "COPY entity_label from STDIN WITH CSV"
7 cat entity_description.csv | $PSQL -c "COPY entity_description from STDIN WITH CSV"
8 cat entity_alias.csv | $PSQL -c "COPY entity_alias from STDIN WITH CSV"
9 cat entity_link.csv | $PSQL -c "COPY entity_link from STDIN WITH CSV"
10 cat entity_property.csv | $PSQL -c "COPY entity_property from STDIN WITH CSV"
11
12 $PSQL -c "create index idx_entity_link_target on entity_link using btree (target,value)"
13 $PSQL -c "create index idx_entity_qid on entity using btree (qid)"
14 $PSQL -c "create table property_label_en as select pid,null::text as label from entity where pid is not null"
15 $PSQL -c "update property_label_en set label = x.label from (select pid,label,language from entity join entity_label using (entity_id) where pid is not null and language = 'en') as x where x.pid = property_label_en.pid"
16 $PSQL -c "create unique index idx_property_label_en on property_label_en using btree (pid)"
17 $PSQL -c "alter table entity add column label_en text"
18 $PSQL -c "update entity set label_en = label from entity_label where entity.entity_id = entity_label.entity_id and language = 'en'"
19 $PSQL -c "alter table entity add column description_en text"
20 $PSQL -c "update entity set description_en = description from entity_description where entity.entity_id = entity_description.entity_id and language = 'en'"
21
22 cat totals.txt | $PSQL -c "COPY import_link_hit from STDIN WITH CSV DELIMITER ' '"
23 $PSQL -c "truncate link_hit"
24 $PSQL -c "insert into link_hit select target||'wiki', replace(catch_decode_url_part(value), '_', ' '), sum(hits) from import_link_hit where replace(catch_decode_url_part(value), '_', ' ') is not null group by target||'wiki', replace(dcatch_decode_url_part(value), '_', ' ')"
25 $PSQL -c "truncate entity_link_hit"
26 $PSQL -c "insert into entity_link_hit select entity_id, target, value, coalesce(hits,0) from entity_link left outer join link_hit using (target, value)"
27 $PSQL -c "create table entity_hit as select entity_id,sum(hits) as hits from entity_link_hit group by entity_id"
28 $PSQL -c "create unique index idx_entity_hit on entity_hit using btree (entity_id)"