]> git.openstreetmap.org Git - nominatim.git/blob - test/bdd/steps/http_responses.py
bdd: more format checks for reverse XML
[nominatim.git] / test / bdd / steps / http_responses.py
1 # SPDX-License-Identifier: GPL-2.0-only
2 #
3 # This file is part of Nominatim. (https://nominatim.org)
4 #
5 # Copyright (C) 2023 by the Nominatim developer community.
6 # For a full list of authors see the git log.
7 """
8 Classes wrapping HTTP responses from the Nominatim API.
9 """
10 import re
11 import json
12 import xml.etree.ElementTree as ET
13
14 from check_functions import Almost, OsmType, Field, check_for_attributes
15
16
17 class GenericResponse:
18     """ Common base class for all API responses.
19     """
20     def __init__(self, page, fmt, errorcode=200):
21         fmt = fmt.strip()
22         if fmt == 'jsonv2':
23             fmt = 'json'
24
25         self.page = page
26         self.format = fmt
27         self.errorcode = errorcode
28         self.result = []
29         self.header = dict()
30
31         if errorcode == 200 and fmt != 'debug':
32             getattr(self, '_parse_' + fmt)()
33
34     def _parse_json(self):
35         m = re.fullmatch(r'([\w$][^(]*)\((.*)\)', self.page)
36         if m is None:
37             code = self.page
38         else:
39             code = m.group(2)
40             self.header['json_func'] = m.group(1)
41         self.result = json.JSONDecoder().decode(code)
42         if isinstance(self.result, dict):
43             if 'error' in self.result:
44                 self.result = []
45             else:
46                 self.result = [self.result]
47
48
49     def _parse_geojson(self):
50         self._parse_json()
51         if self.result:
52             geojson = self.result[0]
53             # check for valid geojson
54             check_for_attributes(geojson, 'type,features')
55             assert geojson['type'] == 'FeatureCollection'
56             assert isinstance(geojson['features'], list)
57
58             self.result = []
59             for result in geojson['features']:
60                 check_for_attributes(result, 'type,properties,geometry')
61                 assert result['type'] == 'Feature'
62                 new = result['properties']
63                 check_for_attributes(new, 'geojson', 'absent')
64                 new['geojson'] = result['geometry']
65                 if 'bbox' in result:
66                     check_for_attributes(new, 'boundingbox', 'absent')
67                     # bbox is  minlon, minlat, maxlon, maxlat
68                     # boundingbox is minlat, maxlat, minlon, maxlon
69                     new['boundingbox'] = [result['bbox'][1],
70                                           result['bbox'][3],
71                                           result['bbox'][0],
72                                           result['bbox'][2]]
73                 for k, v in geojson.items():
74                     if k not in ('type', 'features'):
75                         check_for_attributes(new, '__' + k, 'absent')
76                         new['__' + k] = v
77                 self.result.append(new)
78
79
80     def _parse_geocodejson(self):
81         self._parse_geojson()
82         if self.result:
83             for r in self.result:
84                 assert set(r.keys()) == {'geocoding', 'geojson', '__geocoding'}, \
85                        f"Unexpected keys in result: {r.keys()}"
86                 check_for_attributes(r['geocoding'], 'geojson', 'absent')
87                 r |= r.pop('geocoding')
88
89
90     def assert_address_field(self, idx, field, value):
91         """ Check that result rows`idx` has a field `field` with value `value`
92             in its address. If idx is None, then all results are checked.
93         """
94         if idx is None:
95             todo = range(len(self.result))
96         else:
97             todo = [int(idx)]
98
99         for idx in todo:
100             self.check_row(idx, 'address' in self.result[idx], "No field 'address'")
101
102             address = self.result[idx]['address']
103             self.check_row_field(idx, field, value, base=address)
104
105
106     def match_row(self, row, context=None, field=None):
107         """ Match the result fields against the given behave table row.
108         """
109         if 'ID' in row.headings:
110             todo = [int(row['ID'])]
111         else:
112             todo = range(len(self.result))
113
114         for i in todo:
115             subdict = self.result[i]
116             if field is not None:
117                 for key in field.split('.'):
118                     self.check_row(i, key in subdict, f"Missing subfield {key}")
119                     subdict = subdict[key]
120                     self.check_row(i, isinstance(subdict, dict),
121                                    f"Subfield {key} not a dict")
122
123             for name, value in zip(row.headings, row.cells):
124                 if name == 'ID':
125                     pass
126                 elif name == 'osm':
127                     self.check_row_field(i, 'osm_type', OsmType(value[0]), base=subdict)
128                     self.check_row_field(i, 'osm_id', Field(value[1:]), base=subdict)
129                 elif name == 'centroid':
130                     if ' ' in value:
131                         lon, lat = value.split(' ')
132                     elif context is not None:
133                         lon, lat = context.osm.grid_node(int(value))
134                     else:
135                         raise RuntimeError("Context needed when using grid coordinates")
136                     self.check_row_field(i, 'lat', Field(float(lat)), base=subdict)
137                     self.check_row_field(i, 'lon', Field(float(lon)), base=subdict)
138                 else:
139                     self.check_row_field(i, name, Field(value), base=subdict)
140
141
142     def check_row(self, idx, check, msg):
143         """ Assert for the condition 'check' and print 'msg' on fail together
144             with the contents of the failing result.
145         """
146         class _RowError:
147             def __init__(self, row):
148                 self.row = row
149
150             def __str__(self):
151                 return f"{msg}. Full row {idx}:\n" \
152                        + json.dumps(self.row, indent=4, ensure_ascii=False)
153
154         assert check, _RowError(self.result[idx])
155
156
157     def check_row_field(self, idx, field, expected, base=None):
158         """ Check field 'field' of result 'idx' for the expected value
159             and print a meaningful error if the condition fails.
160             When 'base' is set to a dictionary, then the field is checked
161             in that base. The error message will still report the contents
162             of the full result.
163         """
164         if base is None:
165             base = self.result[idx]
166
167         self.check_row(idx, field in base, f"No field '{field}'")
168         value = base[field]
169
170         self.check_row(idx, expected == value,
171                        f"\nBad value for field '{field}'. Expected: {expected}, got: {value}")
172
173
174
175 class SearchResponse(GenericResponse):
176     """ Specialised class for search and lookup responses.
177         Transforms the xml response in a format similar to json.
178     """
179
180     def _parse_xml(self):
181         xml_tree = ET.fromstring(self.page)
182
183         self.header = dict(xml_tree.attrib)
184
185         for child in xml_tree:
186             assert child.tag == "place"
187             self.result.append(dict(child.attrib))
188
189             address = {}
190             for sub in child:
191                 if sub.tag == 'extratags':
192                     self.result[-1]['extratags'] = {}
193                     for tag in sub:
194                         self.result[-1]['extratags'][tag.attrib['key']] = tag.attrib['value']
195                 elif sub.tag == 'namedetails':
196                     self.result[-1]['namedetails'] = {}
197                     for tag in sub:
198                         self.result[-1]['namedetails'][tag.attrib['desc']] = tag.text
199                 elif sub.tag == 'geokml':
200                     self.result[-1][sub.tag] = True
201                 else:
202                     address[sub.tag] = sub.text
203
204             if address:
205                 self.result[-1]['address'] = address
206
207
208 class ReverseResponse(GenericResponse):
209     """ Specialised class for reverse responses.
210         Transforms the xml response in a format similar to json.
211     """
212
213     def _parse_xml(self):
214         xml_tree = ET.fromstring(self.page)
215
216         self.header = dict(xml_tree.attrib)
217         self.result = []
218
219         for child in xml_tree:
220             if child.tag == 'result':
221                 assert not self.result, "More than one result in reverse result"
222                 self.result.append(dict(child.attrib))
223                 check_for_attributes(self.result[0], 'display_name', 'absent')
224                 self.result[0]['display_name'] = child.text
225             elif child.tag == 'addressparts':
226                 assert 'address' not in self.result[0], "More than one address in result"
227                 address = {}
228                 for sub in child:
229                     assert len(sub) == 0, f"Address element '{sub.tag}' has subelements"
230                     address[sub.tag] = sub.text
231                 self.result[0]['address'] = address
232             elif child.tag == 'extratags':
233                 assert 'extratags' not in self.result[0], "More than one extratags in result"
234                 self.result[0]['extratags'] = {}
235                 for tag in child:
236                     assert len(tag) == 0, f"Extratags element '{tag.attrib['key']}' has subelements"
237                     self.result[0]['extratags'][tag.attrib['key']] = tag.attrib['value']
238             elif child.tag == 'namedetails':
239                 assert 'namedetails' not in self.result[0], "More than one namedetails in result"
240                 self.result[0]['namedetails'] = {}
241                 for tag in child:
242                     assert len(tag) == 0, f"Namedetails element '{tag.attrib['desc']}' has subelements"
243                     self.result[0]['namedetails'][tag.attrib['desc']] = tag.text
244             elif child.tag == 'geokml':
245                 assert 'geokml' not in self.result[0], "More than one geokml in result"
246                 self.result[0]['geokml'] = ET.tostring(child, encoding='unicode')
247             else:
248                 assert child.tag == 'error', \
249                        f"Unknown XML tag {child.tag} on page: {self.page}"
250
251
252 class StatusResponse(GenericResponse):
253     """ Specialised class for status responses.
254         Can also parse text responses.
255     """
256
257     def _parse_text(self):
258         pass