]> git.openstreetmap.org Git - nominatim.git/blobdiff - lib-php/tokenizer/icu_tokenizer.php
add consistent SPDX copyright headers
[nominatim.git] / lib-php / tokenizer / icu_tokenizer.php
index ca224a224861f5bd2e0f126cf10be5ea0edf5488..cbbf240a27a2c4f95fd1180bb0842dd28c613ee2 100644 (file)
@@ -1,4 +1,12 @@
 <?php
+/**
+ * SPDX-License-Identifier: GPL-2.0-only
+ *
+ * This file is part of Nominatim. (https://nominatim.org)
+ *
+ * Copyright (C) 2022 by the Nominatim developer community.
+ * For a full list of authors see the git log.
+ */
 
 namespace Nominatim;
 
@@ -40,6 +48,15 @@ class Tokenizer
         return $this->oNormalizer->transliterate($sTerm);
     }
 
+
+    public function mostFrequentWords($iNum)
+    {
+        $sSQL = "SELECT word FROM word WHERE type = 'W'";
+        $sSQL .= "ORDER BY info->'count' DESC LIMIT ".$iNum;
+        return $this->oDB->getCol($sSQL);
+    }
+
+
     private function makeStandardWord($sTerm)
     {
         return trim($this->oTransliterator->transliterate(' '.$sTerm.' '));