]> git.openstreetmap.org Git - chef.git/blob - cookbooks/prometheus/recipes/default.rb
Reduce sensitivity of postgres idle transaction alert
[chef.git] / cookbooks / prometheus / recipes / default.rb
1 #
2 # Cookbook:: prometheus
3 # Recipe:: default
4 #
5 # Copyright:: 2020, OpenStreetMap Foundation
6 #
7 # Licensed under the Apache License, Version 2.0 (the "License");
8 # you may not use this file except in compliance with the License.
9 # You may obtain a copy of the License at
10 #
11 #     https://www.apache.org/licenses/LICENSE-2.0
12 #
13 # Unless required by applicable law or agreed to in writing, software
14 # distributed under the License is distributed on an "AS IS" BASIS,
15 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
16 # See the License for the specific language governing permissions and
17 # limitations under the License.
18 #
19
20 include_recipe "git"
21 include_recipe "networking"
22
23 package "ruby"
24
25 if node.internal_ipaddress
26   node.default[:prometheus][:mode] = "internal"
27   node.default[:prometheus][:address] = node.internal_ipaddress
28 elsif node[:networking][:wireguard][:enabled]
29   node.default[:prometheus][:mode] = "wireguard"
30   node.default[:prometheus][:address] = node[:networking][:wireguard][:address]
31
32   search(:node, "roles:prometheus") do |server|
33     node.default[:networking][:wireguard][:peers] << {
34       :public_key => server[:networking][:wireguard][:public_key],
35       :allowed_ips => server[:networking][:wireguard][:address],
36       :endpoint => "#{server.name}:51820"
37     }
38   end
39 else
40   node.default[:prometheus][:mode] = "external"
41   node.default[:prometheus][:address] = node.external_ipaddress(:family => :inet)
42 end
43
44 directory "/opt/prometheus" do
45   action :delete
46   recursive true
47 end
48
49 git "/opt/prometheus-exporters" do
50   action :sync
51   repository "https://github.com/openstreetmap/prometheus-exporters.git"
52   revision "main"
53   depth 1
54   user "root"
55   group "root"
56 end
57
58 directory "/etc/prometheus/collectors" do
59   owner "root"
60   group "root"
61   mode "755"
62   recursive true
63 end
64
65 directory "/etc/prometheus/exporters" do
66   owner "root"
67   group "root"
68   mode "755"
69   recursive true
70 end
71
72 directory "/var/lib/prometheus/node-exporter" do
73   owner "root"
74   group "adm"
75   mode "775"
76   recursive true
77 end
78
79 template "/var/lib/prometheus/node-exporter/chef.prom" do
80   source "chef.prom.erb"
81   owner "root"
82   group "root"
83   mode "644"
84 end
85
86 metric_relabel = []
87
88 node[:hardware][:hwmon].each do |chip, details|
89   next unless details[:ignore]
90
91   sensors = details[:ignore].join("|")
92
93   metric_relabel << {
94     :source_labels => "chip,sensor",
95     :regex => "#{chip};(#{sensors})",
96     :action => "drop"
97   }
98 end
99
100 prometheus_exporter "node" do
101   port 9100
102   user "root"
103   proc_subset "all"
104   protect_clock false
105   restrict_address_families %w[AF_UNIX AF_NETLINK]
106   system_call_filter ["@system-service", "@clock"]
107   options %w[
108     --collector.textfile.directory=/var/lib/prometheus/node-exporter
109     --collector.interrupts
110     --collector.ntp
111     --collector.processes
112     --collector.rapl.enable-zone-label
113     --collector.systemd
114     --collector.tcpstat
115   ]
116   metric_relabel metric_relabel
117 end
118
119 unless node[:prometheus][:snmp].empty?
120   prometheus_exporter "snmp" do
121     port 9116
122     options "--config.file=/opt/prometheus-exporters/exporters/snmp/snmp.yml"
123     register_target false
124   end
125 end
126
127 if node[:prometheus][:files].empty?
128   prometheus_exporter "filestat" do
129     action :delete
130   end
131
132   file "/etc/prometheus/filestat.yml" do
133     action :delete
134   end
135 else
136   template "/etc/prometheus/filestat.yml" do
137     source "filestat.yml.erb"
138     owner "root"
139     group "root"
140     mode "644"
141   end
142
143   prometheus_exporter "filestat" do
144     port 9943
145     options "--config.file=/etc/prometheus/filestat.yml"
146     subscribes :restart, "template[/etc/prometheus/filestat.yml]"
147   end
148 end