・1日のうち,どこかのタイミングでバッチ処理が走る・バッチ処理が走っている間はCPUのiowaitがほぼ100%に張り付く・これは障害ではないので,アラートは投げたくない・バッチ処理に起因するCPU100%以外は障害なのでアラートを投げたい
これの解決策が思いつかない
・1日のうち,どこかのタイミングでバッチ処理が走る・バッチ処理が走っている間はCPUのiowaitがほぼ100%に張り付く・これは障害ではないので,アラートは投げたくない・バッチ処理に起因するCPU100%以外は障害なのでアラートを投げたい
これの解決策が思いつかない
あ,Prometheus使ってます
@sublimer バッチ処理のCPU使用率を下げるのがいいのではないかなと思いました!環境はGNU/Linuxですよね?Linuxのcgroupsって機能を使えば、CPU使用率などを制限できるようです。(使ったことはありません・・・)
@Rinwasyu 前にcpulimitってやつ使ってみたけど下がらなかったんですよね…たぶん,iowaitは制限してくれないっぽいiowait下げるにはディスクアクセスの頻度を下げればいいんだろうけど,OS側でコントロールできるのかな…
@sublimer なるほど・・・難しそう、
@Rinwasyu ストレージがHDDなので,どう頑張ってもiowait減らすのは厳しそう…とはいえ,CPU使用率に制限かければ,それに引きずられてディスクアクセスも減るってのは期待できるかもですね
@sublimer cgroupsはディスクI/Oスループットも制限できるっぽいですね(それでiowaitが減るのかな?・・・ぼくはLinuxよくわかってません)
@Rinwasyu 恐らくプロセス単位での制限だと思うので,スループット絞れば全体としてのiowaitは下がりそうですね(私もLinux何も分からん…)
senooken JP Social is a social network, courtesy of senooken. It runs on GNU social, version 2.0.2-beta0, available under the GNU Affero General Public License.
All senooken JP Social content and data are available under the Creative Commons Attribution 3.0 license.