tsingke:
📖 介绍
Frostmourne
用于帮助监控几乎所有数据库数据(包括Elasticsearch
, Prometheus
, SkyWalking
, MySql
等等)。如果你已经建立起了日志系统,
指标体系,却苦恼于没有一个配套监控系统,也许它能帮到你。使用本系统得当,至少可以做到线上应用出了什么问题,相关开发能第一时间了解报错情况,知道问题出在哪里,
可以快速响应处理,几乎先于所有人知道线上的情况,也因为心中有数所以可以从容应对各种问询,一点都不慌,你们团队值得拥有。
项目地址
https://github.com/AutohomeCorp/frostmourne
项目初衷
在用ELK
建立起日志系统之后,我们发现应用日志监控这块除了ElastAlert
之外,没有其他方案。我们初期使用ElastAlert
来解决日志监控的问题,
但是随着配置的增加,不仅管理成本和使用成本较高,稳定性方面也不能让我们满意,所以为了更好的易用性,稳定性,我们决定自己做一套简单的监控系统,
来解决日志监控的问题。
项目并不局限于Elasticsearch
数据,还支持HTTP
, PING
, Telnet
监控,Prometheus
, SkyWalking
, InfluxDB
,MySQL
, ClickHouse
, IoTDB
, SqlServer
数据监控,
后面还会加入更多的常用数据源(如:Loki
, MongoDB
, Redis
, Oracle
等)纳入监控范畴.
✨ 主要功能
-
只需要写一条数据查询就可以轻松搞定监控
-
多种数据源支持:
Elasticsearch, HTTP, SkyWalking, Prometheus, InfluxDB, MySQL/TiDb, ClickHouse, SqlServer, PING, IotDB, Telnet
-
数值计算类型监控:
count, min, max, avg, sum, unique count, percentiles, standard deviation
;Elasticsearch
数据支持分桶 -
多种报警消息发送方式:钉钉(机器人)、企业微信(机器人)、飞书机器人、Email 、短信、HTTP
-
多种消息格式:
text, markdown
-
灵活的报警消息
Freemarker
模板定制,支持变量占位符;消息模板管理 -
分布式调度实现,每个监控都是独立调度,互不影响
-
报警消息附带日志查询短链接,直达报警原因
-
数值同比,环比监控
-
HTTP
数据监控,Javascript
表达式判断是否报警;PING
连通监控,Telnet
端口连通监控 -
前端简单易用:监控管理、测试、另存、执行日志和历史消息
-
Elasticsearch
数据查询、分享和下载 -
报警消息抑制功能,防止消息轰炸;也有报警升级功能,避免故障相关方长时间得不到通知。
-
自带账号,团队,部门信息管理模块,也可自己实现内部对接
-
集成
LDAP
登录认证 -
权限控制,数据隔离,各团队互不影响
企业微信机器人报警截图展示: (查看完整功能截图展示)
from V2EX-最新主题 https://ift.tt/vxlN9Bo
福利APP推荐:https://niucnet.notion.site
广告投放:https://t.me/cnxalex
牛C网:https://j1o.net
牛C网导航:https://niuc3.com
福利APP合集:https://j1o.net/share/1678.html
- 本文固定链接: https://niul.net/477995.html
- 转载请注明: 分享菌 于 牛C网(NiuL.Net) 发表