银行大数据监控容器云大数据容器化

大数据作业容器化部署后日志收集、监控告警、异常诊断如何有效处理？

参与9

4同行回答
全部行业
全部行业 互联网服务 银行
|
按赞同排序
按时间排序

强哥之神架构师&技术经理上汽集团云计算中心

在大数据作业容器化部署后，日志收集、监控告警和异常诊断是保障系统稳定性和运行效率的关键环节。

1、确保大数据作业容器中的日志输出符合统一的格式和标准，使用日志聚合工具（比如Fluentd、Filebeat）收集大数据作业容器的日志，并发送到公司的统一日志平台进行存储和分析。
2、使用监控工具（比如主流的Prometheus、Grafana）监控大数据作业容器的关键性能指标，如CPU利用率、内存使用量、网络流量等。
3、利用统一日志平台系统进行日志分析，快速定位和排查异常情况等。还可以通过事件追溯工具（如Jaeger、Zipkin）追踪作业的调用链路，查找异常发生的根源和影响范围。

互联网服务 · 2天前

浏览19

课题专家组

软件架构设计师民生银行

大数据作业容器化部署后日志收集、监控告警、异常诊断如何有效处理,我可以分享一些我这边的经验给你参考：如果是serverless yarn方式，还是通过yarn UI查看作业日志。监控建议通过prometheus exportor对接k8s集群内的prometheus，实现监控数据的同一采集。异常诊断需要首先通过作业日志定位作业失败的原因，如果涉及平台管理组件（比如RM或者NM），需要查看RM或者NM Pod的日志。这些是一些日常的经验总结，希望能对你有带来一定的帮助和参考。

银行 · 2024-05-08

浏览97

匿名用户

可以参考文章：https://www.talkwithtrend.com/Article/270043

互联网服务 · 2024-05-07

浏览102

zhyu314系统运维工程师运营商

日志收集：

使用日志代理（如Fluentd、Filebeat等）将容器内部产生的日志收集到集中的日志存储中（如ELK Stack、Splunk等）。
在容器的Dockerfile中配置日志输出路径，确保日志可以被日志代理正确收集。
使用日志标准化工具确保日志格式统一，便于后续分析和查询。

监控告警：

集成监控工具（如Prometheus、Grafana等）对容器化部署的大数据作业进行监控。
配置监控指标并设置阈值，通过监控工具实时监控作业的运行状态和性能指标。
设定告警规则并配置通知方式（邮件、短信、Slack等），及时通知相关人员进行处理。

异常诊断：

使用日志分析工具（如ELK Stack、Splunk等）对收集的日志进行分析，快速定位异常。
当监控工具发出告警时，通过日志分析工具查看详细日志，帮助定位问题根本原因。
在容器中集成应用性能管理（APM）工具，实时监控应用程序的性能指标，帮助诊断问题。

仅供参考

浏览111

ChatGPT 回答

针对大数据作业容器化部署后日志收集、监控告警、异常诊断的有效处理，可以采取以下措施：

日志收集：在容器中安装日志收集器，如Fluentd、Logstash等，将容器中的日志收集到中央日志服务器上，以便后续分析和处理。
监控告警：在容器中安装监控代理，如Prometheus、Zabbix等，对容器中的各项指标进行监控，当指标异常时，及时发出告警通知，以便及时处理。
异常诊断：在容器中安装异常诊断工具，如ELK、Zipkin等，对容器中的异常进行诊断和分析，以便快速定位和解决问题。
容器云：采用容器云平台，如Kubernetes、Docker Swarm等，对容器进行管理和调度，提高容器的可靠性和可用性，减少故障发生的可能性。

综上所述，通过以上措施，可以有效处理大数据作业容器化部署后日志收集、监控告警、异常诊断等问题，提高系统的稳定性和可靠性。

提问者

系统运维工程师某银行

擅长领域：服务器，存储，数据库

评论352

问题来自

活动 - 金融行业如何选型大数据平台容器化技术路线落地大数据混部线上探讨

相关问题

如何监控和分析HPC平台的资源利用状况,评估工作负载与硬件之间的匹配情况?

大数据容器化性能如何保障？

银行业信创云平台是否可配套提供容器服务能力，是否同时兼容海光、鲲鹏、Intel三种芯片，是否提供维护？

麒麟系统Kylin V10 SP系列内核对主流容器云平台兼容适配如何？

金融行业容器数据库对比传统数据库的主要变化在哪里？或者是架构上哪一层发生了变化？

相关资料

东软医院私有云数据中心设计方案

2021 容器云职业技能大赛团队赛亚军作品——金融行业容器平台建设方案

2021 容器云职业技能大赛团队赛冠军作品——适用于大中型银行的云原生技术体系建设方案

2021 容器云职业技能大赛团队赛优秀作品——银行全场景容器云平台建设方案

监控指标清单(操作系统、私有云、达梦数据库、mysql、nginx、tomcat）

相关文章

容器云安全现状分析和发展趋势

某银行基于容器云的应用服务架构实践

容器云多集群环境下如何实践 DevOps

迈入ChatGPT时代商业银行AI应用的发展趋势分析

容器云平台的安全隔离

问题状态

发布时间：2024-05-06

关注会员：5 人

问题浏览：941

最近回答：2天前

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广