通过Alertmanager集成钉钉插件实现Linux磁盘空间告警
阅读须知: 在开始阅读本文档之前,请确保您已经拥有一个基础的 Prometheus 监控环境。具体来说,您需要已经完成了 Prometheus 服务器的安装,并且在您的目标服务器上部署了 Node Exporter,Prometheus 能够正常拉取到监控数据。本文将跳过 Prometheus 和
如何用Jenkins和Docker,提升发布效率
第一部分:我们曾经的发布方式 在我工作生涯中,我发现很多团队都经历过这样令人头疼的发布场景: 代码靠传来传去:开发在自己电脑上打包好程序,通过QQ或U盘发给我。 环境不一致的情况:经常出现“在我电脑上明明是好的,怎么一到服务器上就跑不起来了?”的问题。 手动操作,又慢又险:我需要登录一台台服务器,手
我的Halo博客演进史
今天想分享一下我的个人博客 kidd.weixiang.info 的搭建和演进历程。这不仅仅是一个技术分享,更像是一段长达三年的折腾记录,见证了我的博客从一个需要手动维护的“手工作坊”,一步步进化到如今使用 Docker Compose 实现一键部署、稳定运行的现代化应用。 楔子:梦开始的地方 (大
CI/CD实战-打造自动化运维流水线
摘要 在现代软件开发中,持续集成(CI)和持续部署(CD)是提升开发效率、保证软件质量、实现快速交付的核心实践。本文将通过一个完整的实战案例,手把手带你搭建一套基于 Jenkins、GitLab、Kubernetes、Harbor 和钉钉的自动化CI/CD流水线,涵盖从代码提交、镜像构建、推送到应用
在Kubernetes上优雅部署若依(RuoYi)系统
在当今的云原生生态中,将应用迁移至 Kubernetes 已不再是选择题,而是提升系统弹性、可伸缩性和运维效率的必经之路。然而,将一个包含数据库、缓存、后端服务和前端界面的全栈应用,遵循最佳实践部署到 K8s 集群,对许多开发者而言仍是一项挑战。 本篇教程旨在提供一个详尽且可复现的蓝图,我们将以现代
Prometheus+Grafana搭建强大的Linux主机监控系统
在当今的云原生和微服务时代,一套强大、可靠的监控系统是保障服务稳定性的基石。Prometheus,作为 CNCF 的第二个毕业项目,凭借其强大的数据模型、对容器和微服务的原生支持,已成为监控领域的首选方案。搭配其黄金搭档 Grafana,我们可以将枯燥的性能指标转化为直观、精美的可视化图表。 将涵盖
我的ESXi 8.0安装笔记
对于一个运维工程师来说,光会看文档是不够的,动手能力是硬道理。虚拟化技术,尤其是VMware的ESXi,是很多公司都在用的基础架构。要想玩得转,就得自己先搭一个。 所以,这篇博客就从头到尾,记录了我安装最新版ESXi 8.0的每一步。这既是我自己的学习笔记,也希望能帮到有同样需求的。废话不多说,下面
基于 Docker 部署 Elasticsearch 8.x 集群与 Kibana 实践记录
今天,我将记录一次完整的基于 Docker 部署 Elasticsearch 8.x 的过程。从单点部署开始,逐步扩展到三节点的集群,并最终部署 Kibana 作为可视化管理工具。Elasticsearch 8 版本在安全性和集群搭建方面做了很多优化,整个过程比旧版本要方便得多,特别是其基于令牌的注
一次成功的MicroStack单节点OpenStack部署笔记
前言 最近一直在折腾云计算相关的技术,总想着自己亲手搭一个 OpenStack 环境来学习和测试。但说实话,一想到它那出了名的复杂部署流程,就有点望而却步。传统的 DevStack 脚本虽然方便,但坑也不少;从源码手动部署,那更是重量级的挑战。 我的需求其实很简单:一个资源占用不高(手头只有一台 8
Velero对K8s集群的备份与恢复实践
最近在生产环境折腾 K8s,心里总有点不踏实。万一哪天手一滑,kubectl delete ns 敲错了命名空间,那场面简直不敢想。常在河边走,哪有不湿鞋,是时候给我的集群搭建一套靠谱的灾备方案了。 经过一番调研,我把目标锁定在了 Velero 这个项目上。它是目前社区里最主流的 K8s 备份恢复工
MySQL主从复制详解
前言 在现代数据库架构中,高可用性、负载均衡和数据备份是至关重要的考量因素。MySQL 的主从复制(Replication)机制正是解决这些问题的核心技术之一。通过主从复制,我们可以将主数据库(Master)的数据变更实时同步到一个或多个从数据库(Slave),从而实现读写分离以提升性能,或者作为热
记录在Oracle生产中归档爆满的事故
标签: Oracle, 数据库, 生产事故, DBA, 故障排查, 性能优化, 运维 前言 每个DBA的职业生涯中,总有那么几个不眠之夜,让你心跳加速,让你在海量日志和监控数据中奋力寻找那一线生机。今天,我想分享一次我亲身经历的、堪称教科书级别的Oracle生产事故。它从一个最常见的“CPU使用率1