SRE运维进阶之路

腾讯云

开发者社区

文档建议反馈控制台

首页TVP

LV1

发表了文章 8天前2024-05-01 07:41:47

CoreDNS 概述及运维实践

域名系统（英语：Domain Name System，缩写：DNS）是互联网的一项服务。它作为将域名和IP地址相互映射的一个分布式数据库，能够使人更方便地访问互...

SRE运维进阶之路 8天前2024-05-01 07:41:47

集群、实践、域名、运维、服务

发表了文章 16天前2024-04-23 15:17:46

Etcd 概述

Etcd 是 CoreOS 团队于2013年6月发起的开源项目，它的目标是构建一个高可用的分布式键值(key-value)数据库。etcd内部采用raft协议作...

SRE运维进阶之路 16天前2024-04-23 15:17:46

数据、算法、存储、etcd、集群

发表了文章 16天前2024-04-23 15:17:33

评估 Etcd 性能及可靠性

SLI（Service Level Indicator）：服务等级指标，其实就是我们选择哪些指标来衡量我们的稳定性。

SRE运维进阶之路 16天前2024-04-23 15:17:34

集群、网络、性能、etcd、测试

发表了文章 16天前2024-04-23 15:17:07

弹性伸缩落地实践

HPA（Horizontal Pod Autoscaler）是 Kubernetes 中的一种资源自动伸缩机制，用于根据某些指标动态调整 Pod 的副本数量。

SRE运维进阶之路 16天前2024-04-23 15:17:07

容器、弹性伸缩、集群、实践、数据

发表了文章 16天前2024-04-23 15:15:34

云原生实践总结

CLOUD NATIVE LANDSCAPE https://cncf.landscape2.io/?group=projects-and-products

SRE运维进阶之路 16天前2024-04-23 15:15:34

集群、实践、性能、云原生、容器

发表了文章 16天前2024-04-23 15:14:27

K8s 一条默认参数引起的性能问题

系统资源的瓶颈，可以通过 USE 法，即使用率、饱和度以及错误数这三类指标来衡量。系统的资源，可以分为硬件资源和软件资源两类。

SRE运维进阶之路 16天前2024-04-23 15:14:27

进程、系统、性能、容器、测试

发表了文章 16天前2024-04-23 15:12:16

SRE 学习路线

SRE（Site Reliability Engineering）站点可靠性工程是一种结合软件工程和运维运营原则的角色和方法论，旨在在系统、服务或产品的设计、开...

SRE运维进阶之路 16天前2024-04-23 15:12:17

工作、监控、系统、性能、服务

发表了文章 16天前2024-04-23 15:00:28

什么？相同型号物理机容器性能不如虚拟机？

[xx:xx] 扩容，扩容发布均有失败，但是虚拟机成功率高，容器 fullGC 时间长，请求堆积，异常

SRE运维进阶之路 16天前2024-04-23 15:00:28

虚拟机、容器、流量、内存、性能

发表了文章 16天前2024-04-23 14:59:09

Linux 性能基准测试工具及测试方法

上篇文章「什么？相同型号物理机容器性能不如虚拟机？」，给我们的经验教训，就是上线前，基准测试的重要性，这篇文章着重介绍一下「Linux 性能基准测试工具及...

SRE运维进阶之路 16天前2024-04-23 14:59:10

linux、测试、测试工具、磁盘、性能

发表了文章 16天前2024-04-23 14:57:22

Kubernetes Controller 机制详解

Kubernetes API List/Watch 机制与 Informer 客户端库

SRE运维进阶之路 16天前2024-04-23 14:57:22

controller、队列、对象、kubernetes、缓存

发表了文章 16天前2024-04-23 14:56:34

我们的虚拟化变革之旅

我们最初采用oVirt作为我们的虚拟化平台，事实证明它是一个很好的产品，具有几个显着的优势。其开源性质使我们能够利用广泛的功能和定制选项。

SRE运维进阶之路 16天前2024-04-23 14:56:34

解决方案、虚拟机、虚拟化、管理、集群

发表了文章 16天前2024-04-23 14:55:42

kube on kube 实现思路分享

这里的 kube on kube ，是指建立 K8s 元集群，纳管其他业务 K8s 集群，通过声明式 API 管理集群的创建、增删节点等。

SRE运维进阶之路 16天前2024-04-23 14:55:42

集群、镜像、配置、部署、对象

发表了文章 16天前2024-04-23 14:45:52

巧用 shell-operator 配置 K8s Pod 保护策略

本篇主要介绍第四点：巧用 Shell-operator 配置 K8s Pod 保护策略

SRE运维进阶之路 16天前2024-04-23 14:45:52

事件、shell、对象、脚本、配置

关注了用户 16天前2024-04-23 14:33:52

腾讯云自媒体分享计划
腾讯 · 产品运营 (已认证)

申请条件：至少有 10 篇或以上符合投稿要求可迁入腾讯云专栏的原创技术文章。

3 文章0 回答5.8K 关注者

发表了文章 2023-12-042023-12-04 20:56:02

云原生落地实践

d. 风险控制：测试没问题，再上线，环境依次是，work --> test --> ut --> prod 灰度 --> prod 全量；做好回滚虚拟机的应急方...

SRE运维进阶之路 2023-12-042023-12-04 20:56:02

云原生

发表了文章 2023-11-212023-11-21 20:52:24

容器化后无损上下线解决方案

绝大数事故发生在应用上下线发布阶段，所以要尽可能避免发布过程中由于应用自身代码问题对用户造成的影响。

SRE运维进阶之路 2023-11-212023-11-21 20:52:24

云原生、最佳实践

发表了文章 2023-11-212023-11-21 20:49:29

弹性伸缩落地实践

HPA（Horizontal Pod Autoscaler）是 Kubernetes 中的一种资源自动伸缩机制，用于根据某些指标动态调整 Pod 的副本数量。

SRE运维进阶之路 2023-11-212023-11-21 20:49:28

最佳实践、弹性伸缩、云原生

发表了文章 2023-06-232023-06-23 14:43:23

Etcd 故障排查

SRE运维进阶之路 2023-06-232023-06-23 14:43:23

etcd

发表了文章 2023-06-212023-06-21 20:57:30

Etcd 监控

Grafana 大盘： https://github.com/clay-wangzhi/grafana-dashboard/blob/master/etcd/e...

SRE运维进阶之路 2023-06-212023-06-21 20:57:30

etcd、云原生

发表了文章 2023-06-212023-06-21 10:07:18

评估 Etcd 性能及可靠性

SLI（Service Level Indicator）：服务等级指标，其实就是我们选择哪些指标来衡量我们的稳定性。

SRE运维进阶之路 2023-06-212023-06-21 10:07:18

etcd、云原生

12 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
云原生运维
暂未填写学校和专业
https://clay-wangzhi.com/
上海
加入社区时间：2023-06-19

个人成就

获得 20 次赞同
文章被阅读 3.5K 次

关注了：1关注者：10