-
Kubernetes重要概念:Service详解
1 Service相关概念 1.1 什么是Service? 在 Kubernetes 中,Service 是一种抽象的资源,它提供了稳定的访问接口,将外部或集群内部的流量路由到对应的 Pod 上。Pod 是 Kubernetes 中的基本调度单元,但它们是临时的,IP 地址和生命周期都可能发生变化。Service 为 Pod 提供一个稳定的访问方式,解决了 Pod 的动态 IP 问题。…...- 装系统的sre运维
- 0
- 0
- 17
-
超实用!k8s网络抓包技巧,事半功倍
在k8s中,每个Pod都拥有独立的网络命名空间,这意味着它们有自己的网络接口、IP 地址和路由表。容器之间通过共享同一个网络命名空间进行通信,这种隔离使得网络问题的排查变得更加复杂,但同时也提供了灵活性和安全性。 既然Pod拥有独立的命名空间,那我们不妨借助工具进入其命名空间进行网络抓包,这样就省去了进入Pod内部抓包的麻烦。那么,具体该怎么…...- 装系统的sre运维
- 0
- 0
- 22
-
可以诊断k8s的chatgpt神器:k8sgpt-operator
在 Kubernetes 上,从部署 Deployment 到正常提供服务,整个流程可能会出现各种各样问题,有兴趣的可以浏览 Kubernetes Deployment 的故障排查可视化指南(2021 中文版)[1]。从可视化指南也可能看出这些问题实际上都是有迹可循,根据错误信息基本很容易找到解决方法。随着 ChatGPT 的流行,基于 LLM 的文本生成项目不断涌现,k8sgpt[2]…...- 装系统的sre运维
- 0
- 0
- 17
-
引发Openai全球性宕机,原因竟是Kubernetes?
2024年12月11日,OpenAI出现了全球性的严重宕机事件,这次事件导致OpenAI的所有服务包括ChatGPT、API和 Sora等都受到了严重影响,甚至出现无法访问的情况。关于此次事件的起因,目前官方已经出了故障报告,详见:https://status.openai.com/incidents/ctrsv3lwd797。在本文中,我将带大家深入了解OpenAI的此次故障事件,在别人的错误中…...- admin
- 0
- 0
- 26
-
k8s的负载均衡方案:MetalLB
对于自建的Kubernetes集群,默认情况下是不支持负载均衡的。当需要提供服务的外部访问时,可选用的方案不外乎 Ingress、NodePort等方式。但这些方案本身并不算非常完美,他们或多或少都存在着一些不足之外 ,如Ingress不支持TCP协议,而NodePort则是使用随机端口。对此,开源的MetalLB 方案旨在提供基于网络设备的负载均衡功能来解决这个痛点,本文将对此展开进行介绍。 一…...- 装系统的sre运维
- 0
- 0
- 22
-
消除 Kubernetes 中的未利用资源
Kubernetes 中的未利用资源不仅仅是预算项目——它们是效率、可扩展性和性能的隐形杀手。 浪费的 CPU 周期、空闲内存和未充分利用的节点都会累积,增加成本的同时使集群处理实际工作负载的能力下降。如果你在大规模使用 Kubernetes,你会知道这些低效问题如何演变成实际的操作难题。 如今,随着Scaleops 等智能自动化工具的兴起,你可以快速轻松地检测、修复和预防未利用资源,包括“不可驱…...- 装系统的sre运维
- 0
- 0
- 18
-
解决请求实体上传过大 ingress 报错 413 Request Entity Too Large的问题
经常我们会遇到上传超过1M左右的文件,但是向K8S中的Ingress nginx发起请求的时候会报错413 Request Entity Too Large。 具体原因是因为ingress nginx 默认 client_max_body_size为 1M, 超过 1M 后会报错 413 Request Entity Too Large。 解决办法 找到k8s集群 的ingress路由规则配置,编…...- 装系统的sre运维
- 0
- 0
- 20
-
k8s集群经历断电后无法启动的故障处理分享
故障应急总让人充满心跳,有时交换机故障、有时光缆被挖断,这次却是机房意外断电。。。 前阵子有个兄弟求助,他们的机房遭遇了意外断电。恢复供电后,k8s集群却无法启动。经过一番“截图分析诊断法”的默契配合,最终成功解决了故障。今天通过这篇文章,和大家分享一下这个过程。 故障发生后,很多指令无法正常回显,容器的元数据也无法正常加载,故障现象主要呈现为如下3点:1. 执行指令的时…...- 装系统的sre运维
- 0
- 0
- 33
-
Kubernetes集群 for openEuler 22.03 LTS 二进制手动部署
Kubernetes集群 for openEuler 22.03 LTS 二进制手动部署 本文档介绍在 openEuler 操作系统上,通过二进制部署 K8S 集群的一个参考方法。 说明:本文所有操作均使用root权限执行。 一、集群状态 本文所使用的集群状态如下: 集群结构:6 台openEuler 22.03 LTS系统的虚拟机,3 个 master 和 3 个 node 节点。 物理机:op…...- 装系统的sre运维
- 0
- 0
- 20
-
Kubernetes中Minikube与Kubeadm的关键区别是什么?
Kubernetes中Minikube与Kubeadm的关键区别是什么? ❝ 选择正确的Kubernetes工具:理解Minikube和Kubeadm用于开发和生产环境 Kubernetes,作为自动化部署、扩展和管理容器化应用程序的领先开源平台,拥有多种工具来简化集群的设置和管理。 在这些工具中,Minikube和Kubeadm作为两个受欢迎的选项脱颖而出。它们在Kubernetes生态系统中服…...- admin
- 0
- 0
- 14
-
解决 Kubernetes 命名空间卡在Terminating终止状态的问题
几个月前,我在卸载 Ceph 集群(使用 Rook 挂载)时遇到了删除命名空间的问题。 基础 我认为我已经正确删除了集群中的 Ceph 对象,最后简单地删除了命名空间: kubectl --context=sandbox delete ns rook-ceph 然而,当我尝试验证它是否确实被删除时: kubectl --context=sandbox get ns rook-ceph NAME …...- 装系统的sre运维
- 0
- 0
- 19
-
记一次机房搬迁后网络改造引起的K8S内部容器无法访问外部网络
最近公司规模扩大,原办公室已经无法容纳更多的员工,公司高层决定搬迁办公室,同时也需要搬迁,并且在现有的电信桥接动态公网IP出口的基础上需要再增加一条移动专线,现在有2台交换机,也无法支持新的办公,需要再采购一个交换机。现在办公和服务器在一个网段192.168.2.0/24。我在了解业务后,对新办公室进行了如下改造: 1、首先网段肯定不够支撑新办公区的网络,于是改造成大内网192.168.0.0/1…...- admin
- 0
- 0
- 16
-
一款功能强大的Kubernetes网络诊断工具
本文将介绍一款功能强大的Kubernetes网络诊断工具,名称为Kubeskoop。 一. 产品介绍 Kubeskoop 是一款专为Kubernetes设计的网络诊断和监控工具。Kubeskoop 提供了对集群中网络、服务、节点等多维度的可观测性,以帮助运维人员更快速地诊断和定位问题。产品具有以下特性: 1. 一键诊断网络链路 Kubeskoop 支持一键诊断 Kubernetes 集群…...- admin
- 0
- 0
- 59
-
Kubernetes Secrets 与跨命名空间访问指南
Kubernetes Secrets 与跨命名空间访问指南 Kubernetes 是一个强大的平台,旨在大规模管理容器化应用程序,其中 Secrets 作为安全管理敏感数据(如密码、API 令牌和加密密钥)的关键功能。默认情况下,Secrets 仅限于创建它们的命名空间,限制了它们在命名空间之间的可访问性。 在本指南中,我们将探讨跨命名空间安全高效共享 Secrets 的方法,讨论安全考虑,并提供…...- 装系统的sre运维
- 0
- 0
- 27
-
[kubectl-resource-view]: 一款用于查看k8s资源使用情况的插件
1.简介 一款自己编写的k8s 命令行插件,用于查看k8s node和pod资源的 cpu、 memory、 gpu的request 和limit 使用情况。 2.安装 可直接解压下载使用,也可以从github仓库中进行下载最新版本,支持不同架构,喜欢的麻烦给个小星星,有啥额外的需求可以提issue https://github.com/bryant-rh/kubectl-resource-vie…...- admin
- 0
- 0
- 21
-
[kubectl-resource-view]: 一款用于查看k8s资源使用情况的插件
一款自己编写的k8s 命令行插件,用于查看k8s node和pod资源的 cpu、 memory、 gpu的request 和limit 使用情况。可直接解压下载使用,也可以从github仓库中进行下载最新版本,支持不同架构,喜欢的麻烦给个小星星,有啥额外的需求可以提issuehttps://github.com/bryant-rh/kubectl-resource-view$ kubectl-r…...- pengchunhui
- 0
- 0
- 14
-
Kubernetes CoreDNS 无法解析外网域名的问题
k8s master机器环境 # cat /etc/resolv.conf nameserver 172.16.100.1 pod中的resolv.conf文件如下$ cat /etc/resolv.conf # Generated by NetworkManager nameserver 10.96.0.10 # 此ip为coredns的IP地址 排查过程 当pod需要解析一个域名时,如果域名是…...- admin
- 0
- 0
- 70
-
KubeSphere 和 Kubernetes 集群卸载、重装完全指南
本文是一篇实战短文,重点指导您成功卸载已有的 KubeSphere 和 Kubernetes 集群,并在原有服务器上完成重新部署。 实战服务器配置(架构1:1复刻小规模生产环境,只是配置略有不同) 主机名IPCPU内存系统盘数据盘用途ksp-control-1192.168.9.16181640100KubeSphere/k8s-control-planeksp-control-2192.168.…...- 装系统的sre运维
- 0
- 0
- 43
-
解决 Kubernetes 节点上的挂载点卡住问题:一次深入探索
在Kubernetes的日常操作中,我们可能会遇到各种各样的挑战和问题。最近,我遇到了一个特别棘手的问题:即使Pod 和Persistent Volume (PV) 已经被删除,它们之间的挂载关系仍然存在,导致整个集群的节点都无法使用 df -h 命令。本文将分享我是如何发现并解决这个问题的。 在Kubernetes集群的日常维护中,我们发现所有节点都无法正常执行 df -h 命令。这个命令通常用…...- admin
- 0
- 0
- 27
-
从k8s容器丢包事件中掌握内核参数优化技巧
在k8s的使用场景中,容器不是仅仅能运行就算ok,往往还需要进行容器的内核参数优化和应用程序参数的调优,如在高并发的业务场景下,运行一个java程序,我们不仅需要对其JVM参数进行调优,而且需要对其所在的容器进行内核参数优化,这篇文章主要通过一次容器丢包事件介绍容器中内核参数优化的方法。 线上业务反馈接口偶发性返回502状态码,从请求日志和监控系统看,有好几个微服务的接口都有出现,期间容器资源使用…...- 装系统的sre运维
- 0
- 0
- 24
-
Kubernetes etcd 定时备份及恢复方案
etcd 是一个高可用的分布式键值存储系统,在Kubernetes集群中用于存储和管理集群的所有关键信息,如配置数据、元数据、状态信息等。简而言之,etcd 存储了Kubernetes集群本身的所有数据,包括Pod、Service、Node、Namespace 等对象的元数据和状态。可以说,只要我们有了etcd的备份文件,就可以恢复Kubernetes集群的状态。 虽然etcd的数据是默认是存储在…...- admin
- 0
- 0
- 21
-
在 Kubernetes 中重启 pod 的 3 种方法
在 Kubernetes 中,管理和维护容器化应用程序是一项重要的任务。其中一个常见的操作是重启 Pod,无论是为了解决问题还是应用程序的更新。在本文中,我们将深入探讨在 Kubernetes 中重启 Pod 的三种方法,并为每种方法提供详细的步骤和示例。 kubectl 命令 首先,我们需要登录到运行着 Kubernetes 集群的主机或者使用远程访问工具来连接到集群。 使用 kubectl 命…...- admin
- 0
- 0
- 101
-
nginx-ingress代理websocket配置示例
官方文档中说明websocket不需要特别的配置,但需要在注解中配置以下三项 再ingress-nginx的官方文档中说明websocket不需要特别的配置,但需要在注解中配置以下三项 nginx.ingress.kubernetes.io/proxy-http-version: "1.1" nginx.ingress.kubernetes.io/proxy-read-time…...- admin
- 0
- 0
- 31
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!