首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏深度学习与python

    字节跳动开源 kube-apiserver 可用方案 KubeGateway

    kube-apiserver,因此它的可用性决定了整个集群的可用能力。 kube-apiserver 本质上是一个无状态的服务器,为了实现其可用,通常会部署多个 kube-apiserver 实例,同时引入外部负载均衡器(以下简称 LB)进行流量代理。 缺乏请求治理的灵活性:4 层负载均衡在传输层工作,它只负责消息的传递,但是无法处理应用层的 HTTP 协议的信息,因此相较于 7 层负载缺乏对请求治理的“灵活性”和 “智能性”。 社区中有一些相关工作试图解决上述问题,但均没有根治问题: 随着云原生技术的发展,目前字节跳动 95% 以上的业务跑在 Kubernetes 上,对集群可用提出了更高的要求。 有效提高了集群的稳定性和可用性。

    1.5K20编辑于 2023-03-29
  • 来自专栏超详细二进制部署k8s系列[19]篇

    二进制部署k8s教程10 - 部署apiserver可用

    TIP二进制部署 k8s - 部署 apiserver 可用***转载请注明出处:https://janrs.com/clw9有任何问题欢迎在底部评论区发言。! 或者线上不使用 keepalived 做可用。直接用 nginx 的 tcp 反向代理也是可以。 部署 HA 可用1.k8s 的 HA!NOTEk8s 中 master 的三大组件,其中 kube-controller-manager 与 kube-scheduler 有提供可用机制。 因为 kube-apiserver 是无状态的应用,并且对外提供 http/https 的接口调用方式提供服务,所以可以用 nginx 来做负载均衡达到可用。2.初始化系统环境! kube-apiserver 可用已经部署成功。也就是 k8s 可用部署成功。转载请注明出处:https://janrs.com/clw9有任何问题欢迎在底部评论区发言。

    1.3K20编辑于 2023-03-08
  • 来自专栏分布式+云运维技术专栏

    Kubernetes(k8s)1.14 离线版集群 - 可用kube-apiserver+部署KeepLived

    a、前提提条件、服务器,请查看这个地址:https://blog.csdn.net/esqabc/article/details/102726771 . . 2、搭建kube-apiserver 可用 使用Nginx 4层实现k8s节点(master节点和worker节点)可用,访问kube-apiserver的步骤 注意:搭建服务器,没有特殊说明,一般默认在:k8s-01 操作 a、下载编译nginx make && make install 说明一下: without-http_scgi_module --without-http_fastcgi_module with-stream:开启 44)配置Nginx文件 [root@k8s-01 ~]# cd /opt/k8s/work [root@k8s-01 work]# cat > kube-nginx.conf <<EOF 添加下面内容 opt/k8s/work [root@k8s-01 work]# cat > kube-nginx.service <<EOF 添加下面内容: [Unit] Description=kube-apiserver

    69921发布于 2020-06-11
  • 来自专栏数据和云

    MySQL可用--MGR入门(4)异常恢复

    前文阅读: 1.MySQL可用--MGR入门(1)单主/多主模式搭建 2.MySQL可用--MGR入门(2)组复制监控常用相关表 3.MySQL可用--MGR入门(3)单主/多主模式切换 1.网络异常 4.分布式恢复 前面提到了暂时性的集群恢复,这样的恢复会有很大的问题,这里将阐述 MGR 正常的恢复方式。 如果在 binlog 不可用或者差的数据实在太多的情况下,MySQL 在 8.0.17 后退出了克隆的方式进行恢复,即在集群中的所有 MySQL 节点上添加克隆插件,新加入的节点数据将会被全部删除,然后会被自动重新同步数据

    2.1K20编辑于 2022-02-17
  • 来自专栏技术杂记

    Mycat HA(可用) 与 LB(负载均衡)4

    目录结构 [root@h101 sbin]# tree /usr/local/keepalived/ /usr/local/keepalived/ ├── bin │ └── genhash ├── etc │ ├── keepalived │ │ ├── keepalived.conf │ │ └── samples │ │ ├── client.pem │ │ ├── dh1024.pem │ │ ├── keepalived.co

    28030编辑于 2021-12-02
  • 来自专栏全栈程序员必看

    rabbitmq可用集群搭建_mongodb可用架构

    RabbitMQ 可用集群搭建 1 集群简介 1.1 集群架构 ​ 当单台 RabbitMQ 服务器的处理消息的能力达到瓶颈时,此时可以通过 RabbitMQ 集群来进行扩展,从而达到提升吞吐量的目的 一个可用,负载均衡的 RabbitMQ 集群架构应类似下图: 这里对上面的集群架构做一下解释说明: ​ 首先一个基本的 RabbitMQ 集群不是可用的,虽然集群共享队列,但在默认情况下,消息只会被路由到某一个节点的符合条件的队列上 HAProxy 同时支持四层和七层负载均衡,并基于单一进程的事件驱动模型,因此它可以支持非常的井发连接数。 此时对外服务的 VIP 依然可用,代表已经成功地进行了故障转移。 juejin.im/post/6844904071183220749 RabbitMQ 官方文档 —— 集群指南:www.rabbitmq.com/clustering.… RabbitMQ 官方文档 —— 可用镜像队列

    3K10编辑于 2022-09-30
  • 来自专栏菩提树下的杨过

    redis 学习笔记(4)-HA可用方案Sentinel配置

    最小化的sentinel配置文件为: 1 port 7031 2 3 dir /opt/app/redis/redis-2.8.17/tmp 4 5 sentinel monitor mymaster /redis-cli -p 7031 sentinel masters 可通过该命令查看当前的master节点情况(注,这里一定要带sentinel的端口) 4、在master上,. shutdown 客户端的使用: 一、Jedis 1 @Test 2 public void testJedis() throws InterruptedException { 3 4 jedis.get(key));// 观察读取是否正常 34 35 sentinelPool.close(); 36 jedis.close(); 37 38 } 4- testRedisson() throws InterruptedException, ExecutionException, 3 TimeoutException { 4

    1K70发布于 2018-01-19
  • 来自专栏后台技术底层理解

    redis并发可用

    redis 可用,如果是做主从架构部署,那么加上哨兵就可以了,就可以实现,任何一个实例宕机,可以进行主备切换。 所以就有了几个问题? 什么是主从架构,主从如何备份? 优点: 1、有效的解决了redis在分布式方面的需求 2、遇到单机内存,并发和流量瓶颈等问题时,可采用Cluster方案达到负载均衡的目的 3、可实现动态扩容 4、P2P模式,无中心化 5、通过Gossip 哨兵用于实现 redis 集群的可用,本身也是分布式的,作为一个哨兵集群去运行,互相协同工作。 哨兵 + redis 主从的部署架构,是不保证数据零丢失的,只能保证 redis 集群的可用性。 ==怎么保证redis是并发以及可用的==? sdown 和 odown 转换机制 sdown 是主观宕机,就一个哨兵如果自己觉得一个 master 宕机了,那么就是主观宕机。

    3.2K10发布于 2020-08-04
  • 来自专栏SY小站的专栏

    ingress可用

    上可能某个流量路线到某个node上的时候因为`Ingress Controller`的pod不在这个node上,会走这个node的kube-proxy转发到Ingress Controller的pod上,多走一趟路 4、 不创建svc,效率最高,也能四层负载的时候不修改pod的template,唯一要注意的是`hostNetwork: true 可用选择第四种,采用deploy设置replicas数量 + nodeSeletor

    2.6K30发布于 2020-06-15
  • 来自专栏问天丶天问

    SkyWalking 可用

    生产环境中,后端应用需要支持吞吐量并且支持可用来保证服务的稳定,因此需要高可用集群管理。 可用需要: 至少一个 Nacos(可以是nacos集群) 至少一个 ElasticSearch / mysql(可以是es/msql集群) 至少2个skywalking oap服务; 至少1个UI(UI

    50910编辑于 2024-10-03
  • 来自专栏写代码和思考

    可用 - 简述

    背景 本文记录一些可用的内容,和数据库在可用方面的演进过程。 1. 概念 可用性: 即软件系统在一段时间内提供 有用资源 的能力。 可用性 % 停机时间/分钟 停机时间/年 供应商术语 90 52,560.00 36.5 天 一个9 99 5,256.00 4 天 两个9 99.9 525.60 8.8 小时 三个9 99.99 52.56 如何设计来做到可用 保证系统可用,架构设计的核心准则是:冗余 和 故障转移。 单点系统的问题是,挂了就完全不可用了,服务会受影响。如果有冗余备份,其他后备的系统能够顶上,保证服务继续可用。 常见的互联网分布式架构是: 前端 ---> 反向代理 --> WEB应用 --> 服务 --> 数据库(及缓存) 其中,可用可涉及到上面每个节点的可用保障,我们看下数据的可用架构的演变过程。 总结 关注快速读写 关注一致性 4. 展望 主备复制为这个领域奠定了重要的基础,但最终,我们需要更好的可用性和更大的规模。

    2.1K10发布于 2020-05-08
  • 来自专栏编程一生

    实践可用

        本篇文章是之前一篇《大话可用》的可用心法的案例篇。   说实践之前先说概念。    具体实践如下: 架构可用   交易这边进行在进行重构。将原有的核心交易从职责上划分为交易收单、交易保障和数据中心三个大块。   从高可用上,交易收单要保证实时交易现场的可用。 所以它才是对可用需要考虑最多的,对MTBF和MTTR都要考虑和权衡。但是在对可用要求上交易收单和交易保障是基本职责,指标就是稳定、稳定和稳定。 数据中心关乎的用户体验,是可以持续优化的,但是对可用是有一定容忍度的:比如页面会加载慢,或者第一次加载不了刷新就成功了。 强依赖可用   比如数据库的密码,不仅是加密的,而且是在中央集群秘钥管理中心统一管理的。中央集群的就会有秘钥获取不到的风险。按照API,如果获取不到则会抛出指定异常。   这是强依赖,需要容灾。

    1.1K30发布于 2018-07-02
  • 来自专栏编程一生

    大话可用

      今天老大跟我讨论说,没有看到过一篇够全面体系的可用的文章。谈到可用,基本都是以偏概全的文章。今晚抽空想了一下这个问题。    可用我另一个更资深老大其实总结的很全面了:别人死我们不死,自己不作死,不被队友搞死。   然后就是怎么别人死我们不死:最好就是别人的东西和我们没关系,就是去依赖。如果实在有依赖呢,那就尽量弱依赖。

    1K20发布于 2018-07-02
  • 来自专栏院长运维开发

    ingress可用

    app.kubernetes.io/name: ingress-nginx app.kubernetes.io/part-of: ingress-nginx --- Ingress Contronler 可用 上可能某个流量路线到某个node上的时候因为Ingress Controller的pod不在这个node上,会走这个node的kube-proxy转发到Ingress Controller的pod上,多走一趟路 4、 也就是使用了主机的dns,会导致svc的请求直接走宿主机的上到公网的dns服务器而非集群里的dns server,需要设置pod的dnsPolicy: ClusterFirstWithHostNet即可解决 可用选择第四种

    2.6K20发布于 2020-06-13
  • 来自专栏用户1337634的专栏

    可用 --- Redis

    因为Redis拥有诸多优秀的特性,使用范围越来越广,系统对其可用性的依赖也越来越重,当前绝大部分系统使用的Redis都实现了可用。 这里主要介绍Redis官方推荐的两种可用方案Sentinel和Redis Cluster。 (如有不明白可以参考《Redis设计与实现》) 可用 Redis实现可用主要有两种方式,一种是Sentinel(3.0之前),一种是3.0正式支持的Redis Cluster(推荐)。 注意事项 因为Sentinel与Redis Cluster都没有实现强一致性(也没有实现最终一致性),所以在使用时,要牢记这一点,不能用在一致性要求特别的场景,比如全局唯一ID,交易数据等。 如果master没有设置持久化,存在风险,如果不小心重启,则会丢失所有数据,而且从机也会因为同步,丢失所有数据(所以一定要高可用)。

    1.2K40发布于 2019-03-27
  • 来自专栏PHPer 进击

    MySQL - 可用性:少宕机即可用

    我们之前了解了复制、扩展性,接下来就让我们来了解可用性。归根到底,可用性就意味着 "更少的宕机时间"。 老规矩,讨论一个名词,首先要给它下个定义,那么什么是可用性? 1 什么是可用性 我们常见的可用性通常以百分比表示,这本身就有其隐藏的意味:可用性不是绝对的。换句话说,100% 的可用性是不可能达到的。没错,这里可以这么肯定的说。 同样的计算,我们可以得出 3 个 9 每年宕机时间为 8.76 小时,4 个 9 的是 52.6 分钟。 3 如何实现可用性 通过上面的分析,也许你已经发现了,我们可用性取决于两个时间: 应用的平均失效时间 应用的平均恢复时间 因此,提高可用性也可以从这两个方面入手。 4 总结 可用性用宕机时间 n 个 9 来衡量。 实现可用性从平均失效时间和平均恢复时间入手。

    1.9K20发布于 2019-05-13
  • 来自专栏深入理解Android

    并发与可用实战

    可用 可用:相对于并发来说,可用并不是一个比较有规律的参数,7*24 是每个网站的梦想,但是你并不知道,在某一刻,他就没理由的宕机了。 并发设计原则 系统设计不仅需要考虑实现业务功能,还要保证系统并发、可用可靠等。 可用设计原则 通过负载均衡和反向代理实现分流。 通过限流保护服务免受雪崩之灾。 通过降级实现部分可用、有损服务。 通过隔离实现故障隔离。 4.业务降级:当并发流量来袭,在电商系统大促设计时保障用户能下单、能支付是核心要求,并保障数据最终一致性即可。 这样就可以把一些同步调用改成异步调用,优先处理优先级数据或特殊特征的数据,合理分配进入系统的流量,以保障系统可用

    2K20编辑于 2022-06-22
  • 来自专栏后台技术底层理解

    redis 的并发可用

    redis 可用,如果是做主从架构部署,那么加上哨兵就可以了,就可以实现,任何一个实例宕机,可以进行主备切换。 所以就有了几个问题? 什么是主从架构,主从如何备份? 优点: 1、有效的解决了redis在分布式方面的需求 2、遇到单机内存,并发和流量瓶颈等问题时,可采用Cluster方案达到负载均衡的目的 3、可实现动态扩容 4、P2P模式,无中心化 5、通过Gossip 哨兵用于实现 redis 集群的可用,本身也是分布式的,作为一个哨兵集群去运行,互相协同工作。 哨兵 + redis 主从的部署架构,是不保证数据零丢失的,只能保证 redis 集群的可用性。 怎么保证redis是并发以及可用的? sdown 和 odown 转换机制 sdown 是主观宕机,就一个哨兵如果自己觉得一个 master 宕机了,那么就是主观宕机。

    1.8K00发布于 2020-08-04
  • 来自专栏闲余说

    架构设计 4-可用架构之FMEA方法

    本文为第三部分,主要介绍 FMEA 方法,以及如何将 FMEA 方法应用于架构设计之中以提高服务可用性。 常见的影响有: 功能点偶尔不可用 功能点完全不可用 部分用户功能点不可用 功能点响应缓慢 功能点出错等 故障影响也需要尽量准确描述。 严重程度 严重程度指站在业务的角度故障的影响程度 一般分为“致命 / / 中 / 低 / 无”五个档次 严重程度按照这个公式进行评估:严重程度 = 功能点重要程度 × 故障影响范围 × 功能点受损程度 自研系统:和开源系统类似,成熟的自研系统故障概率会低,而新开发的系统故障概率会 风险程度 风险程度就是综合严重程度和故障概率来一起判断某个故障的最终等级 风险程度 = 严重程度 × 故障概率。 同时需要考虑资源的投入情况,优先将风险程度的系统隐患解决。 个人理解 FMEA 方法是一种分析问题的方法,一共列出了 11 个点,我们在分析架构问题的时候,按照每个点逐一去适配、分析。

    97340编辑于 2022-08-19
  • 来自专栏数据科学专栏

    大数据必知必会:Hadoop(4可用集群安装

    安装前准备可用集群环境下,至少需要3台服务器,这里准备5台。 JournalNode、NameNode、ResourceManager10.0.0.7node3 JournalNode、DataNode、NodeManager 10.0.0.8node4 单机环境安装参考大数据必知必会:Zookeeper(1)单机环境安装伪分布式安装参考大数据必知必会:Zookeeper(2)伪分布式安装集群环境安装参考大数据必知必会:Zookeeper(3)集群环境安装可用集群安装可用集群是在多个节点上运行进程来实现 Using value of YARN_CONF_DIR.node4: WARNING: YARN_CONF_DIR has been replaced by HADOOP_CONF_DIR. Using value of YARN_CONF_DIR.node4: WARNING: YARN_CONF_DIR has been replaced by HADOOP_CONF_DIR.

    1.2K30编辑于 2023-02-09
领券