经验技巧

监听 Kubernetes 中集群资源状态变更

  • watch 方式
    • java-operator-sdk
    • Flink 的 KubernetesSharedWatcher。倾向于 watch handler 的封装。并未对 SharedIndexInformer 添加封装
    • 变更处理逻辑
      • Event 存在丢失问题,建议仅使用 Event 作为 Trigger。当收到 Event 时在去查询最新的状态执行更新操作。因此需要设计一个 handler,只处理查询最新的状态的操作
  • timer 方式

综合实现

监控、可视化和告警

基于 prometheus 和 grafana 实现