与 DNS 相爱相杀小故事暨科普
Boom!
昨天下午 15:00,我们发现了 CI 的大规模异常,基本上就是 connection failed
和 Could not resolve host
的连环轰炸。
在查找问题之前,先来看看从我们伪 DevOps 能治理的角度出发可能是什么问题,一个运行中的 CI 任务到底是跑在哪里的:
在我们这里,CI 机器是有一个独立网段的,部署一个 CI 需要若干台机器,由 Master 负责调度给 Slave,Slave 在机器上创建新的 Docker 容器运行任务。