小弟长期潜水,平时也不是伸手党,这次突发事急,绝望中紧急求助各位大神!
先讲重点:
Cluster Administrator进不去.
在命令行下,cluster res **2b /status 显示online, 反应速度很快。
但是cluster res *1a /status 时会hang住,无法继续。也没办法把 *1a这个资源offline, 也会卡住。
单纯输入cluster res查看所有资源时,其他资源都显示正常,就是在显示 *1a时会卡住。无法继续。只能Ctl+C跳出.
尝试过cluster res **1a /fail,卡住,未果。
Event viewer里伴随有cluster.exe报错。
请问:我现在想把这个1a的资源脱机,或者关闭也好,杀死也好。请问有什么办法吗?
问题背景:
我现在的服务器是两台windows server 2003(简称之为1a, 2b)+IBM SAN做集群。因为之前做项目的公司在配置时有点历史遗留问题,同时上线会导致争抢token, 所以平时总是关掉1a,只运行其中一台2b。Cluster Administrator里也总是2b online, 1a offline。长久以来小问题不断,但是也算正常。
一周前进行维护时发现集群连上不去了,通过Cluster Administrator的离线模式(.)进去后,把group里的服务Online了,一时手快,把1a的也给online了。开始没有发现,今天系统故障后需要重启,重启后发现无法启动其他服务,初步怀疑是因为1a resource online的这个问题。