事情是这样的:
在经历过连续两次意外断电之后,ESXI 出现了故障
登录之后部分主机显示无效,如下图所示:
在浏览器文件的时候发现图标不对,并且生成了一个.lck 的文件
正常是这个样子的
处理过程:
1 ,显示无效的只能取消注册,无法开机,取消注册之后,再重新注册,仍然是无效。
2 ,新建虚拟机引用原有的 vmdk 文件,也报错
3 ,web 端尝试删除.lck 文件也报错
4 ,ssh 删除.lck 文件也不行
报错:rm: can't remove '2016.vmx.lck': Invalid argument
5 ,用 vmfsfilelockinfo 查看文件锁定
发现 MAC 地址是另外一个 10G 网口,这个网口都没用。
请问是不是只有把网线插这个口才能解除锁定?
用 vmkvsitools 工具查看程序运行也没有
6 ,尝试用 scp 命令把文件复制到另外一台 ESXI ,也报错。vmck 文件不给复制,其它文件可以!
原本我大概的思路是按照这个 https://blog.csdn.net/weixin_43343803/article/details/106728015
拉取日志重建 vmx 文件的。可是.vmx 文件它不给删除。
我重新找了一块硬盘装 ESXI 系统,还是文件被锁定。
有没有人遇到过此类情况,后来又是如何解决的
1
idclight 2023-07-27 09:20:11 +08:00
机器是跑在 vCenter 里吗?这里有篇官网的文档 https://kb.vmware.com/s/article/10051?lang=zh_cn
|
2
idclight 2023-07-27 09:21:25 +08:00
如果是跑在 vCenter 里那就是另外一台主机锁定了这台虚拟机,按照文档无脑操作即可。
|
3
simplove OP @idclight 是跑在 vcenter 里,不过 vcenter 是安装在一台 win2012 里面的,正好它也在此次断电中挂了。
然后我又装了一台 vcenter ,我再试试,谢谢。 |
4
idclight 2023-07-27 09:33:12 +08:00
@simplove 如果集群节点不是很多的话可以直接跳过 vmfsflelockinfo ,在每台机器上直接跑 lsof | egrep 'Cartel|****.vmdk',然后继续文档下一步
|
5
wheat0r 2023-07-27 09:37:46 +08:00
要不然先重建一个 vCSA ?
|
6
simplove OP @idclight 不行跑这个直接提示为空。
lsof | egrep 'Cartel|2016.vmdk' Cartel | World name | Type | fd | Description [root@localhost:~] 也就是说 这个 esxi 没有任何 vmdk 在栈。 我想也是,毕竟我连 ESXI 系统都换了一个,只是存储盘没换,是由 3 块 8T 组成的 Raid5 。 在新系统上它自动挂载了,卸都卸不掉 |
7
idclight 2023-07-27 10:35:12 +08:00
vmdk 文件拉下来在别的机器上注册呢?
|
9
idclight 2023-07-27 13:51:05 +08:00
开 SSH 让我来,telegram: c3VtbWVyb2No
|
10
Achophiark 2023-07-27 19:27:44 +08:00 via Android
vc 一般都有备份的,回复一下
|
11
simplove OP @Achophiark vc 是 6.7 ,安装在 windows 上,正好这台 windows 也位于这台损坏的 ESXI 上面,恰好这台 windows 也损坏了。。。所以无解,正在重装中。
|
12
shiyunjin 2023-07-27 21:59:56 +08:00 via Android
我上次出现类似的情况是因为强制断电之后硬盘挂了,但是你 3 块组成的 raid5 的话应该不是这个原因了
|