
为什么我需要通过BMC重启服务器?
事情经过可以分为3步:
-
昨晚我写了个图算法查找图中全部Simple Cycle,但是运行时间太久我就让他在远程服务器一直运行了一晚上
-
第二天我发现服务器不能通过SSH远程连接了(表现是一直卡在SSH命令输完后)
-
向GPT求救
我是如何解决的
什么是BMC?
BMC(如 Dell 的 iDRAC、HP 的 iLO、华为的 iBMC)是嵌入在服务器主板上的微型电脑。只要服务器电源线插着,BMC 就会运行。
- 如何进入: 通常通过一个独立的网口(管理网口),在浏览器输入该网口的 IP 地址进入 Web 管理界面 或者 使用终端命令
- 作用: 它可以在不依赖 OS 的情况下,直接控制硬件电源。
如何使用BMC?
如果你手头有另一台可以联网的 Linux 机器,且知道目标服务器 BMC 的账号密码,可以不用浏览器,直接用命令行重启:
# 远程查询电源状态
ipmitool -I lanplus -H <BMC_IP> -U <User> -P <Password> chassis power status# 远程执行强制重启 (Reset)
ipmitool -I lanplus -H <BMC_IP> -U <User> -P <Password> chassis power reset
尝试1
尝试中:ipmitool -I lanplus -H <BMC_IP> -U <User> -P <Password> chassis power status
Error in open session response message : no matching cipher suite
Error: Unable to establish IPMI v2 / RMCP+ session
这个错误 Error in open session response message : no matching cipher suite 是一个经典的 加密算法不匹配 问题。简单来说:你的 客户端(ipmitool)请求使用的加密组合,服务器端的 BMC 不支持,或者 BMC 要求更高的安全级别。
解决方法:
强制指定加密套件 (-C 3 或 -C 17) IPMI v2 使用 -C 参数来指定 Cipher Suite(加密套件)。
ipmitool -I lanplus -H <BMC_IP> -U <User> -P <Password> -C 17 chassis power status
Set Session Privilege Level to ADMINISTRATOR failed: Unknown (0x81)
Error: Unable to establish IPMI v2 / RMCP+ session
尝试2
上述错误 Unknown (0x81) 在 IPMI 协议中通常代表 "Insufficient privilege level"(权限不足)。
虽然你的用户名和密码通过了认证(没有报密码错误),但是 ipmitool 默认尝试以 ADMINISTRATOR 权限建立连接,而账号(
解决方法:降低请求的权限级别 可以使用 -L 参数显式指定登录权限级别。请按以下顺序尝试:
- 尝试 OPERATOR 级别(通常足够执行重启)
ipmitool -I lanplus -H <BMC_IP> -U <User> -P <Password> -C 17 -L OPERATOR chassis power reset
- 尝试 USER 级别(只能查看状态,可能无法重启)
ipmitool -I lanplus -H <BMC_IP> -U <User> -P <Password> -C 17 -L USER chassis power status
最终解决方案
ipmitool -I lanplus -H <BMC_IP> -U <User> -P <Password> -C 17 -L OPERATOR chassis power reset
你问我在哪知道
<BMC_IP>,<User>,<Password>? 去租给你服务器的平台看看,查找关键字BMC