Re: Sudden zpool checksums errors

From: Andrea Venturoli <ml_at_netfence.it>
Date: Fri, 11 Apr 2025 14:01:28 UTC
On 4/10/25 15:25, mike tancsa wrote:

> What does "ipmitool sensor" show for your power supplies ?

> # ipmitool sensor
> CPU1 Temperature | 38.000     | degrees C  | ok    | 0.000     | 0.000     | 0.000     | 84.000    | 87.000    | 90.000    
> CPU2 Temperature | na         |            | na    | 0.000     | 0.000     | 0.000     | 84.000    | 87.000    | 90.000    
> TR1 Temperature  | 24.000     | degrees C  | ok    | 0.000     | 0.000     | 0.000     | 37.000    | 40.000    | 60.000    
> DIMMA1_Temp      | 35.000     | degrees C  | ok    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMA2_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMB1_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMC1_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMD1_Temp      | 36.000     | degrees C  | ok    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMD2_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMME1_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMF1_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMG1_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMG2_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMH1_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMJ1_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMK1_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMK2_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMML1_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> DIMMM1_Temp      | 0.000      | degrees C  | nr    | 0.000     | 0.000     | 0.000     | 81.000    | 83.000    | 85.000    
> PSU1 Over Temp   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> PSU2 Over Temp   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> CPU1_ECC1        | 0x0        | discrete   | 0x4080| na        | na        | na        | na        | na        | na        
> CPU2_ECC1        | na         | discrete   | na    | na        | na        | na        | na        | na        | na        
> +VCCIO1          | 0.995      | Volts      | ok    | 0.750     | 0.800     | 0.850     | 1.150     | 1.200     | 1.250     
> +VCCIO2          | 1.000      | Volts      | ok    | 0.750     | 0.800     | 0.850     | 1.150     | 1.200     | 1.250     
> +VCORE1          | 1.782      | Volts      | ok    | 1.296     | 1.350     | 1.404     | 1.953     | 1.998     | 2.052     
> +VCORE2          | na         |            | na    | 1.296     | 1.350     | 1.404     | 1.953     | 1.998     | 2.052     
> +VDDQ_ABC_CPU1   | 1.206      | Volts      | ok    | 0.960     | 1.020     | 1.080     | 1.320     | 1.380     | 1.440     
> +VDDQ_DEF_CPU1   | 1.212      | Volts      | ok    | 0.960     | 1.020     | 1.080     | 1.320     | 1.380     | 1.440     
> +VDDQ_GHJ_CPU2   | na         |            | na    | 0.960     | 1.020     | 1.080     | 1.320     | 1.380     | 1.440     
> +VDDQ_KLM_CPU2   | na         |            | na    | 0.960     | 1.020     | 1.080     | 1.320     | 1.380     | 1.440     
> +12V             | 12.122     | Volts      | ok    | 9.628     | 10.208    | 10.788    | 13.224    | 13.804    | 14.384    
> +5V              | 4.968      | Volts      | ok    | 4.008     | 4.248     | 4.512     | 5.496     | 5.760     | 6.000     
> +3.3V            | 3.280      | Volts      | ok    | 2.640     | 2.800     | 2.976     | 3.632     | 3.792     | 3.968     
> +5VSB            | 4.944      | Volts      | ok    | 4.008     | 4.248     | 4.512     | 5.496     | 5.760     | 6.000     
> +3.3VSB          | 3.248      | Volts      | ok    | 2.640     | 2.800     | 2.976     | 3.632     | 3.792     | 3.968     
> VBAT             | 3.180      | Volts      | ok    | 2.400     | 2.560     | 2.700     | 3.640     | 3.800     | 3.960     
> PMBPower1        | 80.000     | Watts      | ok    | 0.000     | 0.000     | 0.000     | 600.000   | 704.000   | 800.000   
> PMBPower2        | 88.000     | Watts      | ok    | 0.000     | 0.000     | 0.000     | 600.000   | 704.000   | 800.000   
> PSU1 AC Lost     | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> PSU2 AC Lost     | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> PSU1 PWR Detect  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> PSU2 PWR Detect  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> CPU_CATERR       | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Memory_Train_ERR | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> FRNT_FAN1        | 1700.000   | RPM        | ok    | 0.000     | 600.000   | 600.000   | 22500.000 | 23700.000 | 25000.000 
> FRNT_FAN6        | 1900.000   | RPM        | ok    | 0.000     | 600.000   | 600.000   | 22500.000 | 23700.000 | 25000.000 
> FRNT_FAN7        | 1900.000   | RPM        | ok    | 0.000     | 600.000   | 600.000   | 22500.000 | 23700.000 | 25000.000 
> PSU1 Slow FAN1   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> PSU2 Slow FAN1   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD01  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD02  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD03  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD04  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD05  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD06  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD07  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD08  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD09  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD10  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD11  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD12  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD13  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD14  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
> Backplane1 HD15  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane1 HD16  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane1 HD17  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane1 HD18  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane1 HD19  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane1 HD20  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane1 HD21  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane1 HD22  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane1 HD23  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane1 HD24  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane2 HD01  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane2 HD02  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane2 HD03  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane2 HD04  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane2 HD05  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane2 HD06  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane2 HD07  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane2 HD08  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane2 HD09  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane2 HD10  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane2 HD11  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> Backplane2 HD12  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
> NM Capabilities  | na         | discrete   | na    | na        | na        | na        | na        | na        | na        
> Watchdog2        | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        






> If you do ipmitool lan print, and if it has an IP, try and 
> login to the web interface of the BMC and see if your board offers power 
> utilization.  Dont post the IP info here :)

This is available, but currently unconfigured.
I'll see if I can set it up.


  bye & Thanks
	av.