关于N6000、N6005、N5105、N5095  ESXi PVE UNRAID 虚拟化 不稳定 死机的测试和解决方法缩略图

由于最近考虑做一款低功耗平台主板,配合之前的8盘硬盘扩展箱,做一台NAS低功耗整机。所以特地买了一片板子回来做了一些测试。顺便也试试不稳定的原因,尝试给大家解除大家一些疑虑。

2023-4-20更新

更新BIOS    微码更新0x24000024   虚拟机就不会自动重启了,满载压力测试跑了四天四夜一不小心碰掉了电源截图没了。。。。懒得测试了正常人也不会实时满载应该算是正常的了。

2023-3-27更新

更换了金士顿跟三星的内存条还是虚拟机随机崩溃,估计崩溃和内存无关,接下来尝试更换R8125B的网卡测试一下崩不崩看看是不是i226v的网卡是真的垃了

2023-3-24更新

更新完ESXi8.0 0B版本之后发现稳定非常多,全满载的情况下挺了一天也没崩,这种负载在ESXi7的时候两三小时必崩。实际观测总性能被限制了大约15%,win、群晖、爱快同时拉满能看到性能都是大约占用30%左右 就是几乎性能平均分配了。总睿频大约少了1.5G左右!应该完善调度问题,减少虚拟机崩溃!
使用PVE7.4的用户也有反馈虚拟机崩溃的现像少了。
这些案例也说明虚拟机崩溃应该与软件调度有关系,因为在纯物理机的形态下是非常稳定的。如果您的虚拟机经常崩溃那么建议你更新到ESXi8.0 0B、PVE7.4 或以上版本可以有效减少虚拟机重启。
56ba2683f8cd28b627a892f594d1b235

 

2023-3-2发布

硬件:N6000 平台+16G ddr4 2666酷兽内存*2+SN850+4TB机械硬盘fbe4d32d55ade4ac27a8b73cee7f7c8c

测试方法:ESXi虚拟三台虚拟机,爱快、win10、群晖7.0,板载的四个2.5g  两个分配给爱快一个当wan 一个当lan     一个分配给win10  一个分配给群晖  随便插了一个pcie万兆网卡,再加一个usb网卡当管理网口。win10的网口直联爱快的lan,爱快的wan连接我自家的2.5g交换机,群晖的网口连接到2.5g交换机,群晖和win使用iperf3跑数据,又在交换机上开多了一台iperf3服务器错开跑点上下行模拟正常使用环境。期间通过 万兆写入文件虽然会影响爱快的宽带,但也算凑合很少有人会公网一直跑千兆上下行满载,群晖在有内存缓存的情况下写入速度能到800m/s(因为这台机器只有单NVME 3.0x1通道,所以有点麻烦),注意由于使用的是N6000的原因调度比较保守,显示100%负载但是各种操作界面都是很流畅的。虽然性能上限被限制但使用体验还算不错。4c3bf5059a2f8c5b1cf547ce43359d29

说一下结论吧:

不稳定因素:更新BIOS    微码更新0x24000024   虚拟机就不会自动重启了,intel自身的BUG给虚拟机加压力也不会重启了。当然良好的散热,品牌NVME也有助于提升稳定性。还有ESXi对比UNRAID效率起码能高15%以上。

经过小半个月的测试基本可以判定N5105 N6000 N6005 N5095这个系列的CPU目前所有虚拟化(听说PVE最新内核好点)几乎都有虚拟机高负载下会有自动重启的情况,频率一两小时内(但完全不影响宿主机)。期间尝试更换散热环境,把所有硬件的温度都压到40度以下都只是轻微改善,但并没有任何卵用。不过这个产品纯物理机使用无论怎么烤机怎么折腾都非常稳定(群晖与win10下高负载48小时以上无任何报错故障等等)。当然一开始我们拿杂牌NVME测试时明显能感觉非常不稳定,厂家也说很多客户反馈国产低价硬盘使用不稳定,所以这边不推荐大家使用国产杂牌NVEM。如果您在虚拟化平台下不重启可以留言沟通交流,高额悬赏解决方案哈哈!

初测不稳定因素:一开始使用一条杂牌的NVME硬盘做ESXi的主盘跑几个小时就崩了,(在其它平台上跑也没这么快崩)检查了好久,后面换了一条SN850 1TB硬盘之后就不会崩了,崩虚拟机或崩宿主机应该和NVME硬盘有很大的关系,所以不建议使用杂牌硬盘。J4125稳定其实很大程度是因为J4125因为pcie通道的问题基本都采用MSATA或SATA方案热量低,长时间运行更加稳定,本质上区别不大,这个只是应用环境区别。产品本身是没有任何问题的,只要后续BIOS有优化,和优化PCIE设备的兼容正常应该不会有问题。

产品性能能适应的环境:由于我们测试时所有网口都有负载,几乎也就是普通人天花板级别的应用场景,论理上差不多就是千兆对等光纤满载,加运行一台群晖主机大量读写文件(700m/s)的负荷,所以大致就是一两个软路由+NAS+再外加一台负载不高的win10。实测N6000纯群晖的情况下轻松10G网卡满载读写负载1.1g的基本频率才占用才35%左右,从此推测理论上跑20G+机器还有50%左右的性能可处理其它任务。但此平台明显功耗对比J3455要高上不少,整机空载挂4只2.5g的i226v+1个cx341a万兆网卡+5只sata ssd+NVME SSD SN850 1TB 功耗接近35w 满载50w(益衡7025B 铜牌电源85%转换效率),假设j3455能挂这么多设备的话估计待机功耗起码要高10w 满载高15w+。当然性能也是天差地别,j3455别说插不了本身的IO性能也就是万兆封顶了。但这个产品有个缺点就是虚拟化宿主机下的虚拟机长时间负载过高就会重启而且一两小时就会重启,估计和软件调试适配有关系。

此类主板应用:包含N6000、N6005、N5105、N5095,比较合适作为存储服务器或超轻量虚拟化应用,用于软路由对比J4125是完全没有优势的因为2.5g网口的上限pcie2.0x1都够跑两个了,使用新平台提供pcie3.0通道用来接2.5g网口很浪费,一点优势都没有。N5105再使用4个2.5G网口并不会带来质量的提升,反而会因为热量和功耗更高而使得体验变差,应当把通道做成NVME通道或增加扩展的PCIE口会更加有优势。N5105做软路由性能用不完PCIE3.0的通道又浪费,所以NAS应用更加合适,软路由交给J4125这种旧平台价格便宜温度也会低一些。综合来说如果你不玩重虚拟化这款产品还算不错(期待软件后续的适配),功耗合适只要I/O分配得当在win或nas下使用起来非常舒服。但是不建议单纯用在纯软路由环境,性能和I/O浪费功耗高点就算了,实际应用下对比上代J4125完全没有提升。纯软路由建议J4125会更加合适一些,虽然性能和I/O差了一半,但毕竟价格和使用环境要求更低一些。

 

对于普通人来说这款产品只要配置得当就算加万兆网卡做ALL IN ONE也不会有特别大的瓶颈,足够满足使用

 

爱快网卡负载

3ea8cfb78599af01e383d52c5f020920

698425b860b289a121dc969174b84d4e

 

win10下网卡负载

dcfaf6dd5f441917c19929f8f9745889

 

ESXi下几乎拉满

78fb51017160da619d35a4e5d0976628

10 Thoughts on “关于N6000、N6005、N5105、N5095 ESXi PVE UNRAID 虚拟化 不稳定 死机的测试和解决方法”

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用 Akismet 来减少垃圾评论。了解我们如何处理您的评论数据