linux虚拟机密码重置 linux虚拟机性能

圆圆2025-07-19 12:01:20次浏览条评论

kvm虚拟机性能调优需从cpu、内存、存储i/o和网络四个方面入手。1. cpu优化：合理分配vcpu数量并进行绑定（cpu pinning），优先使用host-passthrough或host-model模式，结合numa负载配置以减少跨节点访问延迟；2. 内存管理：启用大页内存（hugepages）提升tlb命中率，推荐使用2mb或1gb页，关键vm建议固定内存或细化使用内存气球；3. 存储i/o优化：采用本地ssd/nvme作为存储介质，磁盘磁盘格式优先raw，接口推荐virtio-scsi，存储策略根据需求选择cache=none、writeback或writethrough，并合理配置磁盘机i/o调度器；4. 网络优化：务必使用virtio-net驱动，启用多队列支持，开启中断卸载功能如tso/gso/lro，必要时采用sr-iov实现网络直通，并合理配置一个帧与一个机网络参数。

Linux虚拟机性能如何调优？_LinuxKVM资源管理实践

Linux虚拟机性能调优，在我看来，核心定位精准的资源管理和对虚拟化原理的深刻理解。它不是一蹴而就的魔法，毕竟是一个持续的资源博弈，需要我们在CPU、内存、I/O和网络这几大核心要素上找到最佳平衡点，并根据实际负载调整调整。很多时候，以为的“慢”，只是某个环节的配置没我们可能，或者对KVM功能了解不够。解决方案

说到KVM虚拟机的性能调优，我通常会从几个维度入手，这就相当于给一个性能升级精细做化配置，每个阶段都得兼顾：

1. CPU优化：核心中的核心vCPU分配与绑定（CPU Pinning）：这是我最看重的一点。给虚拟机分配多少vCPU是个学问，多了可能导致调度开销，少了又不够用。更重要的是，如果接下来机器多核NUMA，架构架构把vCPU绑定到特定的物理核心上（host-passthrough或host-model） CPU配合cpuset），可以显着减少上下文切换和跨NUMA节点访问延迟。我遇到太多性能问题，都是因为CPU没有牢固绑定，导致vCPU在不同的物理核心间“前面”，缓存命中率一糊涂。lt；!-- 在libvirt XML中配置CPU pinning --gt；lt；vcpuplacement='static'gt；4lt；/vcpugt；lt；cpu mode='host-passthrough'gt；lt；topology sockets='1' cores='2' 线程='2'/gt； lt；numagt； lt；cell id='0' cpus='0-3' memory='4194304'/gt； lt；/numagt；lt；/cpugt；登录后复制

当然，host-passthrough模式可以让虚拟机看到一台机器CPU的全部特性，性能最好，但代价是迁移惯会确定。对于通用场景，host-model是一个不错的折衷。NUMA感知：如果你的机器是NUMA架构，一定要让虚拟机也加载到NUMA。将虚拟机的内存和CPU都分配到同一个NUMA节点上，可以大幅减少内存访问延迟。这是一个被忽略但影响巨大的点。

2. 内存管理：既要够用，又要大页内存（HugePages）：传统4KB的内存页在大量内存访问时会导致TLB（Translation Lookaside Buffer）失效，增加开支。使用2MB或1GB的大页内存，可以显着减少TLB未命中率，提升内存访问性能。我在部署数据库或高性能任务的VM时，这是必选项。随机机配置：echo 2048 gt； /proc/sys/vm/nr_hugepages (分配2048个2MB大页)虚拟机XML配置：lt；内存单元='KiB'gt；8388608lt；/memorygt；lt；current内存单元='KiB'gt；8388608lt；/currentMemorygt；lt；seclabel type='dynamic' model='selinux' relabel='yes'gt； lt；labelgt；system_u：system_r：svirt_t：s0：c100，c200lt；/labelgt；lt；/seclabelgt；lt；memoryBackinggt； lt；hugepages/gt；lt；/memoryBackinggt；登录后复制内存气球（Ballooning）：虽然它能动态回收空闲内存，但过度使用或配置不当，可能会导致性能波动甚至OOM。我个人倾向于给关键VM分配固定内存，或者字符串使用气球，并设置好。

3. 存储I/O：速度的峰值，往往在这里选择合适的存储存储：本地SSD/NVMe：无疑是性能最佳的选择，尤其是配合virtio-scsi和raw格式的磁盘镜像。网络存储（NFS，iSCSI，Ceph）：性能受网络带宽和存储系统本身影响很大。优化网络和集群存储是关键。磁盘镜像格式：raw：性能最好，因为没有其他的格式读写，直接映射到高层存储。qcow2：快照、压缩等高级特性，但性能略低于raw。如果不需要这些特性，尽量用raw。I/O调度器：前置机上的I/O调度器选择也很关键。对于SSD来说，noop或mq-deadline通常是最好的选择，因为SSD本身有自己的内部调度。对于机械硬盘，deadline或bfq可能更合适。存储策略：支持QEMU的硬盘模式（cache=none，writethrough， writeback）对性能影响巨大。cache=none：直接I/O，不经过操作机文件系统存储，性能最好且数据安全，但要求操作机有硬件RAID或可靠的存储。cache=writeback：性能高，但有数据丢失风险（随后机掉电）。cache=writethrough：写入性能差，但数据安全性高。我通常会选择cache=none，配备底层存储的硬件硬盘。Virtio-blk vs Virtio-scsi： virtio-scsi 通常比 virtio-blk 更先进，支持更多的 SCSI 命令和特性，例如 UNMAP（TRIM），在大规模部署和高级存储功能上更具优势。

4. 网络优化：畅通无阻是前提Virtio-net：KVM网络性能的基础，一定要使用它而不是模拟的e1000或rtl8139。

多队列 (Multi-queue Virtio-net)：针对高负载网络负载，启用多队列可以将网络中断处理分散到多个vCPU上，避免单个vCPU成为瓶颈。lt；!-- 在libvirt XML中配置多队列 --gt；lt；接口类型='bridge'gt； lt；mac地址='52：54：00：xx：xx：xx'/gt； lt；源桥='br0'/gt； lt；model type='virtio'/gt； lt；driver name='vhost'queues='4'/gt； lt；!--配置4个队列 --gt；lt；/interfacegt；登录后复制超时卸载（Offloading）：确认虚拟机内部的超时卸载功能（TSO，GSO，LRO）是开启的，这能够将一些网络处理任务拓扑硬件完成，增强CPU负担。如果对网络性能有极限要求，并且阻塞支持，SR-IOV允许虚拟机直接访问物理缓存的虚拟功能（VF），几乎达到裸机性能。但会增加管理复杂性，且失去动态迁移能力。KVM虚拟机CPU性能瓶颈如何识别与解决？

识别KVM虚拟机CPU性能上限，我通常会从动作机和虚拟机内部两个层面去观察。这就像医生诊断病人，得内外兼顾。

在动作机上，我会用virt-top或tophtop来查看整体CPU使用情况，特别是关注us（用户空间）、sy（内核空间）和wa（I/O等待）。如果sy的话，可能意味着大量的系统调用或上下文切换，这可能是CPU调度或I/O瓶颈的信号。virt-top可以直接显示每个个虚拟机的CPU利用率，非常可观。如果某个VM的CPU使用率长期居高不下，那它就是重点关注对象。

进入虚拟机内部，top、htop、mpstat、vmstat都是我常用的工具。mpstat -P 全部1 可以查看每个vCPU的利用率，如果某个vCPU总是跑满，而vCPU空闲，那可能就是应用没有充分利用多核，调度或者不均。perf工具也能提供更协调的CPU事件分析，比如缓存命中率、分支预测错误等，但通常需要其他更深入的性能分析知识。

解决CPU调度的策略：CPU Pinning重新强调：很多时候，CPU性能问题并不是因为vCPU数量不够，而是vCPU在接下来的机器物理核心上“乱跑”。将vCPU绑定到特定的物理核心，尤其是NUMA相关的核心上，能极大提升缓存命中率和内存访问效率。这就像给高速公路上的车辆规划了专用车道，避免了拥堵。调整vCPU数量：并不是越多越好。过多的vCPU可能会导致一台机器调度器开销增加。根据应用的实际需求来分配，例如，如果应用是单线程的，再给它分配多vCPU也无济于事，反而可能浪费资源。CPU模式的选择： host-passthrough模式可以让VM看到接下来机器CPU的全部特性，包括一些性能指令集（如AVX），这对于计算密集型应用至关重要。如果应用对CPU指令集有特定要求，host-passthrough是最好的。避免CPU超配过度：过度超配（即分配给所有VM的vCPU总数远大于对应机器核心数）会导致严重的CPU争抢，性能会随之下降。我通常会根据一台机器CPU的实际决定负载和VM物理分配的重要性，来超配。

对于生产环境，我倾向于保留一些。其次机CPU频率管理：保证机器的CPU工作在高性能模式，而不是节能模式。检查cpufreq-info或/sys/devices/system/cpu/cpu*/cpufreq/scaling_governor，确保其设置为性能。Linux虚拟机存储I/O性能优化的核心策略有哪些？

存储I/O，这是KVM虚拟机性能调优里最容易出问题，也是最能优化效果的地方。它体现了核心策略，我认为主要围绕“高效中间间隔、利用接口、优化存储策略”这三点展开。存储介质的选择：这是基础。SSD（特别是NVMe）相对于传统HDD，性能提升是数量级的。如果预算允许，并且对I/O性能有要求，直接上SSD是投入总量比最高的。我个人经验是，很多时候，更换存储介质比花大量时间在软件层面调优更有效。磁盘镜像格式与接口：raw格式 vs qcow2：我前面提过，raw格式是裸设备映射，没有文件格式解析的头部，性能最好。qcow2虽然功能多，但额外的系统和元数据操作会带来硬盘传输。如果不需要快照、克隆等高级功能，或者存储队列本身就提供了这些功能（比如LVM快照），那就用raw。virtio-scsi vs virtio-blk： virtio-scsi是更现代的虚拟化存储接口，它支持更多的SCSI命令，例如UNMAP（TRIM），这对于SSD非常重要，可以帮助SSD恢复空间，保持性能。在支持的情况下，我总是优先选择virtio-scsi。它也更好地支持多队列I/O。QEMU存储模式的权衡：cache=none：这是我最常用的模式，特别是底层存储本身就带有可靠的存储（如硬件RAID卡带BBU的存储，或者企业级存储阵列）。它避免了一个机文件系统存储的双重存储问题，直接将I/O请求传递给底层存储，性能高且数据安全性有保障。cache=writeback：性能看起来最好，因为此时写入操作先存储到磁盘内存，然后自动写入磁盘。但如果此时机器意外断电，未写入磁盘的数据就会丢失。除非是对数据安全性要求极低，否则不建议在生产环境使用。cache=writethrough：写入操作必须先写入磁盘再返回成功，所以写入性能差。但数据安全性比writeback高。选择哪种模式，取决于你对数据安全性、持久性和性能的综合考量。其次机I/O调度器：首先机内核的I/O调度器对虚拟机性能也有直接影响。对于SSD，我通常会设置为noop或mq-deadline。noop是最简单的，不做任何调度，直接将请求发送给设备。mq-deadline是多队列版本的deadline，为NVMe等高性能设备设计。对于机械硬盘，deadline或bfq可能更适合，他们会尝试优化请求顺序，寻找减少时间道。可以通过cat /sys/block/sdX/queue/scheduler查看当前设置，echo noop gt； /sys/block/sdX/queue/scheduler进行。文件系统优化：一个机上用于存储虚拟机磁盘分区的文件系统，挂载选项也可以很重要。例如，对于ext4，考虑noatime或nodiratime来减少多余的元数据读取。对于XFS来说，它在处理大文件和高字符串I/O方面表现出色。

KVM虚拟机网络吞吐量低？这些配置你可能会忽略！

网络性能在虚拟化环境中普遍被重视，但它对应用的响应速度和数据传输效率至关重要。如果KVM虚拟机网络吞吐量低，除了另外一个机物理喷雾和交换机的问题，我发现很多时候是以下这些虚拟机内部和QEMU/KVM配置被忽略了。确认使用Virtio-net：这是最基础也是最重要的。如果你还在用e1000或rtl8139这种模拟中断，那网络性能低是必然的。virtio-net是半虚拟化驱动，它与KVM/QEMU hypervisor直接通信，大大减少了虚拟化开销。在libvirt XML中，确保model type='virtio'。启用多队列Virtio-net：对于高并发网络负载，单队列的Virtio-net可能会成为瓶颈，因为所有网络中断都集中在一个vCPU上处理。启用多队列后，可以将网络中断处理分散到多个vCPU上，显着提升网络吞吐量，尤其是在多核处理器上。接着机侧：QEMU/libvirt配置队列='N'（N为队列数，通常设置为vCPU数量或减少）。虚拟机内部：检查ethtool -l网卡卸载（Offloading）配置：现代网卡支持多种硬件卸载功能，如TCP分段卸载（TSO）、通用分段卸载（GSO）、大接收卸载（LRO）等。这些功能一些功能将网络协议栈的处理任务从CPU转移到拓扑硬件上，可以显着降低CPU利用率，提高网络带宽。在虚拟机内部，使用ethtool -k eth0查看当前卸载状态，并用ethtool -K eth0 tso on gso on lro on等命令开启。通常，Virtio-net驱动默认会开启这些功能，但偶尔也需要手动检查。后续机网络桥接优化：如果动作机使用Linux网桥，确保桥接配置是高效的。例如，避免不必要的stp（生成树协议）开启，因为它会引入延迟。对于性能情况，我更倾向于使用Open vSwitch (OVS)或直接的SR-IOV。SR-IOV直通：最高性能的选择：当你对网络性能有近乎裸机的要求时，SR-IOV（Single Root I/O）虚拟化）是最佳选择。允许虚拟机直接访问物理缓存的虚拟功能（VF），绕过了右边的机网络栈和虚拟交换机。这可以提供非常低的延迟和接近物理缓存的吞吐量。但需要注意的是，SR-IOV会增加管理复杂性，且会损失虚拟机的动态迁移能力。它适用于那些对网络性能极其敏感的应用，比如对NFV或高性能计算。超高帧（Jumbo Frames）：如果你的网络环境（包括物理交换机和所有涉及的设备）都支持重型帧（MTU大于1500字节，通常是9000字节），启用它可以减少每个数据包的开销，提高有效的废水，从而提升网络吞吐量。但任何一个队列不支持，都会导致通信问题。这是一个需要全链路协调的优化。右边机网络栈参数调整：接下来机的一些sysctl参数，如net.core.rmem_max、net.core.wmem_max、net.ipv4.tcp_mem等，可能需要根据网络负载进行调整，以优化TCP拓扑大小和网络吞吐量。但这些调整需要带宽，不当的配置可能会导致反效果。

以上就是Linux虚拟机性能如何调优？_LinuxKVM资源管理实践的详细内容，更多请关注乐哥常识网其他文章相关！

Linux虚拟机性能

七夕是今年的那一天七夕节是今年的哪一天