负载均衡原理通俗讲

你去吃过火锅吗？高峰期店里坐满了人，门口站着好几个服务员。这时候新来的客人不会全挤在一个服务员那儿，而是被均匀分到每个人手上——谁手头空，就交给谁。这其实就是负载均衡最朴素的样子。

什么是负载均衡？

在软件系统里，负载均衡干的事儿和那群服务员差不多。当大量用户同时访问一个网站或应用时，不可能只靠一台服务器扛下来。于是我们用多台服务器一起工作，而负载均衡器就站在这堆服务器前面，决定把每个请求发给哪一台。

比如你在双十一抢购商品，一瞬间几百万人都点“下单”，如果没有负载均衡，所有请求可能都涌向同一台服务器，它立马就瘫了。但有了负载均衡，请求会被合理分散，每台机器只处理一部分，整个系统就能稳稳撑住高峰流量。

常见的几种分配方式

负载均衡不是随便分的，它有几种常用策略：

轮询（Round Robin）：最简单的办法，挨个来。第一个请求给服务器A，第二个给B，第三个再回A，像发牌一样循环下去。

加权轮询：有些服务器配置高跑得快，有些老旧跑得慢。那就给它们设权重，好比A机器力气大，分6个活；B机器弱一点，只分3个。按比例分配更公平。

最少连接：哪个服务器正在处理的请求最少，就把新请求给它。就像收银台前排队，你肯定会选人少的那一列。

IP哈希：根据用户的IP地址算出一个值，固定分配到某台服务器。这样同一个用户每次都会落到同一台机器上，适合需要记住登录状态的场景。

实际部署中的样子

在真实环境中，负载均衡通常由专门的软件或硬件实现。比如Nginx就是常用的反向代理兼负载均衡工具。它的配置看起来像这样：

upstream backend {
    server 192.168.0.10:8080 weight=3;
    server 192.168.0.11:8080 weight=2;
    server 192.168.0.12:8080;
}

server {
    listen 80;
    location / {
        proxy_pass http://backend;
    }
}

这段配置定义了一个叫backend的服务组，三台服务器按权重分摊请求。Nginx作为入口接收所有访问，然后按规则转发出去。

不只是分请求

现代负载均衡还能做更多事。比如定期检查后端服务器是否还活着，如果某台宕机了，就自动把它剔除，不让请求再发过去。等它恢复了，又重新加入队伍。这种健康检查机制让系统更可靠。

还有些高级功能，像SSL卸载——把加密解密的工作交给负载均衡器来做，减轻后端压力；或者根据URL路径把请求导向不同服务，实现简单的路由控制。

小结一下

负载均衡的核心思想就是“别让一台累死，别的闲着”。它不复杂，本质是调度与协调。就像餐厅经理看哪位服务员空闲就安排新客人，系统通过负载均衡让资源利用更高效，响应更快，稳定性也更高。装软件时如果遇到高并发需求，加上一层负载均衡，往往能立竿见影地提升表现。

负载均衡原理通俗讲：像餐厅服务员分配客人一样简单（进阶教程）

什么是负载均衡？

常见的几种分配方式

实际部署中的样子

不只是分请求

小结一下