2009-09-22

    用nginx的反向代理做负载均衡 - [service]

    版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
    http://bbayou.blogbus.com/logs/46926694.html

    1. ngnix之所以比apache高效,得益于Nginx使用了最新的epoll(Linux 2.6内核)和kqueue(freebsd)网络I/O模型,而Apache则使用的是传统的select模型。目前Linux下能够承受高并发访问的 Squid、Memcached都采用的是epoll网络I/O模型。也就是说,在高并发服务器中,轮询(round-robin)I/O是最耗时间的操作。

    2. 反向代理工作原理
    反向代理服务器位于本地WEB服务器和Internet之间.
    当用户浏览器发出一个HTTP请求时,通过域名解析将请求定向到反向代理服务器(如果要实现多个WEB服务器的反向代理,需要将多个WEB服务 器的域名都指向反向代理服务器)。由反向代理服务器处理器请求。反向代理一般只缓存可缓冲的数据(比如html网页和图片等),而一些CGI脚本程序或者 ASP之类的程序不缓存。它根据从WEB服务器返回的HTTP头标记来缓冲静态页面。有四个最重要HTTP头标记:

    Last-Modified: 告诉反向代理页面什么时间被修改
    Expires: 告诉反向代理页面什么时间应该从缓冲区中删除
    Cache-Control: 告诉反向代理页面是否应该被缓冲
    Pragma: 告诉反向代理页面是否应该被缓冲.
    例如:在默认情况下,ASP页面返回” Cache-control: private.” ,所以ASP页面时不会在反向代理服务器缓存的。

    ----------------------------------------------------------------------------------

    3. ngnix最常见的用法之一就是作为反向代理使用,安装和配置相当简便,对于负载均衡它使用的是最简单的轮询算法(round-robin),不过效果还是很不错的。

    要用nginx做负载均衡的话,首先要在配置文件里面定义一组用来负载均衡的后端服务器(backend servers),例如:
    upstream backend {
      server 192.168.1.11;
      server 192.168.1.12;
      server 192.168.1.13;
    }

    那个server指令的语法是 server name [parameters],这里的name是服务器名,可以是域名、ip或者unix socket,也可以指定端口,例如:
    server 192.168.1.11:8080;

    server指令可用的参数有:

    weight —— 设置服务器的权重,默认值是1,权重值越大那么该服务器被访问到的几率就越大,例如 server 192.168.1.11 weight=5;

    max_fails和fail_timeout —— 这俩是关联的,如果某台服务器在fail_timeout时间内出现了max_fails次连接失败,那么nginx就会认为那个服务器已经挂掉,从而在 fail_timeout时间内不再去查询它,fail_timeout的默认值是10s,max_fails的默认值是1(这意味着一发生错误就认为服 务器挂掉),如果把max_fails设为0则表示把这个检查取消。
    举个例子:server 192.168.1.11 max_fails=3 fail_timeout=30s; 这表示,如果服务器192.168.1.11在30秒内出现了3次错误,那么就认为这个服务器工作不正常,从而在接下来的30秒内nginx不再去访问这个服务器。

    down —— 表示该服务器已经停用,例如server 192.168.1.11 down;

    backup —— 表示该服务器是备用服务器,只有其它后端服务器都挂了或者很忙才会访问到。

    关于upstream的更多信息请参考 http://wiki.nginx.org/NginxHttpUpstreamModule

    定义好了一组后端服务器,就该来设置nginx的反向代理配置了,例如:
    server {
      listen 80;
      server_name www.domain.com;
      location / {
        proxy_pass http://backend;
      }
    }

    关于nginx的proxy有很多配置参数的,具体可以参考 http://wiki.nginx.org/NginxHttpProxyModule
    这里有个配置可能比较有用:
    proxy_set_header Host $host;
    这表示传递给后端服务器的头部信息里面的Host信息保持跟客户端传过来的一致,如果不设置那么默认传给后端服务器的值是$proxy_host,所以不 设置可能会有问题,例如:后端服务器会处理两个域名的请求,例如www.a.com和www.b.com,这时如果nginx不把客户端的请求信息中的 host信息传给后端服务器,那么后端服务器完全不知道到底这个客户是想访问域名a还是域名b,从而导致传输数据可能不正确。
    如果你想把客户端的ip也传给后端服务器的话,可以用这个设置:
    proxy_set_header X-Real-IP $remote_addr;

    4. 负载均衡
    参考:http://blog.s135.com/nginx_php_v5/

    收藏到:Del.icio.us




    引用地址: