Nginx

1.什么是Nginx

Nginx是一个轻量级/高性能的反向代理Web服务器,它实现非常高效的反向代理、负载平衡,可以处理2-3万并发连接数,官方监测能支持5万并发,现在中国使用nginx网站用户有很多,例如:新浪、网易、 腾讯等。

2.优缺点

优点: 跨平台、配置简单。 可实现http服务器、虚拟主机、方向代理、负载均衡。可以不暴露正式的服务器IP地址。 高并发连接:处理2-3万并发连接数,官方监测能支持5万并发。 内存消耗小:开启10个nginx才占150M内存 ,nginx处理静态文件好,耗费内存少。 而且Nginx内置的健康检查功能:如果有一个服务器宕机,会做一个健康检查,再发送的请求就不会发送到宕机的服务器了。重新将请求提交到其他的节点上。 节省宽带:支持GZIP压缩,可以添加浏览器本地缓存。 稳定性高:宕机的概率非常小。 接收用户请求是异步的。

缺点: 动态处理差:nginx处理静态文件好,耗费内存少,但是处理动态页面则很鸡肋,现在一般前端用nginx作为反向代理抗住压力。

3.为什么Nginx性能这么高?

因为它的事件处理机制,异步非阻塞事件处理机制,运用了epoll模型,提供了一个队列,排队解决。

4.Nginx怎么处理请求的?

nginx接收一个请求后,首先由listen和server_name指令匹配server模块,再匹配server模块里的location,location就是实际地址。

server {                            # 第一个Server区块开始,表示一个独立的虚拟主机站点
    listen       80;                      # 提供服务的端口,默认80
    server_name  localhost;            # 提供服务的域名主机名
    location / {                        # 第一个location区块开始
        root   html;               # 站点的根目录,相当于Nginx的安装目录
        index  index.html index.htm;        # 默认的首页文件,多个用空格分开
    }                          # 第一个location区块结束
}

5.反向代理

反方代理就是请求统一被Nginx接收,nginx反向代理服务器接收到之后,按照一定的规则分发给了后端的业务处理服务器进行处理了。 反向代理服务器可以隐藏源服务器的存在和特征。它充当互联网云和web服务器之间的中间层。这对于安全方面来说是很好的,特别是当您使用web托管服务时。

http下配置upstream

upstream zh_servers{
    server 172.21.111.18:21000;
}

http/server/location下配置proxy_pass

location / {
	root   html;
	index  index.html index.htm;
	proxy_pass http://zh_servers;
}

6.Nginx应用场景

http服务器。Nginx是一个http服务可以独立提供http服务。可以做网页静态服务器。 虚拟主机。可以实现在一台服务器虚拟出多个网站,例如个人网站使用的虚拟机。 反向代理,负载均衡。当网站的访问量达到一定程度后,单台服务器不能满足用户的请求时,需要用多台服务器集群可以使用nginx做反向代理。并且多台服务器可以平均分担负载,不会应为某台服务器负载高宕机而某台服务器闲置的情况。 配置安全管理、比如可以使用Nginx搭建API接口网关,对每个接口服务进行拦截。

7.Nginx目录结构有哪些?

[root@localhost ~]# tree /usr/local/nginx
/usr/local/nginx
├── client_body_temp
├── conf                             # Nginx所有配置文件的目录
│   ├── fastcgi.conf                 # fastcgi相关参数的配置文件
│   ├── fastcgi.conf.default         # fastcgi.conf的原始备份文件
│   ├── fastcgi_params               # fastcgi的参数文件
│   ├── fastcgi_params.default       
│   ├── koi-utf
│   ├── koi-win
│   ├── mime.types                   # 媒体类型
│   ├── mime.types.default
│   ├── nginx.conf                   # Nginx主配置文件
│   ├── nginx.conf.default
│   ├── scgi_params                  # scgi相关参数文件
│   ├── scgi_params.default  
│   ├── uwsgi_params                 # uwsgi相关参数文件
│   ├── uwsgi_params.default
│   └── win-utf
├── fastcgi_temp                     # fastcgi临时数据目录
├── html                             # Nginx默认站点目录
│   ├── 50x.html                     # 错误页面优雅替代显示文件,例如当出现502错误时会调用此页面
│   └── index.html                   # 默认的首页文件
├── logs                             # Nginx日志目录
│   ├── access.log                   # 访问日志文件
│   ├── error.log                    # 错误日志文件
│   └── nginx.pid                    # pid文件,Nginx进程启动后,会把所有进程的ID号写到此文件
├── proxy_temp                       # 临时目录
├── sbin                             # Nginx命令目录
│   └── nginx                        # Nginx的启动命令
├── scgi_temp                        # 临时目录
└── uwsgi_temp                       # 临时目录

8.Nginx配置文件nginx.conf有哪些属性模块

worker_processes  1;                            # worker进程的数量
events {                                          # 事件区块开始
    worker_connections  1024;                  # 每个worker进程支持的最大连接数
}                                           # 事件区块结束
http {                                       # HTTP区块开始
    include       mime.types;                     # Nginx支持的媒体类型库文件
    default_type  application/octet-stream;            # 默认的媒体类型
    sendfile        on;                       # 开启高效传输模式
    keepalive_timeout  65;                   # 连接超时
    server {                                    # 第一个Server区块开始,表示一个独立的虚拟主机站点
        listen       80;                          # 提供服务的端口,默认80
        server_name  localhost;                # 提供服务的域名主机名
        location / {                            # 第一个location区块开始
            root   html;                   # 站点的根目录,相当于Nginx的安装目录
            index  index.html index.htm;           # 默认的首页文件,多个用空格分开
        }                                  # 第一个location区块结果
        error_page   500502503504  /50x.html;          # 出现对应的http状态码时,使用50x.html回应客户
        location = /50x.html {                      # location区块开始,访问50x.html
            root   html;                              # 指定对应的站点目录为html
        }
    }  
    ......

9.Nginx静态资源

静态资源访问,就是存放在nginx的html页面,我们可以自己编写。

10.如何用Nginx解决前端跨域问题?

使用Nginx转发请求。把跨域的接口写成调本域的接口,然后将这些接口转发到真正的请求地址。

11.Nginx虚拟主机怎么配置

(1)基于域名的虚拟主机,通过域名来区分虚拟主机——应用:外部网站。 需要建立/data/www /data/bbs目录,windows本地hosts添加虚拟机ip地址对应的域名解析;对应域名网站目录下新增index.html文件。

#当客户端访问www.abc.com,监听端口号为80,直接跳转到data/www目录下文件
server {
    listen       80;
    server_name  www.abc.com;
    location / {
        root   data/www;
        index  index.html index.htm;
    }
}

#当客户端访问www.abc.com,监听端口号为80,直接跳转到data/bbs目录下文件
server {
    listen       80;
    server_name  bbs.abc.com;
    location / {
        root   data/bbs;
        index  index.html index.htm;
    }
}

(2)基于端口的虚拟主机,通过端口来区分虚拟主机——应用:公司内部网站,外部网站的管理后台。 使用端口来区分,浏览器使用域名或ip地址:端口号 访问

#当客户端访问www.lijie.com,监听端口号为8080,直接跳转到data/www目录下文件
server {
    listen       8080;
    server_name  8080.lijie.com;
    location / {
        root   data/www;
        index  index.html index.htm;
    }
}

#当客户端访问www.lijie.com,监听端口号为80直接跳转到真实ip服务器地址 127.0.0.1:8080
server {
    listen       80;
    server_name  www.lijie.com;
    location / {
    proxy_pass http://127.0.0.1:8080;
            index  index.html index.htm;
    }
}

(3)基于ip的虚拟主机。

12.location的作用是什么?

location指令的作用是根据用户请求的URI来执行不同的应用,也就是根据用户请求的网站URL进行匹配,匹配成功即进行相关的操作。 注意:~ 代表自己输入的英文字母

匹配符     匹配规则        优先级
=          精确匹配        1
^~         以某字符串开头  2
~          区分大小写的正则匹配   3
~*         不区分大小写的正则匹配   4
!~         区分大小写的不匹配的正则   5
!~*        不区分大小写的不匹配的正则   6
/           通用匹配,任何请求都匹配到   7

Location正则案例

#优先级1,精确匹配,根路径
location =/ {
    return 400;
}

#优先级2,以某个字符串开头,以av开头的,优先匹配这里,区分大小写
location ^~ /av {
   root /data/av/;
}

#优先级3,区分大小写的正则匹配,匹配/media*****路径
location ~ /media {
      alias /data/static/;
}

#优先级4 ,不区分大小写的正则匹配,所有的****.jpg|gif|png 都走这里
location ~* .*\.(jpg|gif|png|js|css)$ {
   root  /data/av/;
}

#优先7,通用匹配
location / {
    return 403;
}

13.限流怎么做的?

Nginx限流就是限制用户请求速度,防止服务器受不了。Nginx的限流都是基于漏桶算法。

限流有3种: 正常限制访问频率(正常流量)。 突发限制访问频率(突发流量)。 限制并发连接数。

(1)正常限制访问频率(正常流量):

限制一个用户发送的请求,Nginx多久接收一个请求。 Nginx中使用ngx_http_limit_req_module模块来限制的访问频率,限制的原理实质是基于漏桶算法原理来实现的。 在nginx.conf配置文件中可以使用limit_req_zone命令及limit_req命令限制单个IP的请求处理频率。 1r/s代表1秒一个请求,1r/m一分钟接收一个请求, 如果Nginx这时还有别人的请求没有处理完,Nginx就会拒绝处理该用户请求。

#定义限流维度,一个用户一分钟一个请求进来,多余的全部漏掉
limit_req_zone $binary_remote_addr zone=one:10m rate=1r/m;

#绑定限流维度
server{

    location /seckill.html{
        limit_req zone=one;    
        proxy_pass http://lj_seckill;
    }

}

(2)突发限制访问频率(突发流量):

限制一个用户发送的请求,Nginx多久接收一个。上面的配置一定程度可以限制访问频率,但是也存在着一个问题:如果突发流量超出请求被拒绝处理,无法处理活动时候的突发流量。 Nginx提供burst参数结合nodelay参数可以解决流量突发的问题,可以设置能处理的超过设置的请求数外能额外处理的请求数。我们可以将之前的例子添加burst参数以及nodelay参数。 为什么就多了一个 burst=5 nodelay; 呢,多了这个可以代表Nginx对于一个用户的请求会立即处理前五个,多余的就慢慢来,没有其他用户的请求就处理你的,有其他的请求的话我Nginx就漏掉不接受你的请求。

#定义限流维度,一个用户一分钟一个请求进来,多余的全部漏掉
limit_req_zone $binary_remote_addr zone=one:10m rate=1r/m;

#绑定限流维度
server{

    location /seckill.html{
        limit_req zone=one burst=5 nodelay;
        proxy_pass http://lj_seckill;
    }

}

(3)限制并发连接数

Nginx中的ngx_http_limit_conn_module模块提供了限制并发连接数的功能,可以使用limit_conn_zone指令以及limit_conn执行进行配置。 上面配置了单个IP同时并发连接数最多只能10个连接,并且设置了整个虚拟服务器同时最大并发数最多只能100个链接。当然,只有当请求的header被服务器处理后,虚拟服务器的连接数才会计数。

http {
limit_conn_zone $binary_remote_addr zone=myip:10m;
limit_conn_zone $server_name zone=myServerName:10m;
}

server {
    location / {
        limit_conn myip 10;
        limit_conn myServerName 100;
        rewrite / http://www.lijie.net permanent;
    }
}

14.漏桶流算法和令牌桶算法

(1)漏桶算法

漏桶算法是网络世界中流量整形或速率限制时经常使用的一种算法,它的主要目的是控制数据注入到网络的速率,平滑网络上的突发流量。漏桶算法提供了一种机制,通过它,突发流量可以被整形以便为网络提供一个稳定的流量。 也就是我们刚才所讲的情况。漏桶算法提供的机制实际上就是刚才的案例:突发流量会进入到一个漏桶,漏桶会按照我们定义的速率依次处理请求,如果水流过大也就是突发流量过大就会直接溢出,则多余的请求会被拒绝。所以漏桶算法能控制数据的传输速率。

(2)令牌桶算法

令牌桶算法是网络流量整形和速率限制中最常使用的一种算法。典型情况下,令牌桶算法用来控制发送到网络上的数据的数目,并允许突发数据的发送。Google开源项目Guava中的RateLimiter使用的就是令牌桶控制算法。 令牌桶算法的机制如下:存在一个大小固定的令牌桶,会以恒定的速率源源不断产生令牌。如果令牌消耗速率小于生产令牌的速度,令牌就会一直产生直至装满整个令牌桶。

15.为什么要做动静分离

Nginx是当下最热的Web容器,网站优化的重要点在于静态化网站,网站静态化的关键点则是是动静分离,动静分离是让动态网站里的动态网页根据一定规则把不变的资源和经常变的资源区分开来,动静资源做好了拆分以后,我们则根据静态资源的特点将其做缓存操作。 让静态的资源只走静态资源服务器,动态的走动态的服务器。Nginx的静态处理能力很强,但是动态处理能力不足,因此,在企业中常用动静分离技术。 对于静态资源比如图片,js,css等文件,我们则在反向代理服务器nginx中进行缓存。这样浏览器在请求一个静态资源时,代理服务器nginx就可以直接处理,无需将请求转发给后端服务器tomcat。 若用户请求的动态文件,比如servlet,jsp则转发给Tomcat服务器处理,从而实现动静分离。这也是反向代理服务器的一个重要的作用。 只需要指定路径对应的目录。location/可以使用正则表达式匹配。并指定对应的硬盘中的目录。

location /image/ {
    root   /usr/local/static/;
    autoindex on;
}

// 创建目录,进入目录
mkdir /usr/local/static/image
// 进入目录
cd  /usr/local/static/image
// 放一张照片上去
cp 1.jgp .
// 重启 nginx
sudo nginx -s reload

15.Nginx负载均衡的算法怎么实现的?策略有哪些?

为了避免服务器崩溃,大家会通过负载均衡的方式来分担服务器压力。将对台服务器组成一个集群,当用户访问时,先访问到一个转发服务器,再由转发服务器将访问分发到压力更小的服务器。 Nginx负载均衡实现的策略有以下五种:

(1)轮询(默认):每个请求按时间顺序逐一分配到不同的后端服务器,如果后端某个服务器宕机,能自动剔除故障系统。

upstream backserver { 
 server 192.168.0.12; 
 server 192.168.0.13; 
} 

(2)权重weight:weight的值越大分配到的访问概率越高,主要用于后端每台服务器性能不均衡的情况下。其次是为在主从的情况下设置不同的权值,达到合理有效的地利用主机资源。权重越高,在被访问的概率越大,如下例,分别是20%,80%。

upstream backserver { 
 server 192.168.0.12 weight=2; 
 server 192.168.0.13 weight=8; 
}

(3)ip_hash(IP绑定):每个请求按访问IP的哈希结果分配,使来自同一个IP的访客固定访问一台后端服务器,并且可以有效解决动态网页存在的session共享问题

upstream backserver { 
 ip_hash; 
 server 192.168.0.12:88; 
 server 192.168.0.13:80; 
}

(4)fair(第三方插件):必须安装upstream_fair模块。对比weight、ip_hash更加智能的负载均衡算法,fair算法可以根据页面大小和加载时间长短智能地进行负载均衡,响应时间短的优先分配。哪个服务器的响应速度快,就将请求分配到那个服务器上。

upstream backserver { 
 server server1; 
 server server2; 
 fair; 
} 

(5)url_hash(第三方插件):必须安装Nginx的hash软件包。按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,可以进一步提高后端缓存服务器的效率。

upstream backserver { 
 server squid1:3128; 
 server squid2:3128; 
 hash $request_uri; 
 hash_method crc32; 
}

(6)最少连接

upstream bck_testing_01 {
  least_conn;

  # with default weight for all (weight=1)
  server 192.168.250.220:8080
  server 192.168.250.221:8080
  server 192.168.250.222:8080
}

(7)加权最少连接

upstream bck_testing_01 {
  least_conn;
  
  server 192.168.250.220:8080   weight=3
  server 192.168.250.221:8080              # default weight=1
  server 192.168.250.222:8080              # default weight=1
}

16.Nginx配置高可用性怎么配置?

当上游服务器(真实访问服务器),一旦出现故障或者是没有及时响应的话,应该直接轮训到下一台服务器,保证服务器的高可用。Nginx配置代码:

server {
    listen       80;
    server_name  www.abc.com;
    location / {
        ### 指定上游服务器负载均衡服务器
        proxy_pass http://backServer;
        ###nginx与上游服务器(真实访问的服务器)超时时间 后端服务器连接的超时时间_发起握手等候响应超时时间
        proxy_connect_timeout 1s;
        ###nginx发送给上游服务器(真实访问的服务器)超时时间
        proxy_send_timeout 1s;
        ### nginx接受上游服务器(真实访问的服务器)超时时间
        proxy_read_timeout 1s;
        index  index.html index.htm;
    }
}

17.Nginx怎么判断个别IP不可访问?

# 如果访问的ip地址为192.168.9.115,则返回403
if  ($remote_addr = 192.168.9.115) {  
     return 403;  
}

18.怎么限制浏览器访问?

## 不允许谷歌浏览器访问 如果是谷歌浏览器返回500
if ($http_user_agent ~ Chrome) {   
    return 500;  
}

19.全局变量

$remote_addr		    // 获取客户端ip
$binary_remote_addr	    // 客户端ip(二进制)
$remote_port		    // 客户端port,如:50472
$remote_user		    // 已经经过Auth Basic Module验证的用户名
$host			        // 请求主机头字段,否则为服务器名称,如:blog.sakmon.com
$request		        // 用户请求信息,如:GET ?a=1&b=2 HTTP/1.1
$request_filename   	// 当前请求的文件的路径名,由root或alias和URI request组合而成,如:/2013/81.html
$status			        // 请求的响应状态码,如:200
$body_bytes_sent        // 响应时送出的body字节数数量。即使连接中断,这个数据也是精确的,如:40
$content_length	        // 等于请求行的“Content_Length”的值
$content_type	        // 等于请求行的“Content_Type”的值
$http_referer	        // 引用地址
$http_user_agent        // 客户端agent信息,如:Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.76 Safari/537.36
$args		            // 与$query_string相同 等于当中URL的参数(GET),如a=1&b=2
$document_uri	        // 与$uri相同  这个变量指当前的请求URI,不包括任何参数(见$args) 如:/2013/81.html
$document_root	        // 针对当前请求的根路径设置值
$hostname	            // 如:centos53.localdomain
$http_cookie	        // 客户端cookie信息
$cookie_COOKIE	        // cookie COOKIE变量的值
$is_args	            // 如果有$args参数,这个变量等于”?”,否则等于”",空值,如?
$limit_rate	            // 这个变量可以限制连接速率,0表示不限速
$query_string	        // 与$args相同 等于当中URL的参数(GET),如a=1&b=2
$request_body	        // 记录POST过来的数据信息
$request_body_file	    // 客户端请求主体信息的临时文件名
$request_method	        // 客户端请求的动作,通常为GET或POST,如:GET
$request_uri	        // 包含请求参数的原始URI,不包含主机名,如:/2013/81.html?a=1&b=2
$scheme		            // HTTP方法(如http,https),如:http
$uri			        // 这个变量指当前的请求URI,不包括任何参数(见$args) 如:/2013/81.html
$request_completion	    // 如果请求结束,设置为OK. 当请求未结束或如果该请求不是请求链串的最后一个时,为空(Empty),如:OK
$server_protocol	    // 请求使用的协议,通常是HTTP/1.0或HTTP/1.1,如:HTTP/1.1
$server_addr		    // 服务器IP地址,在完成一次系统调用后可以确定这个值
$server_name		    // 服务器名称,如:blog.sakmon.com
$server_port		    // 请求到达服务器的端口号,如:80

20.常用命令

nginx -s stop       快速关闭Nginx,可能不保存相关信息,并迅速终止web服务。
nginx -s quit       平稳关闭Nginx,保存相关信息,有安排的结束web服务。
nginx -s reload     因改变了Nginx相关配置,需要重新加载配置而重载。
nginx -s reopen     重新打开日志文件。
nginx -c filename   为 Nginx 指定一个配置文件,来代替缺省的。
nginx -t            不运行,仅仅测试配置文件。nginx 将检查配置文件的语法的正确性,并尝试打开配置文件中所引用到的文件。
nginx -v            显示 nginx 的版本。
nginx -V            显示 nginx 的版本,编译器版本和配置参数。

startup.bat脚本:

@echo off
rem 如果启动前已经启动nginx并记录下pid文件,会kill指定进程
nginx.exe -s stop

rem 测试配置文件语法正确性
nginx.exe -t -c conf/nginx.conf

rem 显示版本信息
nginx.exe -v

rem 按照指定配置去启动nginx
nginx.exe -c conf/nginx.conf

N.参考

(1)Nginx教程

(2)Nginx官网