NGINX
NGINX Trac
3rd Party Modules
Security Advisories
CHANGES
OpenResty
ngx_lua
Tengine
在线学习资源
NGINX 开发从入门到精通
NGINX Modules
ngx_echo
tanteng
V2EX  ›  NGINX

如何在 nginx 用正则表达式提取内容?

  •  
  •   tanteng ·
    tanteng · Oct 9, 2016 · 4983 views
    This topic created in 3521 days ago, the information mentioned may be changed or developed.

    如我把本地浏览器 UA 改成了 Mozilla/5.0 (Windows NT 10.0; WOW64; rv:48.0) Gecko/20100101 Firefox/48.0 name 也就是在后面加个空格和 name

    在 nginx 的配置文件中,我想提取$http_user_agent 中最后这个加的 name

        if ($http_user_agent ~ (这里正则表达式) {
            set $user "$user";
        }
    

    这里正则表达式怎么写,或者如何提取$http_user_agent 的后面一个空格和空格后面的 name 呢? 求指教!

    Supplement 1  ·  Oct 10, 2016

    在http域中使用map正则匹配:

    map $http_user_agent $user {
        default            '';
        ~curl              curl;
        ~(?<name>[\S]+$)   $name;
    }
    

    在server中测试:

    location /hello {
        echo http_user_agent:$http_user_agent;
        echo user:$user;
    }
    
    

    使用 curl 请求,输出 curl 使用浏览器修改UA,在UA后面加空格和名字,如:

    Mozilla/5.0 (Windows NT 10.0; WOW64; rv:48.0) Gecko/20100101 Firefox/48.0 name ,输出 name

    要的就是这个效果。

    能捕捉这个name,可以做好多事情,如一台测试机可以支持多目录拉取网站代码,每个测试通过修改UA+自己名字,访问的是各自的目录。

    12 replies    2016-10-10 14:29:22 +08:00
    tanteng
        1
    tanteng  
    OP
       Oct 9, 2016
    比如 Mozilla/5.0 (Windows NT 10.0; WOW64; rv:48.0) Gecko/20100101 Firefox/48.0 tanteng 这个 User-Agent ,用正则 /[ ]([\S]+)/ 可以匹配所有空格+非空格内容,这样会匹配到多个内容,但是 nginx 里怎么取出匹配到的最后一个。
    qq286735628
        2
    qq286735628  
       Oct 9, 2016   ❤️ 1
    /[\S]+$/
    查找结尾处非空白字符
    qq286735628
        3
    qq286735628  
       Oct 9, 2016
    推荐个学习正则的网站
    https://www.debuggex.com/
    honk
        4
    honk  
       Oct 9, 2016 via Android
    不要直接加 name ,换成 username/xxx , xxx 就是动态的 name
    yangg
        5
    yangg  
       Oct 9, 2016   ❤️ 1
    location /echo {
    set $user '';
    if ($http_user_agent ~ (?<user>\S+)$ ) {
    set $user "$user";
    }
    return 200 $user;
    }
    nopicsayjb
        6
    nopicsayjb  
       Oct 9, 2016
    下面代码,已测试通过。:)
    if ($http_user_agent ~* "\b(?'baobao'\S\w+$)") {
    set $user "$baobao";
    }
    nopicsayjb
        7
    nopicsayjb  
       Oct 9, 2016   ❤️ 1
    再测试一遍。成功, LZ 可以测试下
    if ($http_user_agent ~* "\b(?'baobao'\S\w+)$") {
    set $user "$baobao";
    }
    lhbc
        8
    lhbc  
       Oct 9, 2016   ❤️ 1
    楼主你这个需求强烈建议用 map 指令,不要用 if
    ryd994
        9
    ryd994  
       Oct 10, 2016 via Android   ❤️ 1
    if 会降低性能并导致各种奇奇怪怪的问题
    用 map
    tanteng
        10
    tanteng  
    OP
       Oct 10, 2016
    map 形式怎么写
    ```
    map $http_user_agent $user {
    default '';
    ~curl curl;
    ~[\S]+$ $user;
    }
    ```

    这样只能匹配 curl ,用浏览器就直接 nginx 挂了
    tanteng
        11
    tanteng  
    OP
       Oct 10, 2016
    @tanteng 我这样写,通过浏览器进来的就直接挂了,但 curl 方式是 OK 的,[alert] 804#804: worker process 5083 exited on signal 11
    tanteng
        12
    tanteng  
    OP
       Oct 10, 2016
    找到解决方法了,对 nginx 不太熟悉,现在 OK 了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5837 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 74ms · UTC 06:39 · PVG 14:39 · LAX 23:39 · JFK 02:39
    ♥ Do have faith in what you're doing.