V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Weakdancer
V2EX  ›  正则表达式

分享关于 URL 正则识别以及 URL 的可读写性的经验和体会

  •  
  •   Weakdancer · 2014-02-15 02:00:49 +08:00 · 2075 次点击
    这是一个创建于 3925 天前的主题,其中的信息可能已经有所发展或是发生改变。
    关于URL正则匹配的问题是个普遍问题。可以找到大量的例子,我从我自己的网站出发来分享一下关于正则的体会。
    首先是一个例子:
    http://www.rubular.com/r/YlWJbzVANT

    可以看到这个正则主要是利用用户自觉的在URL末尾加空格或者换行来识别的。这个思路似乎和V2EX现在使用的思路相似。

    就像我这里 http://www.v2ex.com/t/99515#reply12 提到的一样,似乎是有一个问题存在的,我暂时不能很好的表述,只提供一个现状供大家参考:

    http://myswap.sinaapp.com/wd/URL%E5%8F%AF%E8%AF%BB%E5%86%99%E6%80%A7
    http://myswap.sinaapp.com/wd/URL可读写性

    URL的可读写性应该是非英语国家的人的共同问题吧。
    不知我现在的做法是不是提供了一种解决途径呢?
    4 条回复    1970-01-01 08:00:00 +08:00
    binux
        1
    binux  
       2014-02-15 02:31:54 +08:00
    URL又不是没有标准,标准又是正则文法的,为什么要再创造?

    http://myswap.sinaapp.com/wd/URL可读写性
    在不同的编码的页面中是不同的URL,href可不要用这个
    binux
        2
    binux  
       2014-02-15 02:38:05 +08:00
    记错,直接点击时path部分以utf8编码,query部分视浏览器不同
    http://www.w3help.org/zh-cn/causes/HD9001
    Weakdancer
        3
    Weakdancer  
    OP
       2014-02-15 03:06:28 +08:00
    @binux 谢谢提供资料。
    我的需求是在书写文章的时候可以避免遇到不能读写的字符。

    确实存在很多问题的。
    Weakdancer
        4
    Weakdancer  
    OP
       2014-02-15 03:10:04 +08:00
    @binux
    比如你写文章的时候是不是做了一些手动工作来让:
    http://zh.wikipedia.org/zh-cn/HTTP%E7%8A%B6%E6%80%81%E7%A0%81
    变成可读的呢?
    我是想节省掉这部分工作。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5530 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 06:45 · PVG 14:45 · LAX 22:45 · JFK 01:45
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.