pyversion=2.7.16 在给 hexo 博客写备份所有图片的脚本,由于发布的文章标题时常会有中文、英文、中英混杂的情况,而 hexo 博客文章的链接直接由时间和标题生成因而带了部分的中文。这种链接肯定要做处理。 查了一下别人用 urllib.parse.quote(url, safe=":/=?#")来处理字符串中部分的中文 但是莫名奇妙地报了如题的错
于是改用正则 patt=re.compile('([\u4e00-\u9fa5]*?)') res=re.search(patt,posturl).group(1)
结果发现匹配不到,想不明白哪里错了...
只能过来求助 v 友了,求个解决方案
1
GoLand 2019-03-11 19:35:59 +08:00
```python
import urlparse urlparse.urlparse(xxx) ``` |
2
Arnie97 2019-03-12 00:36:24 +08:00 via Android
因为别人用的是 Python 3,这个改名了
|