看似很简单的问题, 但是单用程序貌似搞不定哦.
比如有个 url 是这样 https://www.google.com.sg/?gfe_rd=cr&ei=DhtXWc6FJ4Pj8wfH6pjQBw#newwindow=1&q=bigzhu
我要取出 domain, 也就是 google.com.sg, 那么用 python 很好搞定
from urlparse import urlparse
url = urlparse(url)
hostname = url.hostname
hostname 就是 www.google.com.sg
但是前缀 www 的剔除就没法准确的实现了, 我只要 google.com.sg
前缀什么样的都有, 可能是 https://mail.google.com.sg/mail/u/0/#inbox
把第一个 . 前的内容直接剔除? 那如果输入的是 google.com.sg 那就出问题了.
小工具 pp 里要用到, 各位有什么优雅完美的办法么?