cai72738's recent timeline updates
cai72738

cai72738

V2EX member #160669, joined on 2016-02-26 13:50:23 +08:00
Per cai72738's settings, the topics list is only visible after you sign in
Deals info, including closed deals, is not hidden
cai72738's recent replies
@Eoss 蟹蟹,那我就继续投,
@lxlgod 上次去智联投,智联把我信息给泄漏了,有阴影
@CodeDoge 加油
@ke1e 多谢鼓励
Aug 19, 2016
Replied to a topic by cai72738 Python 自动提取网页内容
@tianshiyeben 大概看了你写的,标题,您好像直接取得 mata 里的 title ,在我这儿行不通。谢谢分享!
Aug 19, 2016
Replied to a topic by cai72738 Python 自动提取网页内容
@ambw 那个只有标题和正文,我看源码,看能不能提取出其他信息
Aug 19, 2016
Replied to a topic by cai72738 Python 自动提取网页内容
@xhsmile 上千的源,不大可能一个一个写正则。所以就想有没有能自动生成网页对应的正则的库
Aug 19, 2016
Replied to a topic by cai72738 Python 自动提取网页内容
@MarcoQin 标准信息源很少,大部分都是不标准的
Aug 19, 2016
Replied to a topic by cai72738 Python 自动提取网页内容
@polythene 除了大段正文的提取,那新闻来源和发布时间,也是需要精确匹配出来的。还有最难搞的新闻 URL
@tumb8r 还就真的不一样,而且我现在也就在对每个源写规则,恼死了。
深度马
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4091 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 00:58 · PVG 08:58 · LAX 17:58 · JFK 20:58
♥ Do have faith in what you're doing.