V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  zeq  ›  全部回复第 2 页 / 共 4 页
回复总数  76
1  2  3  4  
2017-08-12 12:14:37 +08:00
回复了 SIFT2009 创建的主题 问与答 爬虫怎么动态解析不同网站的 html 结构呢
这看是抓去什么内容了

如果是文章的话,可以一些文章正文提取的包来做。

如果是不同结构的,或者需要更详细的内容,可以考虑一下 data highlighter。Google 的站长工具里面就有这样一个工具,帮助站长优化搜索结果,它需要人工标记若干个页面内的数据,然后 Google 能够根据你标记的数据解析出相同类型的页面

作为参考 @binux 在他的博客里分享了一种 data highlighter 的思路
2016-08-16 00:03:24 +08:00
回复了 kukuwhu 创建的主题 Python 懂 Python selenium 的大神进,请教个问题
有个东西叫 splash 能满足你的要求
2016-07-05 14:49:10 +08:00
回复了 rockyou12 创建的主题 Docker 有什么好的办法解决 docker 容器与宿主机时间不同步的问题?
顺带提议下, 安装了 tzdata 后就可以用 TZ 这个变量了。
2016-07-05 12:11:34 +08:00
回复了 rockyou12 创建的主题 Docker 有什么好的办法解决 docker 容器与宿主机时间不同步的问题?
2016-07-05 09:31:33 +08:00
回复了 rockyou12 创建的主题 Docker 有什么好的办法解决 docker 容器与宿主机时间不同步的问题?
楼主说的是时区? 试试 TZ 变量
2016-05-30 12:07:18 +08:00
回复了 shallyy 创建的主题 Apple iMac 外置硬盘安装双系统的问题
@ffffwh 支持 UASP 的现在满大街都是,不过大多不支持 trim 相关的指令。
2016-05-29 23:56:43 +08:00
回复了 shallyy 创建的主题 Apple iMac 外置硬盘安装双系统的问题
再补充一点, 因为是 USB 的硬盘盒, 所以 SSD 的 trim 能力就没了,这一方面是影响 SSD 的寿命,另一方面,在使用一段时间之后会影响性能。

寿命方面, 如果很在意的话要么直接插 SATA ,要吗就上 thunderbolt ,问题就是成本有点高,而且我不太清楚这样是不是能运行 Windows 。

性能方面,以我使用半年的经验来看,没有感觉到明显的变化(也可能我是用得还不够久)

理论上 UASP 是可以支持 trim 的( Windows 8 以上, OS X 目前不支持),但是市场上能买到的 USB 硬盘盒大多数是不支持这个能力的(我还没有找到,也不好找,因为大部分评测的文章并不关注这方面)。
2016-05-29 13:17:56 +08:00
回复了 shallyy 创建的主题 Apple iMac 外置硬盘安装双系统的问题
我目前就是这样用的,用的是 USB 的硬盘盒, 不过是把 OS X 装在这上面的。

硬盘盒支持 UASP 所以性能会好一点, 目测有直接插 SATA 的 80%

和直插 SATA 比起来, 我的感受是, 没差别。

我有两台电脑, 一台 Mac mini 和一台跑着 OS X 的 PC 。

USB 硬盘盒是插在 Mac mini 上的, PC 上直插 SATA , 都是 SSD
Polipo (HTTP)
srelay (socks5)
2015-03-19 20:59:51 +08:00
回复了 chiu 创建的主题 信息安全 在校外如何远程访问校内网?
自己搭一个n2n?
是在WiFi网络下面吗? 试试samba filesharing https://play.google.com/store/apps/details?id=com.funkyfresh.samba
n2n ?
没人用sed或者awk吗?:P
2014-12-26 12:44:32 +08:00
回复了 Showfom 创建的主题 程序员 说说你学会的第一个 Linux 命令?
nc
2014-10-13 11:16:23 +08:00
回复了 larkifly 创建的主题 Python django 数据库查询 filter 如何区分大小写
这是因为mysql的查询默认是不区分大小写的,你可以在匹配语句钱加上 BINARY 来区分大小写,例如

SELECT * WHERE BINARY title='django';

可以供你参考的一个方法是:

CarCardList.objects.extra(where=['binary car_card=%s'], params=[code])

https://docs.djangoproject.com/en/dev/ref/models/querysets/#extra
1  2  3  4  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5520 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 08:30 · PVG 16:30 · LAX 00:30 · JFK 03:30
Developed with CodeLauncher
♥ Do have faith in what you're doing.