V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  sivacohan  ›  全部回复第 14 页 / 共 68 页
回复总数  1357
1 ... 10  11  12  13  14  15  16  17  18  19 ... 68  
2016-12-07 21:55:02 +08:00
回复了 insub 创建的主题 问与答 求问,现在一个靠谱的设计总监,薪酬大概在什么价位?
你既然这样问了,那就是身边没有这样的人。
所以,你现在只能选择资深猎头了。
照百万准备吧。特别靠谱可能百万都不够。
2016-10-30 01:52:17 +08:00
回复了 yxwzaxns 创建的主题 问与答 [求助] 一个关于网络抓包的问题
如果能碰网线,直接装个支持 wireshark 的网桥。
网桥属于无 IP 设备。
淘宝关键词 wireshark 网桥
我猜测没有错。
关于 rfile 和 wfile 都是通过 makefile 来实现的。
https://hg.python.org/cpython/file/2.7/Lib/SocketServer.py#l702

makefile 在这里
https://hg.python.org/cpython/file/tip/Lib/socket.py#l218

而在 tcpserver 里面的 connection 对象,实际上就是一个 socket
rfile 和 wfile 都是一个封装。
rfile 可以试用 readline
wfile 写入没缓冲区

猜测,如果都是用 byte 差别不大。如果处理的是文本型数据, rfile , wfile 能方便点。
2016-10-20 00:00:59 +08:00
回复了 aiqier 创建的主题 Python tornado 在同时发出 n 个请求时,如何让其中 1 个有结果就返回?
你是方法 A 说发出 n 个请求,当 i 个请求返回时( i 小于等于 n )。放弃其余请求,方法 A 返回。

这种情况下你可以注册多个 handler 扔到 ioloop 里,然后搞个计数器。
或者使用 threading ,然后循环坚持每个线程有没有返回。

第一种复杂点,第二种代码少,但实际上是错的, for 循环会阻塞。
2016-09-23 16:35:08 +08:00
回复了 qimeina 创建的主题 奇思妙想 求志同道合的人加入,我要完成一个信息魔方
如果我没记错,众妙之门,玄牝都是指阴道。
您这是打算做基于地区,职业,兴趣的约炮平台?
2016-09-20 01:19:16 +08:00
回复了 newbieo0O 创建的主题 Python 你是如何学习 Python 的?
@kindjeff

第一个是 stream 里面的实际的东西。第二个应该是被处理过了。
第二个不说了,因为不知道具体怎么处理的。说第一个。

你这个响应应该是 content-encoding 为 gzip , transfer-encoding 为 chunked 。
gzip 不用说了, body 里的东西解压就可以了,我说的 31 是 decompress 的第二个参数。
你解压不了是因为这是 chunked 的数据,格式如下

该 trunk 的字节数\ r \ n
对应的 trunk 数据\ r \ n

trunk 包以 0 \ r \ n \ r \ n 结束

RFC2616 里面有具体关于 trunk 的说明,建议核对一下,记得是这样,可能有误差。
2016-09-19 22:13:44 +08:00
回复了 newbieo0O 创建的主题 Python 你是如何学习 Python 的?
@kindjeff gzip 如果是 http 的话,解压时 window size ,写 31 。
@k9982874 没看懂啥意思。。。
developworks IBM
2016-09-02 14:50:54 +08:00
回复了 sivacohan 创建的主题 问与答 在写一个爬虫代理服务,有人需要吗?
@pango 目前正在计划,主要就面向国内用户了。当前自己用了 20 多个 IP ,主要是阿里云和百度云的。如果有人需要的话,就再买些 IP 咯。网上的免费 IP 只能当玩具用。


@laoyuan 不知道你爬去的是什么网站。我流量和你差不多,总共才用了 10 个 IP 。

@gimp 终于有人给了一个中肯的评价了。他那个需求,自建的成本怎么也得 3k 到 4k 。

@laurent 我现在是想找些人自建 IP 池,免费 IP + 各种云的 IP + 少量 ADSL 小区宽带。而实际上,我这个不太好定价。代理服务商是多少钱多少 IP ,封了就没了。我是根据爬去情况动态更换的。有人捣乱我这边会跪的很惨的……
2016-09-01 13:52:55 +08:00
回复了 windygoose 创建的主题 职场话题 大家工资一般什么时候发?
@smithtel 下个月扣
@aprikyblue 你说的对,有一个反扒技术就是这样。利用 gzip 压缩一个 TB 级别的都是 0 的文件。目前浏览器对这种情况有拦截,不会出大问题。但一般爬虫不考虑这个,直接把磁盘爆掉。
2016-08-12 16:32:15 +08:00
回复了 vzlf 创建的主题 程序员 百度的童鞋看过来...你家的网站挂了
那这个呢?
今晚看啥
http://kansha.baidu.com/movie/
2008 年的时候, Nokia 还是街机的时候,系统还是塞班的时候,就有这东西了……
当时我还装过,可以通过 IP 地址访问,然后大概能支持十多个人访问吧。
2016-07-25 20:45:28 +08:00
回复了 jmc891205 创建的主题 程序员 昨天摸了把 Hololens
你不觉得太沉了嘛。。。勒的脑袋疼。跟紧箍咒一样。。。
2016-07-24 22:52:58 +08:00
回复了 mikulch 创建的主题 Python 请教两个关于使用 python 爬去哪儿,携程等机票网站的问题
公司业务的原因,我建议你别研究了。
去哪得二三十人在研究爬虫和反爬虫。
给你 islimit 这算给面子了,告诉你,小伙子要知难而退。
去哪反扒的大招是接口正常返回,但数据都是错的。。。
2016-07-21 11:34:29 +08:00
回复了 ganster 创建的主题 酷工作 [不求你多牛,只求你简历不造假] 初级开发工程师
我情况比你好点,初级 Web 前端,造假大概一半。
2016-07-18 20:50:40 +08:00
回复了 huilaoda 创建的主题 酷工作 寻一枚文档转换服务端工程师~~~~~
@livid @kai
重复发帖
1 ... 10  11  12  13  14  15  16  17  18  19 ... 68  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2788 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 15:20 · PVG 23:20 · LAX 07:20 · JFK 10:20
Developed with CodeLauncher
♥ Do have faith in what you're doing.