V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  binux  ›  全部回复第 257 页 / 共 338 页
回复总数  6759
1 ... 253  254  255  256  257  258  259  260  261  262 ... 338  
2014-08-18 11:02:49 +08:00
回复了 binux 创建的主题 分享创造 每天自动签到 —— 我们不造脚本,我们造框架
@chocotan 你看,我很快就被 v2ex 封了
2014-08-18 10:58:48 +08:00
回复了 binux 创建的主题 分享创造 每天自动签到 —— 我们不造脚本,我们造框架
@xbaofeng 晚上做一个不需要数据库的命令行版本
2014-08-18 10:21:36 +08:00
回复了 binux 创建的主题 分享创造 每天自动签到 —— 我们不造脚本,我们造框架
@mornlight 贴吧如果异地登录是会出验证码的,不想处理验证码
2014-08-18 10:14:43 +08:00
回复了 binux 创建的主题 分享创造 每天自动签到 —— 我们不造脚本,我们造框架
@humiaozuzu 每个模板不一样,不一定只是 password 是敏感。
@cutehalo 只要不要 QQ 邮箱就可以哦
2014-08-18 09:44:56 +08:00
回复了 binux 创建的主题 分享创造 每天自动签到 —— 我们不造脚本,我们造框架
@mengskysama 可以的哦,本来就有这个设计,模板可以使用变量,也能调用函数,写一个函数然后 pull-request 给我。
验证码有一个设计,可以用户间相互帮忙打码,攒点数,然后一段时间就不用来了。但是时间和实际需求不强烈原因就没做。。
2014-08-18 09:35:04 +08:00
回复了 binux 创建的主题 分享创造 每天自动签到 —— 我们不造脚本,我们造框架
@sdysj 可以试试能不能搞定淘宝登录,或者用 cookie,建议自己做模板。。

@mengskysama 这就是为什么开源的最大原因。。
为什么我觉得有用?
至少在百度,部分层由于计算和存储资源不足,只计算title, anchor, url的匹配的,更不用说离线挖掘。
学一遍怎么做网站,前后端一起,然后你就会爬了。
2014-08-13 17:50:01 +08:00
回复了 mailunion 创建的主题 分享发现 因屏蔽谷歌向工信部申请信息公开一事,工信部答复了
@zewenzhang 不会的,有cache
2014-08-11 01:02:47 +08:00
回复了 suifengdaren 创建的主题 Linux SSH 隧道与端口转发(v2ex 首发)
好荣幸能在V2EX上看到首发
2014-08-07 17:06:59 +08:00
回复了 fy 创建的主题 Python 求助:lxml 写爬虫怎么弄出原始 html
lxml.html.tostring
.text_content()
2014-08-07 12:59:14 +08:00
回复了 Conte 创建的主题 问与答 jsonp 怎么实现跨域同步?
@yangqi 你就不允许人家拓展名叫 0-stable 吗!
2014-08-05 23:08:13 +08:00
回复了 shyrock 创建的主题 Python 想用 SAE 自动登陆 CHH 刷积分,但是发现登陆的时候有验证码
@southwolf 我知道有啊,但是你不觉得帮别人签到要比花钱买要有趣得多吗?
2014-08-05 17:45:30 +08:00
回复了 shyrock 创建的主题 Python 想用 SAE 自动登陆 CHH 刷积分,但是发现登陆的时候有验证码
在做一个通用签到服务,对验证码有一个这样设计:
1、把验证码抓下来,让用户打码
2、可以帮别人打码,以赚取打码点
3、当别人帮你打码时,会消耗你的打码点
4、打码点可以交易,也可以集中一天上去,帮网站上的所有人把码都打了,以赚取足够的打码点
5、有足够打码点之后,就可以很长时间不用管他啦,会有人帮你打码登录的
2014-08-04 21:53:10 +08:00
回复了 jiantalk 创建的主题 问与答 BAT 用 Python 做产品的多吗?校招会招吗?
有,不多,大部分职位不会指定特定语言,如果喜欢开发 web,在 baidu 请 php
2014-08-04 13:01:56 +08:00
回复了 wwttc 创建的主题 问与答 Python 处理文件的性能优化
我觉得大的数量级上优化空间不多,只好改进下常数时间了

* 不要 split 多次
* item 按照出现概率排序
* 先对 tweet 进行单字过滤(如果 topic 中的某个单字不存在,就不会匹配了)
* 用 topic 建词表,用这个词表对 tweet 切词,倒排或者怎么地都行

但是,这些改进都是 一亿 * (1500 * n) 后面这部分的效率。
它取决于 topic 平均长度,重复单词概率等特征。
1 ... 253  254  255  256  257  258  259  260  261  262 ... 338  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5302 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 88ms · UTC 05:45 · PVG 13:45 · LAX 21:45 · JFK 00:45
Developed with CodeLauncher
♥ Do have faith in what you're doing.