V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  imn1  ›  全部回复第 742 页 / 共 742 页
回复总数  14838
1 ... 733  734  735  736  737  738  739  740  741  742  
爬虫
2014-05-23 18:45:34 +08:00
回复了 cssnote 创建的主题 问与答 第一次约女孩子,有什么靠谱的方法消除紧张和增加自信?
做两件事:
1.高调炫耀自己有本事,但必须做砸的
2.低调承认自己力所能及的,也不能谦虚,但必须要做好
要点是两件缺一不可,顺序看场合和时机
2014-05-23 18:40:52 +08:00
回复了 NFSwind 创建的主题 分享发现 妹子找我装系统。。。心中万匹草泥马
找个逻辑思维超强的妹纸,你只需要说三句话就可以判断你一生那种?
啥都需要依靠你的妹纸都放过,笨死了~
@loading 为什么是回复我?这个我最后一句说了,从80286到80486,AMD在486时代冒起,intel当年想注册586对抗AMD被驳回,理由是不能用纯数字注册,奔腾才横空出世,域名的原因我认为理由一样,洋人是把域名和商标挂钩的,不清楚他们的法律,纯数字域名是否会有法律争议,但至少和商标或公司名不一致,推广可能会有问题产生,网易当年是因为163.net邮箱火了才动用163.com的,算是个异例
2014-05-23 15:46:37 +08:00
回复了 pythonee 创建的主题 程序员 怎么写个通用一点的抓取某网页的内容
@RangerWolf 实际工作的测试,约5000个html,py3,纯parse,无下载过程(用wget另外下载的,不在程序内),除了用正则regex和lxml+xpath三行代码不同外,其他语句一样,单线程,无协程,CPU是老机器T2390,如果快点的CPU可能没那么明显
美丽汤4的css selector比lxml还要慢,这个老早有洋人测试过了,google一下,个人觉得只要载入DOM树,肯定要占资源多些的,理论上是这样,不过dom比较容易定位找到目标,正则要准确定位就要需要技巧,尤其是排除型正则比较难写
有些事情很难说~
有个老板对我说过这样的话:“15年前有人介绍我在xx区12万买套房子,我跟他说你傻的,现在那里1.2万一平米,人家说我傻的……”
97~02年间,经手的域名不下千个,那时基本不考虑5个字母或汉语拼音的域名,现在呢?
你这个域名起码比我最初所认识的 wikipedia 时要容易记一些
不过洋人对数字域名不太感冒,我想跟当年 intel 想以数字注册CPU商标失败的案例有关
2014-05-19 14:04:22 +08:00
回复了 pythonee 创建的主题 程序员 怎么写个通用一点的抓取某网页的内容
不同站点的通用很难写的,我自写在用的,把过程提取出来作为模块,但也是每站点一堆参数,目前也就几十个站点,把参数写好,只要该网站不改版,下次还能用,改版了就要重写一次参数
当然不少站点的参数都类似,不同仅仅在正则,例如瀑布流ajax可以写成一个模板,不同站点的瀑布流就改改提交获取json路径就可以了,又如有些站点是第1页~第N页,也可以写个递增模板,不同的应用只需填入最后的页数和路径就行

目前遇到最难的是用js计算路径的,暂时不懂也不太想调用外部的js引擎,主要不是难,而是耗资源,算上万网页就是个问题

能用正则就尽量用正则,xpath因为要导入一个dom树,单个页面会比正则多消耗20%的时间,如果页面过万,可能就是倍数而不仅是20%~
2014-05-15 13:52:36 +08:00
回复了 pythonee 创建的主题 程序员 有没有不那么鸡血的座右铭
让你的朋友低估你的优点,让你的敌人高估你的缺点——《教父》
2014-05-15 09:18:30 +08:00
回复了 imbahom 创建的主题 程序员 吐槽,迟到一次扣半天工资,你怎么看
4k~韩国还是越南?

以前遇到过这样的规定,员工私下商量后集体向行政部反映,以后到公司门口看着表,如果迟到就电话请所扣工资相等时间的事假,因为事假扣工资也是1:1,后来规定就改了,迟到扣N元/分钟(根据工资比例,大约千分之一/分钟),这样经常迟到的人就很惨,不常迟到的每月也就十多块
2014-05-15 08:54:05 +08:00
回复了 woaixiangbao 创建的主题 程序员 凡客域名到期了?
Hostname www.vancl.com ISP CNCGROUP IP network China169 Beijing Province Network (AS4808)
Continent Asia Flag CN
Country China Country Code CN (CHN)
Region Hebei Local time 15 May 2014 08:52 CST
City Langfang Latitude 39.51
IP Address 119.253.51.7 Longitude 116.695
2014-05-15 08:52:38 +08:00
回复了 woaixiangbao 创建的主题 程序员 凡客域名到期了?
转到其他地方的人都去换DNS吧
2014-05-14 14:10:00 +08:00
回复了 bobopu 创建的主题 DNS 刚收到一封 360 发来的邮件,说他们推出了 360DNS 云甲……
youtube.com 有没有去登记?
如果返回的数据涉及客户端,例如某些控件属性,这就很正常了
2014-05-04 14:48:57 +08:00
回复了 hiddenman 创建的主题 问与答 name.com 无法打开,域名解析失败。。是跟净网有关系吗??
我连 microsoft.com 都503,要搬梯子,很无语~
2014-05-04 14:37:01 +08:00
回复了 tabrisux 创建的主题 问与答 求帮忙配个台式电脑,淘宝修图, 主要用 PS
现在ps也不需要什么大配置,i3,找个稍好一点的板,其他能省则省,over
2014-04-16 17:11:44 +08:00
回复了 gracece 创建的主题 DNS 使用 V2EX DNS 导致丢包严重
我这边测试 V2EX DNS 只是转发DNS
2014-04-04 15:21:18 +08:00
回复了 mtvboy 创建的主题 iPad 有什么好办法屏蔽 app 的广告。改 dns 可以吗?
用一个dns转向的工具,把你想屏蔽的域名指向一个不存在的DNS ip(例如本机127.0.0.1)那就返回解析错误,自然就不会连到广告网站,说难听点就是自己污染自己,其实最简单在hosts里面改就行了
我这里就这样把cnzz杀了,虽然只是流量统计不是广告,但每站都有,有时连接不顺还一直打转,看着不爽就彻底杀了它~我已经在hosts杀了百多个广告、内容共享、流量统计的网站

dns转向工具另外最大的好处是,按自己的意愿,把域名交给你认为最好的DNS,一来分流,二来加速,
例如城通,我这里用google dns是解析到泰国服务器,所以要指定用国内的dns

另外楼上说的privoxy是个好咚咚,可以根据域名处理http header,拦截cookies也很容易,某些拦截中文浏览器的网站(你懂的),也能通过privoxy改成它能接受的语言
2014-04-04 14:29:44 +08:00
回复了 caizixian 创建的主题 DNS 关于DNS的问题
114/ali 都有问题,over
1 ... 733  734  735  736  737  738  739  740  741  742  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5479 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 110ms · UTC 08:54 · PVG 16:54 · LAX 00:54 · JFK 03:54
Developed with CodeLauncher
♥ Do have faith in what you're doing.