V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ClericPy  ›  全部回复第 132 页 / 共 133 页
回复总数  2649
1 ... 124  125  126  127  128  129  130  131  132  133  
2019-07-29 20:04:59 +08:00
回复了 onice 创建的主题 程序员 打算逃离大城市了
逃离了 3 个月, 然后现在想的是怎么逃离老家.........
楼上提到的 py.exe 就是 python3 里所谓的 python launcher, 我自己就是在注册表里用它注册的

不过为了 vscode 保持跨平台使用, 依然是环境变量+ 复制 python3.exe python2.exe 文件的方式
2019-07-26 15:08:05 +08:00
回复了 rj2 创建的主题 Python 请教, Python 执行外部程序,并且获取外部程序的 pid
for proc in psutil.process_iter():
try:
pname = proc.name()

我是用这种方法 kill 东西的, 用 psutil 的好处是兼容 linux / win

这里贴代码缩进真淡腾... 简单的说就是 psutil 去找匹配的进程, 然后杀之, 平时用 subprocess 里的那种 kill 在部分场景如果不小心可能会搞出僵尸进程 /孤儿进程什么的, linux 上还得设置 close_fds 什么的, 不如 psutil 简单

https://github.com/ClericPy/ichrome/blob/master/ichrome/base.py#L335
有 selenium 写爬虫从始至终都是很傻的行为吧, phantomjs 作者放弃开发了, selenium 还活着

楼主直接用 chrome 远程调试那个 cdp 协议吧, chrome devtools protocol
简单的用 http/socket 请求就可以操作 chrome, 用 js 实现不断翻页, 用 cdp 里的 Network 截取流量判断是否最后一页

你不给个例子, 也不好给你看看示例代码
2019-07-24 21:20:33 +08:00
回复了 Fizzyi 创建的主题 Python 关于 Python 中多进程的问题,求大佬解答
不给代码的盲改... 现在都流行这个了么, 靠猜的话, 我猜你没 join
搜一下 浮点数 IEEE
2019-07-20 14:27:55 +08:00
回复了 tuding 创建的主题 程序员 怎么将每日爬虫的执行结果通过微信推送给自己?
以前 v2 有人推广过他的项目,不过不是天天推那种,好像就是用他的公众号实现推送 api 的

模版消息在服务号上(企业认证)可以使用,个人订阅号貌似不行,不过我试了微信官方那个沙盒 sandbox 环境的测试号是可以用模版消息的,可以考虑用测试环境来搭,反正只给自己用

楼上们提的 Server 酱看起来还行
2019-07-17 00:54:26 +08:00
回复了 ke1e 创建的主题 程序员 失业了,接各种 H5, App 和微信相关开发需求。求口饭吃 T_T
开源个项目 Demo 有助于被猎头发现

同失业,在家无所事事假装学习如何找工作。。。
2019-07-17 00:51:41 +08:00
回复了 marco25 创建的主题 Python 用惯了 django 改用 flask 有感
走 asgi starlette 以后腰不酸腿不疼
2019-07-17 00:49:19 +08:00
回复了 yumenoks 创建的主题 Python 一个爬虫的过滤问题
国外的有域名就有 ip,有 ip 就有地域吧,一大堆速度超快的 ip 转地域的,淘宝啊搜狐啊腾讯啊
遇到爬虫陷阱爬虫蜜罐或者脏数据混淆等反爬手段,没啥好办法啊,socket 连一下试试域名存在性?控制友好频率上代理池才是正路子,就算撇开是否合法,频率太高会被当作 dos 攻击告你的
2019-07-17 00:43:32 +08:00
回复了 waibunleung 创建的主题 Python python3.7 中的 async/await 以及 asyncio 问题
很多地方协程里 Task 和 Future 的设计复用了(甚至原样用)多线程的 concurrent.futures 那套
Task 类创建以后就开始执行了,Future 则不会
你挨个 await 用来等他们全跑完原则上没什么毛病,不过可能会有一些异常如果不是 return exception 的话会打断 for Loop
所以可以考虑用下原生的 asyncio.wait 等方法来实现
2019-07-17 00:38:48 +08:00
回复了 Snail233 创建的主题 程序员 想问下各位 V 友真的很喜欢穿格子衬衫么。。。
我只喜欢纯色
我妈买了 4 件格仔衫我能怎么办
woca...
我就想问下,里面那些特质不对么
2019-07-12 17:42:34 +08:00
回复了 luhuan97 创建的主题 Python 9102 年了, Python3 首行还有必要加编码注释吗?
以前一直以为 py3 不需要 shebang 上加编码的,结果有天发现报错了,复现原理是

在 Windows 平台上
如果一大串字符串里有从网页复制的非法字符时候, 会报错
SyntaxError: Non-UTF-8 code starting with '\xe0' in file
但是 shebang 带上# ! coding:utf-8 就不报错

以前我在群里和人讨论过

https://gist.githubusercontent.com/ClericPy/7ef32e1456df013dfd97cbd2b5835238/raw/932a69a10477408ef771a3dc3146611bee0eba04/test_python3_encoding_error.py


可以试试去掉 shebang 那句
2019-07-12 17:34:38 +08:00
回复了 MrWhite 创建的主题 程序员 想问一下哪一门编程语言入门就很难学呢?
你去那些培训班看看各个语言的价格,大体心里有个数,然后也能知道你可以从他那里收多少钱,至于免费?教易语言,让他找工作去吧
2019-07-10 20:10:50 +08:00
回复了 snake8090 创建的主题 Python 一个关于动态页面爬取的问题!
写爬虫不管是靠它吃饭还是随便玩玩,http 那本书还是稍微读一下的好
2019-07-10 20:10:21 +08:00
回复了 snake8090 创建的主题 Python 一个关于动态页面爬取的问题!
对 python 来说,复制 curl bash,然后随便找个或者自己写个 curl Parser 发给 requests 就够了
2019-06-25 20:08:51 +08:00
回复了 brust 创建的主题 职场话题 我辞职了
@wu67 +1 个月,现在感觉还是上班好,996 都比在家做饭刷碗要强
2019-06-25 18:45:25 +08:00
回复了 Ljf980 创建的主题 程序员 亲人被骗 7W+ 该怎么维权
看完楼主遭遇警惕了一下
不过像我这种平民被骗了钱第一时间报警,已经不是默认选项里了吗。。。
目前活了这么多年,感觉人生如果真的有捷径的话,那就只有一条:高考
1 ... 124  125  126  127  128  129  130  131  132  133  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   6014 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 52ms · UTC 02:05 · PVG 10:05 · LAX 18:05 · JFK 21:05
Developed with CodeLauncher
♥ Do have faith in what you're doing.