V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  imn1  ›  全部回复第 32 页 / 共 742 页
回复总数  14838
1 ... 28  29  30  31  32  33  34  35  36  37 ... 742  
2022-01-13 13:08:05 +08:00
回复了 qzhai 创建的主题 问与答 微信一个月用了 18G 流量。有什么办法避免么
现在还有电击治疗么?🐶
我 5 张卡,还觉得不够……
2022-01-13 11:45:53 +08:00
回复了 DollarKiller 创建的主题 程序员 如何 更改文件 hash 的同时让文件可以正常使用
百毒没那么简单的,hash check 只是其中之一而不是唯一
众多资源站都是要求用户“不要在线解压”,且使用 7zip 二次加密打包,就是说解压后百毒很可能还有深度扫描

视频文件改变 hash 很简单,最后一个字节换一下就行了,完全不影响播放,但对付扫描没什么用,只是增加碳排放而已
玩过收图就知道,同一套图,字节数一样,不同站点发布的 hash 就不同,因为个个站点都会修改 exif 加入自己的标识,百毒照杀不误
2022-01-12 16:16:24 +08:00
回复了 SuperMild 创建的主题 分享创造 一种不需要密码的加密方法(用于防止网盘扫描等场景)
@SuperMild #28
那按你这样说的话,你这个方便在一体化自动操作,而不是加密

现在手机有扫码解密,密码箱、保密箱等等,电脑也有拖放密钥文件自动解密,或者从指定路径自动匹配密钥文件解密的工具……等等,基本上都不需要记密码的

我自己也有个脚本,下载文件到特定路径就自动解密(存放路径就相当于密钥),同理也可以做成上传,只是我没有上传需求,就没写了
2022-01-12 15:51:42 +08:00
回复了 SuperMild 创建的主题 分享创造 一种不需要密码的加密方法(用于防止网盘扫描等场景)
我没能理解好使用场景,包括标题所说的防止网盘扫描
因为现在好像都有更好的方案,你这个略嫌麻烦
2022-01-12 15:37:07 +08:00
回复了 DaPanda 创建的主题 问与答 这种情况维权应该注意什么?
你当地法律怎样我不知道(听说国外法律较倾向消费者?)
这种情况逻辑上来说,代收的人责任不大,因为没有什么代收协议(付费服务)之类

我建议是向供货商那边沟通维权可能更加有效(基于前面第一句)
换这里嘛,基本就自己认了,所以我从来不找人代收,如果不能亲收的话,宁愿给钱让快递小哥择时再送一次
2022-01-12 00:03:15 +08:00
回复了 cwcc 创建的主题 问与答 2022 年了,没有手机的情况下能否生活下去呢?
两周我没问题,只要楼下市场不需要扫码才给进的话,超过就不敢打包票了

我并不排斥新科技,但我也总是保持一定频率传统生活方式,因为我知道自己总有一天跟不上,要回归传统的,毕竟粤语就是“那头近”了
2022-01-11 12:26:26 +08:00
回复了 levenwindy 创建的主题 Python 关于 selenium 的 webdriver ,部分网页加载不出来
腾讯的反爬(风控)不是那么好对付的,当然我是盲猜的,没有试过,暴露 ip 的情况下不太敢碰腾讯
2022-01-11 12:17:40 +08:00
回复了 liuzhen 创建的主题 Python 对 Python 不熟,问个问题
我简单理解你的描述,A 的 id/name 两列都可以重复的(不重复也没必要循环了),B 是各自独立不重复的

其实这个取决于 A 的格式
二维 list --> 循环 /map/lambda ,list 也没办法优雅,即使用 map 也是要执行写入时循环一遍
pandas --> mask()
sql --> sql 命令

B 可以用
1.enum ,如果 B 为整数递增就 IntEnum ,如果 B 为二进制整数递增就 IntFlag
2.以数值做 key 的字典
3.pandas.Series 或 numpy
4.以位置作为索引的列表,无值的位置填入 None
当然 1 是最简单,因为 enum 可以用 key 读取 value ,也可以用 value 读取 key ,字典只能从 key 读取 value ,所以只能用数值作为 key
如果 A 是 sql ,B 可以继承 enum 并自定义一个__conform__(self, protocol)方法,方便读取|写入数据库
2022-01-08 23:37:56 +08:00
回复了 lozzow 创建的主题 Python 问一个删除元素的问题,要求要求速度快
加一行数据,更直观些
脑子实了,列名应该是 remove 不是 rest

In [49]: df=pd.DataFrame([[1,0.2,3,0.4,0.5,0.6], [1,0.5,0.9,0.4,0.3,0.01]], columns=['AB','AC','AD','BC','BD','CD'])

In [50]: df
Out[50]:
AB AC AD BC BD CD
0 1 0.2 3.0 0.4 0.5 0.60
1 1 0.5 0.9 0.4 0.3 0.01

In [51]: mask=df<0.5

In [52]: df['remove']=[set('ABCD')-set(''.join(df[mask].loc[i,:].dropna().index)) for i in df.index]

In [53]: df
Out[53]:
AB AC AD BC BD CD remove
0 1 0.2 3.0 0.4 0.5 0.60 {D}
1 1 0.5 0.9 0.4 0.3 0.01 {A}
2022-01-08 23:28:56 +08:00
回复了 lozzow 创建的主题 Python 问一个删除元素的问题,要求要求速度快
In [40]: df=pd.DataFrame([[1,0.2,3,0.4,0.5,0.6]], columns=['AB','AC','AD','BC','BD','CD'])

In [41]: mask=df<0.5

In [42]: df['rest']=[set('ABCD')-set(''.join(df[mask].loc[i,:].dropna().index)) for i in df.index]

In [43]: df
Out[43]:
AB AC AD BC BD CD rest
0 1 0.2 3 0.4 0.5 0.6 {D}

根据你的业务逻辑 求 df['rest'] 的值,如果复杂可以写成函数,用 apply/map
当然也可以根据需求添加更多的列,用其他 mask
2022-01-08 22:51:56 +08:00
回复了 lozzow 创建的主题 Python 问一个删除元素的问题,要求要求速度快
set('ABCDEFG') - set(''.join(df.columns)) # {'G'} 且 len==1
所以,求出这个符合需求的 df 就行了,基本上逻辑比较的 mask 就可以完成

具体看你的业务需求吧,我感觉这样 一维 * 几万条记录,也不会太慢
2022-01-08 22:40:46 +08:00
回复了 lozzow 创建的主题 Python 问一个删除元素的问题,要求要求速度快
@lozzow #23
虽然我理解错了 最多删除 --> 最少删除,但好像也影响也不大
转一维后,表头变成 AB | AC | AD ... | EF | EG | FG
此例末三个(0.9, 0.7, 0.7)置 nan 后,提取剩余的表头,就能确定里面不含 G 了
但因为还有 DE(0.2)和 BF(0.4)剩下,所以 E/F 可以确认保留

只是逻辑变换一下而已
2022-01-08 21:41:41 +08:00
回复了 lozzow 创建的主题 Python 问一个删除元素的问题,要求要求速度快
@lozzow #20
解决问题那还是 pandas 吧
df = pd.DataFrame(...)
mask = df<0.5
df1 = df.where(mask)

mask 是个 True|False 矩阵
df1 是一个保留匹配数据,其他置为 nan 的矩阵,看你需要哪个

如果求单行或单列匹配的个数,用 pd.Series.count()就可以了,pd 的 count 是排除 None/nan 值的个数
估计有用的函数还有 max/idxmax/sort/head/tail 等
你这个是纯数值,很快的,百万数据耗时单位应该是秒 /分钟,不可能是小时
如果实际操作仍然觉得慢,可以加上 dask ,dask 处理这些单类型 dataframe 很快

PS: 我有点好奇你的原始数据格式是什么,如果是这个矩阵,其实有点浪费空间(有效单元格只有不到一半),应该不是这个吧?如果不是这个,可能还有其他优化方法
我觉得这个矩阵转一维,处理更快更方便
2022-01-08 20:24:33 +08:00
回复了 butanediol2d 创建的主题 Firefox Firefox 无法默认在新标签页打开链接?
@butanediol2d #10
跟随账户的
如果你 save 也不能新 tab 打开,应该是某个环节出了问题,看看有什么其他扩展干扰
比较严重的可能是劫持,就是劫持了提交信息,篡改后原路返回就是本页打开了,当然这个概率不高
2022-01-08 20:09:52 +08:00
回复了 butanediol2d 创建的主题 Firefox Firefox 无法默认在新标签页打开链接?
@butanediol2d #6
google 的搜索设置是每个浏览器都一样,所以说跟 firefox 的设定无关
要点是 google 搜索设置后,要 save(实际上就是记入 cookies),这又有两点:
1.如果你的浏览器是自动清理 cookies (无痕)或者有相关扩展,这个设置就相当于没有保存
2.cookies 是跟域名的,而 google 是根据你的 ip 切换域名的,如果你用不同的机场,去到不同的 google 域名,相当于没有 cookies ,要重新设置
2022-01-08 19:13:23 +08:00
回复了 butanediol2d 创建的主题 Firefox Firefox 无法默认在新标签页打开链接?
1. 理解错误,这个设置是当点击 [打开新窗] 的链接,以新 Tab 代替新窗。并非所有链接都是这样,默认值不是新 Tab ,而是跟随链接 HTML 的预先设定,没有预设的就是本页打开
2. google 新页打开跟这个设置无关,而是跟 cookies 有关,cookies 没有保存的话,默认是本页打开

至于其他网站,海外网站绝大部分都是本页打开的,例如 V2EX ,新窗打开的一般需要标注,是早期一种网络礼仪,现在已经形成习惯,就不标注了,新开的多数是跨域名的外站链接
只是,中国大陆的网站从互联网发展初期就没有遵守这种礼仪,国人有错觉以为链接一直都是新开的
2022-01-08 16:39:19 +08:00
回复了 nl101531 创建的主题 分享发现 再来水一帖:分享改变生活习惯的物品
感应灯
2022-01-08 16:29:49 +08:00
回复了 lozzow 创建的主题 Python 问一个删除元素的问题,要求要求速度快
你是要解决问题,还是做算法题?
解决问题的话,扔进 pandas/numpy ,一行 mask 语句搞定
算法的话,我 pass
1 ... 28  29  30  31  32  33  34  35  36  37 ... 742  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5628 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 101ms · UTC 03:33 · PVG 11:33 · LAX 19:33 · JFK 22:33
Developed with CodeLauncher
♥ Do have faith in what you're doing.