V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  billion  ›  全部回复第 12 页 / 共 45 页
回复总数  893
1 ... 8  9  10  11  12  13  14  15  16  17 ... 45  
2017-09-14 16:06:45 +08:00
回复了 billion 创建的主题 Python 如何对比多个文件,从而发现新插入的内容
@ChristopherWu
用字典存的话,是按照{'语文': 89, '数学': 30}这种方式,全部遍历完成以后看次数为 100 的就是 0.txt 的内容了。然后再通过任何一个文件里面的内容来确定顺序。这种算法没有问题。
2017-09-14 15:47:06 +08:00
回复了 billion 创建的主题 Python 如何对比多个文件,从而发现新插入的内容
补充说明:同一条内容可以插入多个文件的不同位置,但是同一条内容最多插入 99 个文件,所以在 100 个文件都出现的内容显然就是原始数据。所以问题是,如果在避免两两对比的情况下,分别找到原始数据和新插入的数据?

为了增加难度,把 100 个文件改成 100 亿个文件,每个文件 100 亿行以上。
2017-09-14 15:38:01 +08:00
回复了 billion 创建的主题 Python 如何对比多个文件,从而发现新插入的内容
@gstqc 我想问的点是如何最高效地对比 100 个文件,如果使用 diff 的话,两两对比要进行 9900 次,太耗费时间和资源。
2017-09-14 15:31:37 +08:00
回复了 billion 创建的主题 Python 如何对比多个文件,从而发现新插入的内容
@gstqc Python 有这个库叫做 difflib。但是不太好用。
2017-09-10 22:37:42 +08:00
回复了 kisscucci 创建的主题 Python 数组转字符串?
如果是 Python 3.6 或者以下,需要使用:![]( http://7sbpmp.com1.z0.glb.clouddn.com/2017-09-10-22-37-37.png)
2017-09-10 22:35:31 +08:00
回复了 kisscucci 创建的主题 Python 数组转字符串?
上面的代码需要 Python 3.6 或者以上才能成功运行。
2017-09-10 22:34:02 +08:00
回复了 kisscucci 创建的主题 Python 数组转字符串?
</li>写成</>了,不过不影响。你改一下就可以。
2017-09-10 22:33:20 +08:00
回复了 kisscucci 创建的主题 Python 数组转字符串?
>>> x = [{'beifan': 'D551', 'id': 2, 'shuliang': 1334}, {'beifan': 'D552', 'id': 3, 'shuliang': 4003}, {'beifan': 'D550', 'id': 4, 'shuliang': 5103}]
>>> ''.join([f'<li>{a["beifan"]}:{a["shuliang"]}</>' for a in x])
'<li>D551:1334</><li>D552:4003</><li>D550:5103</>'
2017-09-10 22:32:52 +08:00
回复了 kisscucci 创建的主题 Python 数组转字符串?
2017-09-10 10:18:33 +08:00
回复了 Lentin 创建的主题 分享创造 Tasker 实现转发短信和远程给指定号码发短信
这个中文简直笑尿。运行外壳,,,,
2017-09-05 15:39:13 +08:00
回复了 ahkxhyl 创建的主题 问与答 买国庆火车票刷了 3 天了。。。心好累
你们到底是去哪里,车票那么紧张?为什么我从来没有遇到没票的情况?我随时打开余票都充足。
2017-09-05 10:08:55 +08:00
回复了 nullcoder 创建的主题 旅行 十一去哪玩?
秋叶原
2017-09-01 08:54:14 +08:00
回复了 eyp82 创建的主题 Go 编程语言 大家有没有用 Go 开发自用小工具的, 感觉适不适合?
我用 Go 作了一个数据脱敏的小工具。它操作 MongoDB 的数据库写入速度可以达到每分钟 30 万,完爆 Python。
2017-08-24 21:05:41 +08:00
回复了 billion 创建的主题 Python 如何逐次分别迭代多个生成器
@wwqgtxx iter(生成器)这样写的话,生成器里面的东西会被提前放出来吗?
2017-08-24 16:55:14 +08:00
回复了 billion 创建的主题 Python 如何逐次分别迭代多个生成器
@wwqgtxx 但如果有非常多的文件呢,比如有一万个文件,那在 while True 没有办法分别单独 yield xxx.__next__()了。此时又怎么办?
1 ... 8  9  10  11  12  13  14  15  16  17 ... 45  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1024 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 33ms · UTC 19:35 · PVG 03:35 · LAX 11:35 · JFK 14:35
Developed with CodeLauncher
♥ Do have faith in what you're doing.