首页
注册
登录
stephenpcg 最近的时间轴更新
stephenpcg
V2EX 第 89510 号会员,加入于 2015-01-02 00:13:46 +08:00
stephenpcg
提问
技术话题
好玩
工作信息
交易信息
城市相关
stephenpcg 最近回复了
2018-01-25 12:48:30 +08:00
回复了
abcdxx
创建的主题
›
程序员
›
问个排序算法问题
@
h4lbhg1G
100 万约为 1M,1000 万即为 10M,每行 11 字节,即为 110MB。你前面说“等于 10 的 8 次方”,后面计算时变成了 "x10^9Bytes"。
2018-01-25 10:54:53 +08:00
回复了
abcdxx
创建的主题
›
程序员
›
问个排序算法问题
既然楼主都考虑过 awk 了,我觉得很可能是一次性的任务,1000 万行也不大,也就百来兆的文件,可以试试:
comm -1 -2 <(sort a) <(sort b)
时间主要消耗在 sort 上面,我本地随机生成了两个文件 a、b,每个文件 1000 万行,每行长度 10 个字符,本地测试总开销 12s。时间比 awk 少 2 个数量级以上。
2015-01-02 12:37:50 +08:00
回复了
efi
创建的主题
›
Linux
›
360 安全卫士 for Linux 使用结果
打包这一块,不仅滥用Essential,还滥用了“Priority: required”,这是Debian/Ubuntu在debootstrap过程中要自动安装的包。
»
stephenpcg 创建的更多回复
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
2779 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms ·
UTC 05:47
·
PVG 13:47
·
LAX 21:47
·
JFK 00:47
Developed with
CodeLauncher
♥ Do have faith in what you're doing.