有个 23GB 的 TXT，想搜索里面某特定字符，有什么快速办法？ - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 3755 天前的主题，其中的信息可能已经有所发展或是发生改变。

有个 23GB 的 TXT ，想搜索里面某特定字符，有什么快速办法？

30 条回复 • 2015-12-09 00:28:25 +08:00

1

pupboss

2015 年 12 月 7 日

1

全部放到内存

2

lsmgeb89

2015 年 12 月 7 日

1

grep 下？感觉有 UI 的编辑器 hold 不住哈

3

lshero

2015 年 12 月 7 日

1

如果是一行一行的日志的话切割成多份一份一份的找

4

tracyone

2015 年 12 月 7 日 via Android

1

grep ack ag perl …

5

hahasong

2015 年 12 月 7 日

1

用 java 一行一行的读，写个循环

6

kokutou

2015 年 12 月 7 日

1

winhex ...

7

c0mmand

OP

2015 年 12 月 7 日

@pupboss 没这么大内存的机器
@lsmgeb89 正准备这么做，找到这行数据后，有没有办法把这行数据的前后几百行一共拷贝出来呢？
@lshero 办法可行，有点麻烦。
@tracyone Linux 小白，参数具体意义？
@hahasong 不会 Java 。

8

Slienc7

2015 年 12 月 7 日

1

随便什么语言 ReadLine

9

tracyone

2015 年 12 月 7 日 via Android

1

@wuxiao2522 前三个是命令行程序，后面一个是脚本语言，都是用于文本查找的，特点和快慢有所不同，自己搜索下关键字和正则表达式

10

bk201

2015 年 12 月 7 日

1

readline 只适合有换行符的吧，而且换行符的哪一行还得小。
按字节读取或者分割。

11

c0mmand

OP

2015 年 12 月 7 日

@kokutou 感谢，已经 winhex 搞定。
@tracyone 谢谢，已经解决了。

12

kxjhlele

2015 年 12 月 7 日

sep 也可以把，

13

skydiver

2015 年 12 月 7 日

前后两百行： grep -C 200 <strtofind> <filename>

14

dzxx36gyy

2015 年 12 月 7 日 via Android

曾经我也纠结过怎么打开 23g 的某社工库 txt ……

15

abelyao

2015 年 12 月 7 日 via iPhone

@dzxx36gyy 哪个库啊？

16

ryd994

2015 年 12 月 7 日 via Android

read(n)不就好了么？
多少 G 都行啊

17

dzxx36gyy

2015 年 12 月 7 日 via Android

@abelyao soyun

18

lululau

2015 年 12 月 7 日

如果你能估计要检索出的结果在文件中的偏移量，或者文件是有序的，可以用二分查找之类的：

# 显示一个文件中从第 50G 个字节开始的长度为 1K 字节的内容
offset=$((50*1024*1024*1024-1))
length=1024
dd if=file_name bs=1 skip="$offset" count="$length" | grep regex

如果不是这个情况，那就搞不懂这个问题到底是啥意思了

19

xujif

2015 年 12 月 7 日

grep --help 就可以满足了

20

ixiaozhi

2015 年 12 月 7 日

23GB 的社工库么。。。

21

c0mmand

OP

2015 年 12 月 7 日

@ixiaozhi 类似吧，是一本字典。

22

qinxi

2015 年 12 月 7 日

如果只搜一次那就随便 readline 如果想重复搜索你用类似 lucene 的工具吧不过嘛索引会很大很大..哈哈哈哈

23

jasontse

2015 年 12 月 7 日 via iPad

https://github.com/bkase/CUDA-grep

24

squid157

2015 年 12 月 7 日

读文件才是最慢的吧

想想弄到数据库里面然后对有意义的字段加个索引多好

25

fxxkgw

2015 年 12 月 7 日

grep 最快也可以用 es

26

leavic

2015 年 12 月 7 日

你该问问写这个 txt 文件的人

27

matrix67

2015 年 12 月 7 日 via Android

ag 啊

28

46fo

2015 年 12 月 7 日

UE

29

omen

2015 年 12 月 8 日

用 everedit 打开就可以搜索

30

webjin

2015 年 12 月 9 日

@wuxiao2522 你好，怎么搞定的，有操作教程吗？

关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · Solana · 1040 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 46ms · UTC 19:10 · PVG 03:10 · LAX 12:10 · JFK 15:10
♥ Do have faith in what you're doing.