V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
sxw
V2EX  ›  问与答

如何不重新写入重复内容而删除一个文件末尾的内容?

  •  1
     
  •   sxw · 2020-04-14 10:11:48 +08:00 · 1158 次点击
    这是一个创建于 1676 天前的主题,其中的信息可能已经有所发展或是发生改变。

    需求是这样的:

    一个很大的文件,例如 5 千万行,每行是一个字符 a 。 想删掉最后一行。

    我知道的一个办法是重新写入一次,但是耗时很多。

    请问应该怎么操作才能避免重写文件呢?

    使用 "w" 或者 "w+" 打开文件好像是直接清空文件?(我尝试使用 w+ 打开,seek 以后啥也不写入,文件被清空)

    参考这个方法:如何编辑一个大文件https://www.zhihu.com/question/20654719/answer/605322220 ) ,但是 "r+" 打开可以只修改特定位置而避免重写,但是无法把后面的内容截断。

    实验代码( python3 ):

    image.png

    5 条回复    2020-04-14 10:28:01 +08:00
    tabris17
        1
    tabris17  
       2020-04-14 10:15:52 +08:00
    ftruncate
    rrfeng
        2
    rrfeng  
       2020-04-14 10:16:18 +08:00 via Android
    seek()
    sxw
        3
    sxw  
    OP
       2020-04-14 10:18:17 +08:00
    @rrfeng 请问 seek 怎么操作呢?用什么方式打开文件?我尝试用 'w+' 和 'w' 打开文件 seek 再关闭,都会清空文件。
    sxw
        4
    sxw  
    OP
       2020-04-14 10:23:49 +08:00
    @tabris17 非常感谢,弄好了
    sxw
        5
    sxw  
    OP
       2020-04-14 10:28:01 +08:00   ❤️ 1
    根据 @tabris17 的方法,用 python3 实现是:

    ```python
    import os
    f = os.open('test_file', os.O_RDWR|os.O_CREAT)
    os.ftruncate(f, os.path.getsize('test_file') - 2)
    os.close(f)
    ```

    耗时几毫秒
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2825 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 13:12 · PVG 21:12 · LAX 05:12 · JFK 08:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.