V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
sorcerer
V2EX  ›  问与答

Python 处理字符串

  •  
  •   sorcerer · 2018-06-24 14:04:02 +08:00 · 1413 次点击
    这是一个创建于 2330 天前的主题,其中的信息可能已经有所发展或是发生改变。
    有一段字符串为: "adj.确定的, 某一个, 无疑的, 必然的, 可靠的 pron.某几个, 某些"
    我想把它处理成一个 list:['adj.确定的, 某一个, 无疑的, 必然的, 可靠的','pron.某几个, 某些']
    另外字符串里有可能会出现 adj. adv. prep. n. vi. vt. aux. v. pron. conj. 这几种不同的单词种类
    求大神们看下。先谢谢了。。
    11 条回复    2018-06-25 16:08:22 +08:00
    Sylv
        1
    Sylv  
       2018-06-24 14:26:53 +08:00 via iPhone
    .split(' ')
    korvin
        2
    korvin  
       2018-06-24 15:30:45 +08:00
    @Sylv #1 前面逗号后也有空格呢
    ant2017
        3
    ant2017  
       2018-06-24 15:49:19 +08:00 via Android
    正则表达式
    imn1
        4
    imn1  
       2018-06-24 15:52:56 +08:00
    findall
    ([a-z]+\..+)\s+
    fffflyfish
        5
    fffflyfish  
       2018-06-24 16:21:26 +08:00   ❤️ 2
    提供一个大致的思路,亲测有效
    ```
    re.findall(ur"[a-zA-Z]+\.[\u4e00-\u9fa5]+\W+", str)

    adj.确定的, 某一个, 无疑的, 必然的, 可靠的
    pron.某几个, 某些
    ```
    sorcerer
        6
    sorcerer  
    OP
       2018-06-24 18:23:56 +08:00
    @fffflyfish 谢谢大神,学到了
    hourann
        7
    hourann  
       2018-06-24 19:44:23 +08:00 via iPhone   ❤️ 1
    >>> test_str = 'adj.确定的, 某一个, 无疑的, 必然的, 可靠的 pron.某几个, 某些'
    >>> re.findall(r'[a-zA-Z]+\.\W+', test_str,re.A)
    ['adj.确定的, 某一个, 无疑的, 必然的, 可靠的 ', 'pron.某几个, 某些']
    hourann
        8
    hourann  
       2018-06-24 19:45:25 +08:00 via iPhone   ❤️ 1
    >>> re.findall(r'\w+\.\W+', test_str,re.A)
    sorcerer
        9
    sorcerer  
    OP
       2018-06-25 11:49:09 +08:00
    @hourann re.A 是什么参数?
    sorcerer
        10
    sorcerer  
    OP
       2018-06-25 11:55:57 +08:00
    哦是 python3 里的
    hourann
        11
    hourann  
       2018-06-25 16:08:22 +08:00 via iPhone
    @sorcerer re.A 是 re 的 flag,表示\w 之匹配字母,与之相对的是 re.U,\w 可以匹配中文字符。python2 应该默认 re.A
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2606 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 02:48 · PVG 10:48 · LAX 18:48 · JFK 21:48
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.