wuming
V2EX  ›  问与答

scrapy 中使用 Selector 的 xpath 表达式如何选择具有相同 html 标签的元素的内容

  •  
  •   wuming · Sep 26, 2014 · 5105 views
    This topic created in 4253 days ago, the information mentioned may be changed or developed.
    如: http://emall.chblt.com/Product/ProductDetail.aspx?itemcode=6627200055

    我想获得该页面产品简介的内容,但是产品简介所嵌套的div标签并没有任何的id或者class,它的平级还有好几个并列的div,请问xpath表达式是否可以在有几个相同标签的情况下获取到第N个标签元素的写法?或者这个问题是否还有其他方法可以解决。谢谢?
    4 replies    2014-09-27 16:25:55 +08:00
    wuming
        1
    wuming  
    OP
       Sep 26, 2014
    目前采用的方法是获取所有相同的标签然后遍历,有更简单的方法么
    ZzFoo
        2
    ZzFoo  
       Sep 27, 2014   ❤️ 1
    Xpath取到的是节点列表,也就说是个list,直接用下标取就行了,比如如果是第三个就是div[2]
    Battle
        3
    Battle  
       Sep 27, 2014 via iPad
    @ZzFoo 如果有些内容要有些不要呢?我爬下来会两行空白一行文字这样子循环
    ZzFoo
        4
    ZzFoo  
       Sep 27, 2014
    @Battle 用string类自带的方法strip()

    >>> ' \n \nabc'.strip()
    'abc'
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5177 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 08:52 · PVG 16:52 · LAX 01:52 · JFK 04:52
    ♥ Do have faith in what you're doing.