V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
pureGirl
V2EX  ›  程序员

现在大型的爬虫项目用的是什么框架, scrapy 过时了吗

  •  
  •   pureGirl · 11 天前 · 2588 次点击
    13 条回复    2025-11-26 16:20:45 +08:00
    bwnjnOEI
        1
    bwnjnOEI  
       11 天前 via iPhone
    面对动态页面和抗反爬稍微复杂点的就不行了吧
    简单的网站依然可以用啊
    donaldturinglee
        2
    donaldturinglee  
       11 天前
    scrapy 一直就不是单着用的吧?没过时,但是你可以学一下 playwright
    sgld
        3
    sgld  
       11 天前
    试试 DrissionPage ?
    zonde306
        4
    zonde306  
       11 天前
    简单就 scrapy ,复杂就不用框架,直接操作浏览器

    例如
    camoufox
    patchwright
    azzzzzz
        5
    azzzzzz  
       11 天前
    未来还是直接模拟浏览器的吧
    IIce
        6
    IIce  
       10 天前
    毕业之后就没用过 scrapy 了,有自研的,也有 feapder, 还有一些就是一个 requests 脚本,可能项目不够大吧
    1018ji
        7
    1018ji  
       10 天前
    浏览器还能抓啥,APP 走起
    Toowhite7
        8
    Toowhite7  
       10 天前
    Selenium or playwright
    tim2017
        9
    tim2017  
       10 天前 via iPhone
    之前用过简数的代爬,收费还可以,以前免费提供大量知名网站的模版,现在都限制了。

    我公司网站靠爬虫每天上百 IP ,几年没更新了。
    国内互联网 V2EX 这种开放性的 web 原创数据越来越少了,都是私域平台。
    Honghe
        10
    Honghe  
       10 天前
    @tim2017 嗯,web 成荒漠了
    llsquaer
        11
    llsquaer  
       10 天前
    一个项目一个 py 还要啥 scrapy ..
    securityCoding
        12
    securityCoding  
       10 天前 via Android
    chrome cdp?
    gopo
        13
    gopo  
       10 天前
    1. 逆向协议(网页优先,APP 其次)
    2. 自研浏览器、模拟器(主要过指纹还有方便自定义)
    3. 简单网站(静态和动态的区别)随便搞
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1022 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 18:41 · PVG 02:41 · LAX 10:41 · JFK 13:41
    ♥ Do have faith in what you're doing.