• 请不要在回答技术问题时复制粘贴 AI 生成的内容
lucienlin18
V2EX  ›  程序员

如何通过 playwright 获取这种防盗链的图片?

  •  
  •   lucienlin18 · May 25, 2025 · 2677 views
    This topic created in 361 days ago, the information mentioned may be changed or developed.

    playwright 通过有头浏览器能够获取文字内容,但是图片设置了防盗链

    WARNING Failed to download image https://file.xxx.com/filex?fileId=OSS-33a46d7d-ed63-xxx-xx-xxxx.jpg&acl=xxx&timestamp=13333333&uid=xxxx&fileName=&process=image/resize,w_1000,h_4096,m_lfit: Locator.click: Timeout 30000ms exceeded. Call log: waiting for get_by_text("Save image")

    这个图片实际上是存在 oss 上的,通过浏览器 F12 看到地址是这样的,但是 python 调用的是是看不到这个地址的 https://xxxx.oss-xxx.aliyuncs.com/xxx/OSS-xxxxx-xxxx.jpg?Expires=13333333&OSSAccessKeyId=xxxxx&Signature=xxxx

    如何通过 playwright 下载到这个照片?

    4 replies    2025-05-26 10:10:10 +08:00
    r6cb
        1
    r6cb  
       May 25, 2025
    把完整请求头一起发过去,不是只访问链接
    512357301
        2
    512357301  
       May 25, 2025 via Android
    你在追踪下,这种地址一般是存在属性里吧,或者通过 ajax 请求得到的,否则页面怎么加载出来。
    SanjinGG
        3
    SanjinGG  
       May 26, 2025
    应该是有同源策略,只有他们网站可以访问。把图片转下 base64 ,然后再下载试试
    gogoby
        4
    gogoby  
       May 26, 2025
    启用 cdp network / fetch 方法 去抓 response (直接通过浏览器)
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   980 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 19:44 · PVG 03:44 · LAX 12:44 · JFK 15:44
    ♥ Do have faith in what you're doing.