jerrywaffle's recent timeline updates
jerrywaffle

jerrywaffle

V2EX member #625119, joined on 2023-04-21 01:58:31 +08:00
jerrywaffle's recent replies
Oct 2, 2025
Replied to a topic by Jackson613w RSS freshrss 动态加载的网页怎么抓取
我用的 rsshub ,rsshub_python, 还有自己用 seleniumbase render 然后 extract
@inhzus 试了一下,有时候截屏大小不能完全控制。不过这个功能确实是浏览器开创性的!
@UnluckyNinja V2EX 果然藏龙卧虎,这个第一次听说
@kkky rss 有实现一些,一个源一个看。这个拼凑的话,可以一个页面展示多个源。
@tcper obs 这个思路有点意思!
@inhzus 对,就是这个。感觉浏览器自身能支持就好。能动态更新截图,也可以静态。你说的一般般是什么体验?
@lixikei 貌似有的网页会检查在不在 iframe 里面,如果在就反抗一下。
还有 iframe 能不能实现自动滚动到某个位置浏览特定区域呢?
@mumbler 谢谢你热心回复。这个办法也是一个办法,具体网页得具体实现。如果能有个通用一点的答案更好了。
@mumbler 有图表 数据 啊 不全是文字
@mumbler 问过大模型了,感觉思路不是很靠谱。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3992 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 28ms · UTC 05:12 · PVG 13:12 · LAX 22:12 · JFK 01:12
♥ Do have faith in what you're doing.