V2EX › 爬取

Home Sign Up Sign In

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

Sign Up Now

For Existing Member Sign In

小宇宙可以下载文字吗？

问与答 • HORSE20260212 • 7 days ago • Lastly replied by HORSE20260212

5

被 AI 厂商爬告警了， gptbot 和 amazonbot 哼哈二将。

程序员 • ddy10086 • 15 days ago • Lastly replied by flyqie

1

有没有什么工具或者什么好的办法可以爬取 wx 公众号文章的呢

微信 • jsremain1 • 22 days ago • Lastly replied by sudo123

8

记录从交易所爬取技术指标的过程

程序员 • particlec • May 26 • Lastly replied by lisxour

10

话说阿里巴巴国际站的联系信息是怎么获取的。

问与答 • cccn • Apr 7 • Lastly replied by IIce

1

爬取招投标信息是怎么合规的

问与答 • milala • Mar 12 • Lastly replied by fanjinzhongju952

3

群成员如何爬取飞书外部群的消息

程序员 • Moverisk • Feb 16 • Lastly replied by COOOOOOde

2

目前有爬取微信某个公众号全部文章的方案吗

问与答 • YanSeven • Feb 14 • Lastly replied by YanSeven

3

有大佬写过陌陌的数据批量获取么？

问与答 • Yesr00 • Jul 29, 2025 • Lastly replied by Yesr00

2

OpenAI 是没钱买代理服务器吗？竟然来白嫖我的 GitHub/ArXiv 镜像服务器爬取数据用于训练 GPT

程序员 • tfu • Jul 4, 2025 • Lastly replied by beyondstars

21

有人反馈本站"脚本用户"爬取别人推特内容

V2EX • cherbium • Jun 22, 2025 • Lastly replied by Tink

14

爬取小红书评论是否合法

互联网 • SaintMichel • Jun 15, 2025 • Lastly replied by 490454744

30

爬取 X 和 Facebook 的用户并且群发

程序员 • wellyougo • May 20, 2025 • Lastly replied by wellyougo

6

谁能帮我解决这个问题?

程序员 • Windyzhou • May 18, 2025 • Lastly replied by Windyzhou

6

兄弟们，代理 IP 池业务的是厂商自己搭建还是爬取的呀？

问与答 • jackhou921 • May 10, 2025 • Lastly replied by MFWT

5

要怎么实现快速爬取 1w 个网站呢？

1

程序员 • baozaodexiaomila • Apr 15, 2025 • Lastly replied by YJi

14

求教如何爬取全网的某类信息数据，包括公众号内的信息

Python • corso • Dec 6, 2024 • Lastly replied by XinPingQiHe

10

最近有买房想法，想爬一下贝壳，会被抓吗

问与答 • YVAN7123 • Nov 13, 2024 • Lastly replied by Charon2050

69

有人知道企查查发票抬头里的数据是爬哪里获取的吗？能包含电话和银行信息

问与答 • fivee • Nov 4, 2024

跟上次的小姐姐视频，有人希望自定义内容，于是撸了一个快手的刷短视频工具

分享创造 • rui6ye • Oct 16, 2024 • Lastly replied by yuanxing008

2

180.163.28.0/24 频繁爬取内容

站长 • mfweb • Jul 20, 2024

请教下基于大模型的聚合搜索方案吗

问与答 • garyvalue • Jun 25, 2024 • Lastly replied by vx007

1

那些 tiktok 相关的平台如 fastmoss 他们的数据是哪里来的

问与答 • yuhongtai114514 • Jun 25, 2024

从哪能爬取北京二手房成交价、面积、朝向等数据

问与答 • abcfreedom • Jun 3, 2024 • Lastly replied by abcfreedom

8

一天时间做一个微信公众号文章的爬取工具，(会不会被告)，只是练手玩。

分享创造 • rui6ye • Jun 1, 2024 • Lastly replied by kebamt

4

请问新片场的视频是不是现在不能进行爬取了

Python • xiaoqi6pi112 • Jun 11, 2024 • Lastly replied by xiaoqi6pi112

15

爬取 leetcode 题目疑问

程序员 • hytirrb • May 27, 2024 • Lastly replied by yjfkk

3

求助：推特如何获取其他人的完整关注列表

Twitter • nnmm123 • Apr 23, 2024 • Lastly replied by kdwnil

16

cdn 问题想请教：知道一个 cdn 的地址，但是不知道具体的文件路径，要怎样能把 cdn 里面的文件全部爬下来

新手求助 • standchan • Apr 22, 2024 • Lastly replied by dier

5

关于自动化测试的正确方式

Node.js • xxxxdingdong • Apr 8, 2024 • Lastly replied by oooolongtea

4

关于谷歌收录.如何禁止某个标签的内容收录?

搜索引擎优化 • xguanren • Mar 29, 2024

多用户的爬虫服务，如何分配资源，确保每个用户的任务都能执行？

1

Python • callmejoejoe • Dec 21, 2023 • Lastly replied by PiersSoCool

12

如果你在用一个叫做 V2EX Plus 的插件，我需要你的帮助

5

V2EX • Livid

PRO

• May 16, 2023 • Lastly replied by enrolls

39

v2ex plus 用户们，你们知道你们的浏览器被用来跑分布式爬虫了吗

39

程序员 • Xianmua • Jun 4, 2023 • Lastly replied by Anna1879

185

爬虫技术的讨论

程序员 • zhoudafa6780022 • Mar 10, 2023 • Lastly replied by xlh001

22

寻一个 Python 长期的 jiān 职

Python • tiptop • Oct 31, 2022 • Lastly replied by Michelangelono

5

有哪些长期稳定更新的数据源？

问与答 • louhubiao • Jan 5, 2022 • Lastly replied by louhubiao

4

[上海] [米哈游] 爬虫工程师内推（急招）

酷工作 • addenvex • Jun 9, 2021 • Lastly replied by addenvex

6

有没有这样一款软件或者开源代码，可以按照输入的网站进行爬取，并根据设定的主题进行内容分类？

程序员 • sjmcefc2 • Dec 20, 2020 • Lastly replied by veike

10

为了给公司的产品做 SEO，自己写了个网站蜘蛛日志分析工具

分享创造 • kwklover • Nov 8, 2020 • Lastly replied by yanzhiling2001

4

发现 dogedoge 还挺好用的，已改为默认搜索引擎

1

分享发现 • balabalaguguji • Jan 31, 2020 • Lastly replied by harryge

10

Python 思路

Python • v2LeoEx • Jan 9, 2020 • Lastly replied by shyrock

3

关于爬虫技术的商业模式创新

产品经理茶话会 • 2ruowqe9r • Dec 17, 2019 • Lastly replied by vcen99

7

不懂就问，这个现象出现的原因是什么?

问与答 • Sornets • Aug 28, 2019 • Lastly replied by Sornets

3

爬取上千个不同类型的网站中的文章，大佬们有没有啥解决思路？

Python • Wh0amis • Jul 22, 2025 • Lastly replied by brave256

37

一个爬虫的过滤问题

Python • yumenoks • Jul 17, 2019 • Lastly replied by yumenoks

6

求助 Python 大佬，比特币区块的 HASH 值爬取出现问题，该怎么解决呢？

Bitcoin • yuyang4271 • Jun 4, 2019 • Lastly replied by acess

4

百度如何收录新站啊？一个月了才收录主页，谷歌基本全部收录，排名较后而已，百度一点动静都没得

站长 • pycoder233 • May 17, 2019

Python 爬虫分析网易 163 邮箱的邮件列表节点（加载方式）遇到阻碍...

程序员 • Northxw • Mar 15, 2019 • Lastly replied by Northxw

7

今天下午来个 Python 线下讲模拟浏览器爬取和动态爬虫

程序员 • mingsaulchang • Aug 1, 2018 • Lastly replied by zibber

1

[爬虫]看一下这个网站难爬吗?

Python • magicfam • Dec 20, 2018 • Lastly replied by sml2h3

10

HLS 流视频媒体如何进行爬取

Go 编程语言 • whoami9894 • May 24, 2018 • Lastly replied by lanwairen123

13

南京 Python 求职，一年开发经验，熟悉 rabbitmq、Redis、MongoDB

求职 • yang4001 • Apr 13, 2020 • Lastly replied by U87

3

大家是怎样爬取亚马逊(美国)的数据？爬取速度怎么样？

Python • adapalene • Aug 24, 2017 • Lastly replied by qq12345454

9

作为一个后端狗,第一次尝试做了个小站, 大家给指点下

分享创造 • cxydhd • Jan 25, 2017 • Lastly replied by cxydhd

39

如何隐藏页面的文字来避免爬虫？

1

问与答 • nikoo • Jan 21, 2017 • Lastly replied by fantasts

26

[微博] 设计一款程序，实现在线抢红包的问题

奇思妙想 • Satan4869 • Jan 9, 2017 • Lastly replied by zangev5

4

关于爬虫的几个疑问

问与答 • klxq15 • Oct 17, 2016 • Lastly replied by howeroc

2

请教 pyspider 问题

Python • xummerj • Jul 12, 2016 • Lastly replied by jason52

16

求 pyspider 教程

问与答 • xummerj • Jun 3, 2016

程序员专属的买房工具, 邀请几名苛刻的测试者参与

4

分享发现 • lygmqkl • Jan 30, 2024 • Lastly replied by a13821190779

482

微博、微信公众号现在有什么比较好的爬虫方案吗?

问与答 • cqcn1991 • May 1, 2016 • Lastly replied by cqcn1991

8

如何突破豆瓣爬虫限制频率？

Python • SummerSun • Dec 30, 2019 • Lastly replied by QUIOA

27

JAVA 爬虫 WebCollector 2.x 入门教程——基本概念

Java • briefcopy • Dec 28, 2015 • Lastly replied by briefcopy

10

scrapy 怎么设置爬虫跳到下一个 start_url？

Python • ningyu • Dec 19, 2015 • Lastly replied by fangdingjun

3

爬虫这种东西受制于网速么，明明我睡很久了。。。

Python • RadAsm • Nov 22, 2015 • Lastly replied by coolzilj

6

结构化数据的爬取，存储，检索有什么好的实践吗？

问与答 • lyping • Nov 12, 2015

理论上爬虫能爬取到所有我们看到的页面吗?

问与答 • zoosucker • Apr 29, 2014 • Lastly replied by zoosucker

11

怎么简单地获得一个博客的所有博文（摘要）？

问与答 • yqf3139 • Feb 17, 2014 • Lastly replied by tearsinchina

5

Scrapy: 爬取豆瓣书籍 //以及几个简单实例

程序员 • alexapollo • Feb 1, 2014 • Lastly replied by robertlyc

11

求1牛逼网站爬取框架

问与答 • jiankangxin • Nov 22, 2013 • Lastly replied by jiankangxin

5

需要爬取一个网站内容，需登录和验证码（简单字母数字），怎么破？

问与答 • daoluan • Jul 18, 2013 • Lastly replied by zhwei

29

About · Help · Advertise · Blog · API · FAQ · Solana · 1249 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 124ms · UTC 23:41 · PVG 07:41 · LAX 16:41 · JFK 19:41
♥ Do have faith in what you're doing.