只是爬取门户网站于公众号吗? 请问下 v 友们有知道的比较详细的吗?或者有相关的文章与图书推荐的吗?谢谢
1
happinessnch 2021-05-13 08:23:36 +08:00
找实习生来爬虫+洗稿吧, 盲猜的,这种是成本最小的,
主打算法千人前面,内容保持不慢于行业太多,慢慢用户多了,再考虑自创内容。 |
2
Rocketer 2021-05-13 08:27:12 +08:00 via iPhone
根本不洗稿,人家都注明出处的,只是没有授权,不让爬硬爬而已。
实习生确实有很多,但不是洗稿用的,而是给文章打 tag 的,否则怎么按兴趣推荐? |
3
reiji 2021-05-13 08:28:10 +08:00 4
http://www.chinanews.com/cj/2014/06-06/6250065.shtml
随便一搜就有,当时闹得还挺大的,搞得我有几年一直以为这个项目已经没了 |
4
EIJAM 2021-05-13 08:39:45 +08:00 via iPhone
不要脸硬爬。反正就算打官司也要过好几年了,先抢到流量就行。
|
5
murmur 2021-05-13 08:44:01 +08:00
洗稿啊,多简单,搜今日头条 抄袭 要多少有多少
|
6
xingshu1990 2021-05-13 08:48:45 +08:00
简单:知网、万方上的 PDF 或者本身自己格式的内容,全部下载过来,购买泰比( ABBYY )训练 OCR 中文词库,然后 OCR 出来的内容,进行人工校对,混编。
或者就是开着某车头采集过来,进行软件,或者人工混编。 |
7
yitingbai 2021-05-13 08:59:28 +08:00
我是今日头条最早最早的用户, 那时候用的人都不多, 反馈问题客服马上就回复了, 可以肯定的说, 所有文章都是爬来的, 后来用户多了才开始做自己的内容, 扶持创作者
|
8
konnnnn 2021-05-13 09:10:15 +08:00 1
今日偷条,贴吧帖子都偷不少
|
9
lostSoul 2021-05-13 09:30:18 +08:00
你们想得太夸张了,, 这种行业很多 很多都是人工操作 可以去搜搜网站编辑岗位 基本都是这种 每天公司会给他们一个标签或者标题,然后叫他们去各种网站 copy 拼接,老缝合怪了 内容看起来多就好 不需要流畅
|
10
bullfrog 2021-05-13 09:58:38 +08:00 via iPhone
这类问题还有抖音的初创内容是怎么开的
|
11
aogu555 2021-05-13 09:59:34 +08:00
都是人编的,头条早期烧钱很厉害,头条发新闻几乎没有审核,1w 阅读大概 10 元左右,还在上学的我靠一个科技类账号每月赚几千生活费,那时候历史类和生活类是最赚钱的,那时候各种新闻类 app 疯狂烧钱,头条号,大鱼号,搜狐号,企鹅号,人人都能发新闻,现在假新闻泛滥字节跳动功不可没。https://www.sohu.com/a/62620237_118786
|
13
dawangyezi 2021-05-13 11:49:19 +08:00
爬来的
|
14
gxt92 2021-05-13 13:24:56 +08:00
冷启动吧,内容爬虫、寻找种子用户、核心创作者、创建社区
|