viaNull
V2EX  ›  问与答

百度知道的部分网页,部分文字用图片来代替了,可能是什么目的?

  •  
  •   viaNull · Oct 22, 2014 · 8505 views
    This topic created in 4243 days ago, the information mentioned may be changed or developed.
    偶然发现,在百度知道答案区域,是由文字穿插着图片来的,是出于什么考虑呢?
    如: http://zhidao.baidu.com/link?url=yaSXy7MjKU05cCqZiiv0_pXJKexxGTK3IwIKcfWEdH8uoVS6Aiu4fvawu1i6l6gGkhArGDW_I9-GLcTSbUbVi_

    打开之后,看答案部分网页源码。
    Supplement 1  ·  Oct 22, 2014
    append 一个图试试

    应该是我学校出口IP被认定为爬虫了吧,情况是这样的:
    http://dl-paper.qiniudn.com/123.png
    Supplement 2  ·  Oct 22, 2014
    感觉 29L正解
    37 replies    2014-10-23 09:12:18 +08:00
    Tonni
        1
    Tonni  
       Oct 22, 2014 via Android
    搜索也是,不知道出于什么目的
    akira
        2
    akira  
       Oct 22, 2014
    防拷贝?
    cxe2v
        3
    cxe2v  
       Oct 22, 2014
    我看到的仍旧是文字
    cjjia
        4
    cjjia  
       Oct 22, 2014
    @cxe2v 仔细看看,按ctrl+a 键
    viaNull
        5
    viaNull  
    OP
       Oct 22, 2014
    貌似是最近几天才弄的,之前还没发现
    heylogo
        6
    heylogo  
       Oct 22, 2014
    @viaNull 好久之前就这样了
    zzNucker
        7
    zzNucker  
       Oct 22, 2014
    我看到的都是文字
    cougar
        8
    cougar  
       Oct 22, 2014
    图片指的是哪个?类似问题那里的第一个吗?
    cst4you
        9
    cst4you  
       Oct 22, 2014
    我看到的都是文字
    iscraft
        10
    iscraft  
       Oct 22, 2014
    chromium 都是文字
    cevincheung
        11
    cevincheung  
       Oct 22, 2014
    看到的仍旧是文字
    xifangczy
        12
    xifangczy  
       Oct 22, 2014   ❤️ 1
    你说的是
    <img id="selectsearch-icon" alt="搜索" src="http://img.baidu.com/img/iknow/qb/select-search.png">
    这个么?这是划词搜索啊
    qiayue
        13
    qiayue  
    PRO
       Oct 22, 2014
    防爬虫,防抓取
    nsxuan
        14
    nsxuan  
       Oct 22, 2014 via Android
    防采集,把你认为是爬虫了
    Perry
        15
    Perry  
       Oct 22, 2014   ❤️ 1
    @xifangczy 正解。。。
    lausius
        16
    lausius  
       Oct 22, 2014
    估计是防复制防抓取吧。其实我发现这个前几个月时间已经这样了,不过偶尔也会正常,像现在我这边打开就是正常显示文字的。
    viaNull
        17
    viaNull  
    OP
       Oct 22, 2014
    @xifangczy 看来我们的情况不一样,我这里有类似这样的:

    写入<img class="word-replace" src="http://zhidao.baidu.com/api/getdecpic?picenc=684764616f8b10">文件<img class="word-replace" src="http://zhidao.baidu.com/api/getdecpic?picenc=684773746f708b10"><img class="word-replace" src="http://zhidao.baidu.com/api/getdecpic?picenc=6847686f758b10">面跟着a.txt<img class="word-replace" src="http://zhidao.baidu.com/api/getdecpic?picenc=6847636f6d6d618b10"><img class="word-replace" src="http://zhidao.baidu.com/api/getdecpic?picenc=68476a69758b10">表示写入<img class="word-replace" src="http://zhidao.baidu.com/api/getdecpic?picenc=684764616f8b10">a.txt
    viaNull
        18
    viaNull  
    OP
       Oct 22, 2014
    @nsxuan 感觉是的
    pimin
        19
    pimin  
       Oct 22, 2014
    表示打开任然是文字
    mornlight
        20
    mornlight  
       Oct 22, 2014
    都是文字啊。我还把src=都看了一遍,没找到正文里有图片。
    url
        21
    url  
       Oct 22, 2014 via Android
    拷贝,采集
    aWangami
        22
    aWangami  
       Oct 22, 2014
    好像不是所有人都能看到图片,特定情况才会触发
    sloppysop
        23
    sloppysop  
       Oct 22, 2014
    仍旧是文字。
    Jreen
        24
    Jreen  
       Oct 22, 2014
    仍然是文字。
    rrfeng
        25
    rrfeng  
       Oct 22, 2014
    见过图片。应该是防爬虫采集答案吧。
    xiaoai
        26
    xiaoai  
       Oct 22, 2014
    登陆后为文字,图片是防止爬虫爬答案
    cst4you
        27
    cst4you  
       Oct 22, 2014
    图片真是愚蠢的做法, 一个换了字体的浏览器或者非windows, 就破功了.
    loserwn
        28
    loserwn  
       Oct 22, 2014
    估计po主被小流量了吧
    caomu
        29
    caomu  
       Oct 22, 2014
    sxliusir
        30
    sxliusir  
       Oct 22, 2014
    打开都是文字
    xiaolang
        31
    xiaolang  
       Oct 22, 2014
    仍然是文字。 暂未发现有图片的情况
    fr0m
        32
    fr0m  
       Oct 22, 2014
    都是文字,是灰度发布还是跟系统有关?
    Aegg
        33
    Aegg  
       Oct 22, 2014
    防爬虫
    fghdvbgt
        34
    fghdvbgt  
       Oct 22, 2014
    都是文字+1
    jacob
        35
    jacob  
       Oct 22, 2014
    是文字,不过划词搜索有时候让你以为图片,
    whywhywhy
        36
    whywhywhy  
       Oct 23, 2014
    好久以前就有了,有些文字会替换成图片(但是看起来差不多,不容易区分),防止爬虫吧。

    因为各大网站的问答这一块 都是互相采集的
    DRcoding
        37
    DRcoding  
       Oct 23, 2014
    连续F5刷新几遍后就会跳到 403 error页面,竟然是这种设定,Orz...
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5825 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 241ms · UTC 02:13 · PVG 10:13 · LAX 19:13 · JFK 22:13
    ♥ Do have faith in what you're doing.