V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
monetto
V2EX  ›  问与答

百度搜索的结果 如何转化原 URL

  •  
  •   monetto · 2021-06-16 14:20:23 +08:00 · 1006 次点击
    这是一个创建于 1257 天前的主题,其中的信息可能已经有所发展或是发生改变。

    打开百度搜索结果的网页的时候,总是先跳转到一个 www.baidu.com/link?url=xxx 的东西。

    有办法不跳转这个,直接跳转到原网页吗?后面那一大坨怎么转化为原 URL 。

    有知道的老哥吗

    11 条回复    2021-06-17 11:45:56 +08:00
    xiaofeifei8
        1
    xiaofeifei8  
       2021-06-16 14:26:32 +08:00
    收购百度
    Aaron55
        2
    Aaron55  
       2021-06-16 14:29:00 +08:00   ❤️ 1
    我用的油猴插件 AC-baidu 脚本
    Vegetable
        3
    Vegetable  
       2021-06-16 14:32:07 +08:00
    NO,稍微研究过一点,貌似这是无法还原的一种私有算法。可能是百度那个什么惊雷算法的一部分。

    想获取原地址也非常简单
    curl -s https://www.baidu.com/link\?url\=Y8DY7HIGlqkGOpShmE-yN6mAMR9qSblQsuR3bFJQIAd9LTmonH3Hvztdj5GAL9ODrfNNfX4Ap1OWVGA8wq-x0SGjfKSUe5XEyXoHvupOUpC\&wd\=\&eqid\=8ab89536000051080000000460c999de |grep -E -o '"http.+"'
    itianjing
        4
    itianjing  
       2021-06-16 14:33:09 +08:00   ❤️ 1
    同 AC-baidu 脚本
    xingshu1990
        5
    xingshu1990  
       2021-06-16 14:34:37 +08:00
    python 的脚本,看下面的箭头中的内容:上面获取了带参数的,编码后的 URL,下面再访问一下 get 这些 URL,直接返回其.url ,就能获取真实连接了
    monetto
        6
    monetto  
    OP
       2021-06-16 14:35:53 +08:00
    @Vegetable 这样的话,还需要发送一个请求才能获知,要是能在本地解析就好了...ORZ
    monetto
        7
    monetto  
    OP
       2021-06-16 14:37:07 +08:00
    @xingshu1990 问题是这样,和直接用浏览器打开跳转。就一样了。我想要省略掉第一次访问 link 的请求,直接从搜索结果访问原网址
    monetto
        8
    monetto  
    OP
       2021-06-16 14:37:23 +08:00
    @Aaron55
    @itianjing
    好的,我研究下。
    ik
        9
    ik  
       2021-06-16 19:43:04 +08:00 via iPhone   ❤️ 1
    monetto
        10
    monetto  
    OP
       2021-06-17 09:53:37 +08:00
    @ik 感谢,提供了一种思路
    ik
        11
    ik  
       2021-06-17 11:45:56 +08:00 via iPhone
    @monetto 客气,这也是另外一位 v 友之前提到的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3601 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 00:57 · PVG 08:57 · LAX 16:57 · JFK 19:57
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.