AmItheRobot
V2EX  ›  问与答

怎样获取 Google 搜索结果里的完整摘要?或类似缓存快照?

  •  
  •   AmItheRobot · Feb 21, 2019 · 1901 views
    This topic created in 2651 days ago, the information mentioned may be changed or developed.

    我是文科生,所以表述上肯定不准确,大佬们明白意思就好哈^_^

    例如,Google 搜索这个关键词:

    https://www.google.com/search?q="和 adc 说是兄弟站其实很勉强"
    

    得到唯一的搜索结果

    但会发现,它的链接打不开了。那么假如我们就是想知道该网页的全文,该怎么办呢?

    • 尝试用 http://cachedview.com/ 打开该页面的 Google Cache 和 Archive.org ,发现这俩都没“收录”(或者说爬取,不知道专业术语)
    • 尝试在 archive.today 里找,发现也没有人预先抓过

    到这里我就没辙了。但是很显然,谷歌数据库里存储了该页面的完整摘要(因为能搜索到呀),而且可通过以下链接窥得一二:

    https://www.google.com/search?q="管理员 lurch 为人很有原则而且貌似很有钱"
    https://www.google.com/search?q="估计都捐不了.该站有专门申请邀请的板块"
    

    所以这种能用谷歌搜出来,但却打不开,几大快照服务也没收录的情况,有啥办法还能获得内容么?例如获取谷歌存的摘要?

    PS:这个帖子问的是方法(渔),不是例子(鱼),这篇帖子已经通过其它方法找到全文了…此处只是举例,谢谢

    5 replies    2019-06-22 19:12:18 +08:00
    Windelight
        1
    Windelight  
       Feb 22, 2019 via Android
    你想做什么?是爬谷歌还是说想要永久存储网页?我唯一建议你云出国。
    我认为你说的是每一条搜索结果下面的标题下面的小字吧?你直接爬出原始链接,然后看 head 里面的 description 就可以了,没有的话直接从正文提取就可以啦。谷歌没有那种说纯文字展示的接口
    Windelight
        2
    Windelight  
       Feb 22, 2019 via Android
    @Windelight 如果可以的话请您也把您的方法也贴出来 thanks
    AmItheRobot
        3
    AmItheRobot  
    OP
       Feb 22, 2019
    继续求助
    o0OoO0o
        4
    o0OoO0o  
       Jun 19, 2019
    有结果了吗?
    AmItheRobot
        5
    AmItheRobot  
    OP
       Jun 22, 2019
    @o0OoO0o #4 没
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   959 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 20:24 · PVG 04:24 · LAX 13:24 · JFK 16:24
    ♥ Do have faith in what you're doing.