V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
netnr
V2EX  ›  分享创造

docsify + vercel serverless 实现 SSR , SEO 优化

  •  
  •   netnr ·
    netnr · 2020-06-30 07:42:21 +08:00 · 1378 次点击
    这是一个创建于 1606 天前的主题,其中的信息可能已经有所发展或是发生改变。

    脚本:https://github.com/netnr/np/blob/master/docs/api/vdocs.js

    配置:https://github.com/netnr/np/blob/master/docs/vercel.json

    包含所有静态资源文件(不然发布不带静态资源文件)

    "functions": {
        "api/vdocs.js": {
          "includeFiles": "./**"
        }
     }
    

    处理的逻辑

    • 判断 user-agentbotspidercurl等关键字,视为爬虫
    • 根据访问路径读取文件,有直接返回,无则添加 .md 后缀读取,能读取到就调 marked 组件转换再输出

    说明

    • docsify 依旧如此,不受影响,路由从 hash 改为 history
    • .md 链接,避免用 markdown 链接模式,因为 docsify 会异步请求 file.jpg.md ,改为 a 标签 或 <url 链接> 模式
    • 处理后的源码是 包含了 markdown 转为 HTML 的代码,让爬虫能获取内容,不兼容 docsify

    https://zme.ink

    第 1 条附言  ·  2021-02-24 12:37:02 +08:00
    脚本地址: https://github.com/netnr/np/tree/master/docs/api

    vercel 部署的跨域代理被邮件警告了,已经关了
    9 条回复    2020-07-14 14:54:13 +08:00
    yuzo555
        1
    yuzo555  
       2020-06-30 08:09:13 +08:00
    不错

    我发现 docsify 不使用 SSR 输出的内容,Google 是可以识别和收录的,但是百度不行。
    搜索引擎技术差还需要广大程序员耗费精力和服务器资源来解决,就挺不爽的。
    xJogger
        2
    xJogger  
       2020-06-30 08:47:51 +08:00 via Android
    大大,vercel 版本的 cors 是不是还有点问题。
    昨天测试了个链接显示 502 。
    链接我贴在 pastbin 了:
    https://pastebin.com/raw/kK7x5b81
    (对象存储流量只有 75G,所以设置了 pastbin 有效期一周哈)
    noqwerty
        3
    noqwerty  
       2020-06-30 08:53:42 +08:00
    @yuzo555 #1 Google 现在的爬虫是处理 js 的吧
    netnr
        4
    netnr  
    OP
       2020-06-30 09:16:31 +08:00
    @xJogger 下载小文件可以,大文件好像不行,或许方式不对,具体情况还得看文档,主要是针对接口代理

    基于 cloudflare workers 提供的跨域服务可以 https://cors.zme.ink/talfiles.s3.fr-par.scw.cloud/Python.pdf
    netnr
        5
    netnr  
    OP
       2020-06-30 09:18:46 +08:00
    docsify 现目前的 ssr 示例 没玩明白,v5 版本好像可以生成 静态页面,但是进度缓慢
    xJogger
        6
    xJogger  
       2020-06-30 09:37:30 +08:00 via Android
    @netnr 对,我测试了 cfworker 可以。
    netnr
        7
    netnr  
    OP
       2020-07-01 11:11:09 +08:00
    @xJogger 原因找到了,平台限制 10 秒超时,下载大文件不行
    xJogger
        8
    xJogger  
       2020-07-01 12:46:30 +08:00 via Android
    @netnr 感谢。就是说一个 serverless 函数一次最多运行 10S,之后就被强制结束了是吧。看来还是 cfworker 功能好一点。
    lxk11153
        9
    lxk11153  
       2020-07-14 14:54:13 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2863 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 11:17 · PVG 19:17 · LAX 03:17 · JFK 06:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.