这种文档对比前端是用什么技术实现的？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

This topic created in 1206 days ago, the information mentioned may be changed or developed.

https://calliper.cn/s/83d333196af34c8fa75b33448fe4f932

Supplement 1 · Jan 18, 2023

前端有没有现成的插件

文档

对比

前端

实现

18 replies • 2026-02-27 14:15:23 +08:00

murmur

Jan 18, 2023

首先你得实现 office 文档的前端浏览，这已经巨牛逼了

然后他居然支持 pdf 、扫描件、word 的交叉比对，虽然原理不清楚，但是测试一定没少做

murmur

Jan 18, 2023

当然你可以选择两边都是 pdf 浏览器，不过 pdf 浏览器面对国内奇葩的格式也得跪下，现在好用的 office 转 pdf 都是商用方案

xiangyuecn

Jan 18, 2023

网页只不过是个 UI 而已，仅此而已。重量级的在后端

johnnyNg

Jan 18, 2023

看一下接口，工作量主要在后端，后台已经标好了所有 diff 的位置，内容

az031120103

Jan 18, 2023

@murmur 看了下，文件是用 canvas 渲染的

az031120103

Jan 18, 2023

@johnnyNg 估计是前端计算每一页改动点的色块位置，宽高，svg 高亮一下

az031120103

Jan 18, 2023

@xiangyuecn 后端也就多了一个查词对比，前端 ui 也没那么容易画的

dumbass

Jan 18, 2023

去这个家公司入职，就知道了😆

stevenhan

Jan 18, 2023

感觉普通写个更新文档什么的还挺好用，但是案例是个债券发行公告，感觉是对文字要求非常严谨甚至苛刻的领域。
先不说 diff 怎么做的，PDF 识别用了 OCR ，那就存在识别出错的可能。
很好奇，这种产品如果出错导致 diff 漏了，造成客户损失，会赔付吗，如果不赔付，需要客户进行二次检验人工 diff ，那貌似产品的意义也不存在了。

hhjswf

Jan 18, 2023 via Android

工作量明显前端大。。

hhjswf

Jan 18, 2023 via Android

不可能有现成的，这肯定人家手撸出来的

xiadd

Jan 18, 2023

我看了一下 pdf 的渲染是用的 pdfjs ，至于 diff 肯定是后端做的，之前做过类似的东西，前端工作量也不小

WasteNya

Jan 18, 2023

涉及到这块领域的，很多都是商业机密，虽然不知道那个网站的具体思路，我说一下如果我要实现 pdf 、word 的交叉对比的话（手动狗头）

1. 最终所有文件的格式均已 pdf 展示（确保高保真），至于 word 高保转 pdf ，嘿嘿，机密！
2. pdfjs 预览的结果会有两层，一层是展示层，一层是文字层（不展示，但包含了位置信息以及文字的 html 标签）
3. 将文字层进行对比，这个前端后端都可以实现，如果嫌 html 对比麻烦，可以转换下使用 ast 或其他格式等等
4. 将对比的结果整理下根据条件来使其变换下背景颜色，就能实现 OP 提到的效果了