html 是用 Wget 拉取整个网站下来储存在 VPS 上。 Wget 渲染可能不是最好。 调用 Google 付费翻译 API 翻译整个 html 网站,这个有人搞过吗?(不用破解或免费 api ) 翻译方向:英文->中文 翻译整站,整站关键字 /专业术语替换,这个有什么好的思路吗?愿意求好心人大神思路指点一二,感激不尽。
1
xy2401 2019-02-16 12:30:43 +08:00
目前我是 在 Google 译者工具包 里面一个一个 html 文件上传翻译。里面你可以上传制定自己都专业术语翻译。
但是批量没有 。而且翻译后 部分 链接 和 css 也变了 还要手动调整 mark 我也好强 有什么 好都方案 |
2
wbrobot 2019-02-16 13:07:16 +08:00
谷歌翻译有个 js 的 api,直接在页面里面引用一个 js,就会翻译文字部分。
|
3
lbuzhi 2019-02-16 13:42:04 +08:00
以前一个项目使用过 google 翻译的那个 js 的 api ( 2 楼说的那个),根据需要去定制需要翻译的语言,然后页面上引入,即可做到用户点击按钮,翻译整个页面或部分页面。
|
4
ninestep 2019-02-17 10:20:05 +08:00
我弄过,是下载下来后把所有标签全部过滤,翻译完了再拼接回去,不过我是用的百度翻译,穷,还是好几个密钥循环来的
|
5
tadtung 2019-02-17 14:43:44 +08:00 via Android
前两年曾经见过有把隔壁 hostloc 整站反代并用 api 实时翻译的。
|
6
ty10086 OP @xy2401
@wbrobot @lbuzhi @ninestep @tadtung 我摸索了几个月,也搭建了测试站。1、通过 wget xxx.com+参数,整个目标站点全部镜像为 html,可以不镜像 pdf、zip、rar 等大文件。唯一问题,有的 js 不能很好渲染,比如 js 类型的菜单、ajax 的页面点击会有错误、点击无动作执行。(话说除了 wget 有啥更好的渲染工具?) 接着调用 google translate api 翻译(付费的,100 万字符 /20 美金),是可以翻译的,自动不翻译 html 标签。但是如果整个站点翻译需要切片 5000 字符分割段落,并组合回去不知道如何弄。有达人会的话,请赐教,能搞的话我外包,做一个长期的技术支持顾问。 2、尝试用 python 全站渲染后爬取的思路,也是切片与组合回去的问题。 3、tadtung 大兄弟说的反代,挺想试试的。不过看起来有法儿将翻译后内容储存起来并开放么。不用实时翻译,毕竟专业术语还要全局替换下。 我相信这个是一个刚需,还请各位大兄弟讨论下献计~ |