最近给公司内部系统补了个 Chrome 插件,原因挺土的:业务中台要接一些第三方后台,员工其实已经在浏览器里登录了,但系统侧重新处理登录态、过期、跨域这些事,越做越别扭。
一开始也试过后端去拿数据。比如淘宝、天猫、京东页面里的评论图、规格、原价、现价,运营要拿来补商品库和做低频比价。调频次、降速度、拆任务都试过,最后还是容易被风控,维护起来也烦。
后来改成浏览器插件:员工打开页面,插件从当前页面 DOM 里取当前能看到的内容,再导回内部系统人工确认。插件本身也必须登录公司业务中台后才能用,不是谁装了都能导。
这方案不高级,但目前对我们最稳。
想问下大家,类似这种第三方后台 / 电商页面里的数据,你们一般怎么处理?服务端采集、浏览器插件、RPA ,还是买现成服务?
一开始也试过后端去拿数据。比如淘宝、天猫、京东页面里的评论图、规格、原价、现价,运营要拿来补商品库和做低频比价。调频次、降速度、拆任务都试过,最后还是容易被风控,维护起来也烦。
后来改成浏览器插件:员工打开页面,插件从当前页面 DOM 里取当前能看到的内容,再导回内部系统人工确认。插件本身也必须登录公司业务中台后才能用,不是谁装了都能导。
这方案不高级,但目前对我们最稳。
想问下大家,类似这种第三方后台 / 电商页面里的数据,你们一般怎么处理?服务端采集、浏览器插件、RPA ,还是买现成服务?