我现在做一个发票的四要素提取功能,同样的配置关闭思考模式,测试豆包阿里在 python 里面用 OpenApi 跑一轮要 10S ,换成各模型自己的请求地址 只需要 1-3S,不知道什么原理,会不会是挂了 clash 的原因