Python 功能点实现：数据热更新

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

推荐学习书目

› Learn Python the Hard Way

Python Sites

› PyPI - Python Package Index

› http://diveintopython.org/toc/index.html

› Pocoo

值得关注的项目

› PyPy

› Celery

› Jinja2

› Read the Docs

› gevent

› pyenv

› virtualenv

› Stackless Python

› Beautiful Soup

› 结巴中文分词

› Green Unicorn

› Sentry

› Shovel

› Pyflakes

› pytest

Python 编程

› pep8 Checker

Styles

› PEP 8

› Google Python Style Guide

› Code Style from The Hitchhiker's Guide

这是一个创建于 2594 天前的主题，其中的信息可能已经有所发展或是发生改变。

文章在这里： https://www.jianshu.com/p/2d31f1c7ef63

代码在这里： https://github.com/simoncos/practical-python/tree/master/features/hot-reloading

关键词：热更新 | 热重载 | 定时更新 | 即时更新 | 缓存 | functools | cachetools | LRU | TTL

发到这里主要也想问问有没有更好的方法来做这件事（比如是不是要怎样搞个调度 / 消息系统，或者自省？）

第 1 条附言 · 2019 年 1 月 17 日

特别是在多机器并行的环境

第 2 条附言 · 2019 年 1 月 17 日

在多机器并行的情况下，定时更新可能简单一些，但是对于即时更新来说，需要更新到每一台。之前听同事说可能需要一个消息队列再结合类似我这种实现应该可以确保更新的指令到每一台，不重复不遗漏。

更新

functools

cachetools

TTL

14 条回复 • 2019-01-18 10:20:30 +08:00

yangsi

2019 年 1 月 17 日 via iPhone

开一个线程专门做更新。更新线程里面是实时还是定时都可以自己控制。

lihongjie0209

2019 年 1 月 17 日

zookeeper 配置中心

simoncos

2019 年 1 月 17 日 via iPhone

@yangsi 运算的线程如何 load 新数据？

simoncos

2019 年 1 月 17 日 via iPhone

@yangsi 啊算我没说，线程是共享内存的...但是并行下面就有点麻烦了是不？

simoncos

2019 年 1 月 17 日 via iPhone

@lihongjie0209 有没有什么参考？

firebroo

2019 年 1 月 17 日 via Android

@simoncos 多进程使用共享内存呀。。

petelin

2019 年 1 月 17 日 via iPhone

我司方案，每秒从 s3 上把服务配置拉下来。
另外学架构，解决方案不需要贴代码的。因为一段代码肯定解决不了，没啥意义。

beforeuwait

2019 年 1 月 17 日

需要热更新的配置写到 config.py
然后 reload 就行了啊

ctro15547

2019 年 1 月 17 日

redis

simoncos

2019 年 1 月 17 日

@petelin 贴代码是为了说清楚现在的做法咯

simoncos

2019 年 1 月 17 日

@ctro15547 也是缓存类的做法，定时应该还是可以的，即时麻烦一些。

shoumu

2019 年 1 月 17 日

更新很好做，但是保证更新过程中服务的可用，更新过程的数据一致性问题感觉楼主说得不足

说一下我们现在使用的一些方案吧，主要分为配置更新和算法模型更新
配置更新：
1、zookeeper 配置中心，基于订阅的形式
2、统一的字典服务，每次服务使用之前请求或者轮询请求

模型更新：
1、看模型大小情况，如果模型不大的话，用双指针的形式，单独开一个线程用于模型更新，更新完成之后指针切换，指针切换是原子操作，没有安全问题
2、多进程服务，采用共享内存存储模型，由于模型过大，加上更新过程中这个模型可以忍受脏数据，所以就是直接往共享内存里写了。。。

wind3110991

2019 年 1 月 17 日

楼主有造轮子精神值得点赞，这个做 demo 玩玩可以，生产环境不行，只能做一些简单的订阅更新功能，
对于你所说的 “更新 python 对象数据”，我觉得要首先本着 CAP 原则，再分下面三种情况来设置业界的解决方案：
（ 1 ）更新配置文件：更新数据量较小，能容忍一定的时延，但是需要保证高可用—— zookeeper ；
（ 2 ）更新内存数据：数据量大，需要在多个进程间进行切换，短时间内（周期更新）对服务性能要求较高 —— redis ；
（ 3 ）更新数据频繁（实时更新）：拆分为生成者消费者模型，用消息队列来解耦进程间的耦合度，如 Kafka、rocketMQ 等等。

yangsi

2019 年 1 月 18 日 via iPhone

@simoncos 多进程或者分布式应用不是自然就搞一个集中式的配置服务吗？