1
qfdk 2016-09-18 03:39:51 +08:00 1
很简单啊- -,有个东西叫做 Apache zeppelin , 你把 mysql 的导出成 csv ,然后读进去,就可以 SQL 进行查询,最后还是图表形式展现给你。一个 group by 就好了。
Scala 进行处理 |
2
codenamea OP @qfdk 我想要的是 mysql+python 的方案。
而且我需要的是解决 [连续 n 天 sell_count 都在增长的商品,并且按照增长幅度排名的 top10] 。 不是单纯的 order by. 是要 n 天内连续增长。不是 n 天总增长 top |
3
vietor 2016-09-18 06:33:16 +08:00 via Android
spark 写个 Python 脚本
|
4
ruoyu0088 2016-09-18 06:38:07 +08:00 1
用 pandas: 先计算 diff() > 0 ,得到前后两天的差为正的布尔序列。然后使用 rolling sum 计算移动和,如果移动和等于窗口大小 N 就是连续增长 N 天。
|
5
CrowQu 2016-09-18 10:38:49 +08:00
看数据量,你要日流水过百万用 mysql + python 就算了吧
|
9
imn1 2016-09-18 15:41:17 +08:00
python with pandas 的移动统计做这个很方便,参看 pandas 手册 computational tools 一章
|
11
loryyang 2016-09-18 21:20:14 +08:00
pandas, numpy
|
12
winglight2016 2016-09-19 13:53:23 +08:00
要想通用一些,找些开源的数据仓库软件就可以基于任意维度作分析报表了,自己写代码和 sql 多麻烦
|