问下大佬, 要用 java 通过逻辑运算生成一张表格(数据量大概 10 亿), 后面需要对该表格做统计分析, 有没有好的建议
配置: 系统: windows10 内存: 20G cpu: i710 代 硬盘: 5900rpm 写入 10m/s
目前的做法是如下:
- 生成期间尽可能不查询数据库在内存中做过滤等处理(有 5 个 for 循环, 还是不可避免调用了 4 次数据库查询 + 1 次数据库插入), 在存到 mysql
- 使用并行开了 128 个线程去处理
- mysql 连接数设置到 150
目前情况:
- cpu 使用 10%不到
- 内存使用不到 3G
- 硬盘平均写入 3m/s
由于数据后期需要做很多类似 count, sum 之类的运算 es, map reduce 可能不适合,
能想到的优化方案:
- 考虑 mysql 放到 ssd 盘中
- 增加线程数