一个数据汇总统计的问题

已经用 pandas 从几张销售大表中把数据汇总到一张表中了，如图，(目前只有这个水平，噗)，我目的是要及时跟进包材，品牌很多，每个品牌 10kg 到 15kg 共用一种包材，各品牌不通用，0.7 到 1kg 到共用同一种包材，各品牌通用。图上已经手工处理了数据。我现在想用 python 完成这个统计工作，感觉无从下手，请各位前辈指教。开始我想做一张包含所有规格的表，一一比对，但感觉太蠢了，见笑😜

href

汇总

统计

数据

8 replies • 2022-03-25 17:30:44 +08:00

skysuhey

Mar 23, 2022

处理这种数据没必要用 Python ，Excel 不是更加直观便捷吗

dlsflh

Mar 23, 2022 via Android

想起了那个黑板上画 office 讲课的非洲老师。

MTMT

Mar 23, 2022

```python
def get_type(row):
if row['规格'].between(0.7,1):
return '小包材'
else:
reutrn row['品牌名']+'_大包材'

d['分类'] = d.apply(lambda get_type, axis=1)

output = d[['分类', '数量']].groupby('分类').sum()
```

MTMT

Mar 23, 2022

不知道 v2 支不支持 markdown ，上面缩紧都乱了，有一行改一下，凑合看吧

d['分类'] = d.apply(get_type, axis=1)

nbjbsjb

Mar 24, 2022 via iPhone

@MTMT 谢谢，我研究一下

gengchun

Mar 24, 2022

@skysuhey 现在有 qgrid 还有 plotly dash 这种交互式的，其实还可以。

excel 太复杂的，其实也有不少问题。

skysuhey

Mar 24, 2022

@gengchun 学到了，不过对于 op 这种就一个 vlookup 分下类再 sum 求和就行了，感觉还是 Excel 简单点

imn1

Mar 25, 2022

分牌子 dataframe.groupby(['牌子'])
分规格 dataframe.groupby(['规格'])
分牌子及规格 dataframe.groupby(['牌子', '规格']) #注意有序

groupby 可以简单看作一个把字段当成 index 的 dataframe ，然后操作，当然这个理解不严谨，详细请查阅手册关于 groupby 章节