python数据分析工具pandas作业:合并excel重复行

python数据分析工具pandas作业:合并excel重复行

工作中经常有些数据,从多个EXCEL表中汇总后,会出现同一项目多条记录的情况,需要合并这些对应的记录。

数据示例:

下图中,我们state和year能确定一个项目,但是有2条记录,我们需要把对应记录的pop值相加。

图片.png

代码

#!/usr/bin/python3
# -*- coding: utf-8 -*-
# 技术支持:https://www.jianshu.com/u/69f40328d4f0 
# 技术支持 https://china-testing.github.io/merge_excel_rows.html
# https://github.com/china-testing/python-api-tesing/blob/master/practices/pandas/merge_excel_rows.py
# 项目实战讨论QQ群630011153 144081101
# CreateDate: 2018-12-06
import pandas as pd

frame = pd.read_csv("test.csv")
df =  frame.groupby(['state', 'year']).sum()
df.to_csv("out.csv")

输出的out.csv如下:

图片.png

参考资料

links