python-pandas两个相同格式的excel对比输出不同内容

python-pandas两个相同格式的excel对⽐输出不同内容

近期项⽬需要，场景是有两个excel表格，⼀个是之前的旧表格，⼀个是新内容的表格，需要将两个不同的提取出来⽣成新的excel。

python使⽤到的是pandas这个库，前提是需要安装python，和⾃⼰熟悉的开发⼯具。

def drop_duplicates(usedExcel, newExcel, outputExcel):

df1 = pd.read_excel(usedExcel)

df2 = pd.read_excel(newExcel)

c = df1.append(df2)

c.drop_duplicates(keep=False, inplace=True)

print(c)

df = pd.DataFrame(c)

<_excel(outputExcel, index=False)

写了⼀个⼯具函数，需要有两个三个参数第⼀个是旧的excel表格的绝对路径，第⼆个是新的excel表格的绝对路径，第三个是需要输出excel 表格的绝对路径，

思路：先读取两个表格的内容，读取到的类型是DataFrame，然后使⽤pandas⾃带的.append()函数合并两个表格数据，再去除重复值，将去除完成的输出到指定excel

.append()中是将'()'⾥⾯的追加到‘.’前⾯。

.drop_duplicate⽅法是对DataFrame格式的数据，去除特定列下⾯的重复⾏，返回DataFrame格式的数据。

其中.drop_duplicate()有三个参数

subset : column label or sequence of labels, optional

⽤来指定特定的列，默认所有列

keep : {‘first’, ‘last’, False}, default ‘first’

记住我删除重复项并保留第⼀次出现的项

inplace : boolean, default False

是直接在原来数据上修改还是保留⼀个副本