python-pandas两个相同格式的excel对⽐输出不同内容
python使⽤到的是pandas这个库,前提是需要安装python,和⾃⼰熟悉的开发⼯具。
def drop_duplicates(usedExcel, newExcel, outputExcel):
df1 = pd.read_excel(usedExcel)
df2 = pd.read_excel(newExcel)
c = df1.append(df2)
c.drop_duplicates(keep=False, inplace=True)
print(c)
df = pd.DataFrame(c)
<_excel(outputExcel, index=False)
写了⼀个⼯具函数,需要有两个三个参数第⼀个是旧的excel表格的绝对路径,第⼆个是新的excel表格的绝对路径,第三个是需要输出excel 表格的绝对路径,
.append()中是将'()'⾥⾯的追加到‘.’前⾯。
.drop_duplicate⽅法是对DataFrame格式的数据,去除特定列下⾯的重复⾏,返回DataFrame格式的数据。
其中.drop_duplicate()有三个参数
subset : column label or sequence of labels, optional
⽤来指定特定的列,默认所有列
keep : {‘first’, ‘last’, False}, default ‘first’
记住我删除重复项并保留第⼀次出现的项
inplace : boolean, default False
是直接在原来数据上修改还是保留⼀个副本
发布评论