やり方
df[(df[columns] != df[columns].shift(1)).any(axis="columns")]
でできる。drop_dupulicate
のkeep=first
的な感じで最初の行が残る。shift
の引数を-1にして、df[(df[columns] != df[columns].shift(-1)).any(axis="columns")]
とすると、drop_dupulicate
のkeep=last
的な感じで最後の行が残る。
その他
・連続した重複データに対するdf.groupby(columns_xy).sum()
的なやつをやりたい。