本站资源收集于互联网,不提供软件存储服务,每天免费更新优质的软件以及学习资源!

如何使用Pandas判断数据记录的日期间隔是否超过某个阈值?

网络教程 app 1℃

如何使用Pandas判断数据记录的日期间隔是否超过某个阈值

使用 pandas 判断数据记录的日期间隔

有时我们需要判断某个数据集中两条记录之间的日期间隔是否超过某个阈值。比如,在包含如下记录的数据集中:

name date

foo2022-01-01foo2022-01-23foo2022-03-01

如何确定是否有间隔超过两个月的记录?

解决方案

我们可以使用 pandas 的 shift 和 dt.days 函数来计算相邻记录之间的日期间隔。以下是如何操作:

    添加一个名为 ‘day’ 的新列,用于存储两次记录之间的天数:

df[‘day’] = (df.date.shift(-1) – df.date).dt.days

计算结果如下表所示:

name date day

foo2022-01-0122foo2022-01-2337foo2022-03-01nan

    检查 ‘day’ 列中是否有大于 60 的值:

(df.day > 60).any()

如果结果为 true,则说明存在间隔超过两个月的记录。

以上就是如何使用 Pandas 判断数据记录的日期间隔是否超过某个阈值?的详细内容,更多请关注范的资源库其它相关文章!

转载请注明:范的资源库 » 如何使用Pandas判断数据记录的日期间隔是否超过某个阈值?

喜欢 (0)