用Pandas.Rolling计算滚动自相关

时间：2024-08-11

本文介绍了用Pandas.Rolling计算滚动自相关的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着跟版网的小编来一起学习吧！

问题描述

我正在尝试使用Pandas(0.23.3)计算Series对象的滚动自相关

设置示例：

dt_index = pd.date_range('2018-01-01','2018-02-01', freq = 'B')
data = np.random.rand(len(dt_index))
s = pd.Series(data, index = dt_index)

创建窗口大小为5的Rolling对象：

r = s.rolling(5)

获取：

Rolling [window=5,center=False,axis=0]

现在，当我尝试计算相关性时(我很肯定这是错误的方法)：

r.corr(other=r)

我只收到nans

我尝试了另一种基于documentation:：

的方法

df = pd.DataFrame()
df['a'] = s
df['b'] = s.shift(-1)
df.rolling(window=5).corr()

获得如下内容：

...
2018-03-01 a NaN NaN
           b NaN NaN

我真的不确定我在哪里出错了。任何帮助都将不胜感激！文档也使用了float64。认为这是因为相关性非常接近于零，所以显示为NaN？有人提出了错误报告here，但我认为Jreback在以前的错误修复中解决了问题。

这是另一个相关答案，但它使用的是似乎在Pandas版本0.23.3中不受支持的pd.rolling_apply？

推荐答案

IIUC，

>>> s.rolling(5).apply(lambda x: x.autocorr(), raw=False)

2018-01-01         NaN
2018-01-02         NaN
2018-01-03         NaN
2018-01-04         NaN
2018-01-05   -0.502455
2018-01-08   -0.072132
2018-01-09   -0.216756
2018-01-10   -0.090358
2018-01-11   -0.928272
2018-01-12   -0.754725
2018-01-15   -0.822256
2018-01-16   -0.941788
2018-01-17   -0.765803
2018-01-18   -0.680472
2018-01-19   -0.902443
2018-01-22   -0.796185
2018-01-23   -0.691141
2018-01-24   -0.427208
2018-01-25    0.176668
2018-01-26    0.016166
2018-01-29   -0.876047
2018-01-30   -0.905765
2018-01-31   -0.859755
2018-02-01   -0.795077

这篇关于用Pandas.Rolling计算滚动自相关的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持跟版网！

上一篇：如何对 pandas 数据帧的每一行使用.roll()？ 下一篇：使用pika，如何连接运行在docker中的rabbitmq，从docker开始-与外部网络连接？

用Pandas.Rolling计算滚动自相关

问题描述

推荐答案

相关文章