Python時間序列

時間序列是一系列數據點,其中每個數據點與時間戳相關聯。 一個簡單的例子就是某個特定日子不同時間點股市中股票的價格。 另一個例子是一年中不同月份一個地區的降雨量。

在下面的例子中,我們將特定股票代碼的每個季度的股票價格的值作爲一個季度。將這些值作爲csv文件捕獲,然後使用pandas庫將它們組織爲數據框。 然後,通過重新創建附加的Valuedate列作爲索引並刪除舊的值列來將日期字段設置爲數據幀的索引。

樣本數據

以下是特定季度不同日期股票價格的樣本數據。 數據保存在名爲stock.csv 的文件中。

ValueDate    Price
01-01-2018,    1042.05
02-01-2018,    1033.55
03-01-2018,    1029.7
04-01-2018,    1021.3
05-01-2018,    1015.4
...
...
...
...
23-03-2018,    1161.3
26-03-2018,    1167.6
27-03-2018,    1155.25
28-03-2018,    1154

創建時間序列

from datetime import datetime
import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv('path_to_file/stock.csv')
df = pd.DataFrame(data, columns = ['ValueDate', 'Price'])

# Set the Date as Index
df['ValueDate'] = pd.to_datetime(df['ValueDate'])
df.index = df['ValueDate']
del df['ValueDate']


df.plot(figsize=(15, 6))
plt.show()

執行上面示例代碼,得到以下結果 -

Python時間序列