输出预测结果

1 year ago · c6b760d74b
parent eb7f3ba5f6
commit c6b760d74b
2 changed files with 51 additions and 46 deletions
--- a/浙江电压等级电量/区县分压.py
+++ b/浙江电压等级电量/区县分压.py
@ -2,6 +2,7 @@ import pandas as pd
 from prophet import Prophet
 import math
 import matplotlib.pyplot as plt
+import os

 pd.set_option('display.width',None)
 def normal(x):
@ -16,58 +17,62 @@ df.drop(columns=['500kv(含330kv)及以上','220kv','110kv(含66kv)','20kv','pow
 print(df.columns)
 # print(df.head())
 print(dict(zip(df.columns,[(df[x]==0).sum()/len(df) for x in df.columns])))
+for i in range(30):
+    df_ct = df[df['org_name']==df['org_name'].drop_duplicates().values[i]]
+    # print(df_ct.head())
+    df_ct['1-10kv'] /= 10000
+    df_ct['35kv'] /= 10000
+    df_ct['0.4kv及以下'] /= 10000
+    s1 = df_ct[['日期','1-10kv']]
+    s1.dropna(how='any',inplace=True)
+    s1 = s1.loc[normal(s1['1-10kv']).index]
+    # plt.plot(range(len(s1)),s1['1-10kv'])
+    # plt.show()

-df_ct = df[df['org_name']==df['org_name'][0]]
-print(df_ct.head())
-df_ct['1-10kv'] /= 10000
-df_ct['35kv'] /= 10000
-df_ct['0.4kv及以下'] /= 10000
-s1 = df_ct[['日期','1-10kv']]
-s1.dropna(how='any',inplace=True)
-s1 = s1.loc[normal(s1['1-10kv']).index]
-print(s1)
-# plt.plot(range(len(s1)),s1['1-10kv'])
-# plt.show()
-
-# 更改列名，更改为Prophet指定的列名ds和y
-dd = s1.rename(columns={'日期':'ds','1-10kv':'y'})
-# 注意：Prophet模型对于数据格式有要求，日期字段必须是datetime格式，这里通过pd.to_datetime来进行转换。
+    # 更改列名，更改为Prophet指定的列名ds和y
+    dd = s1.rename(columns={'日期':'ds','1-10kv':'y'})
+    # 注意：Prophet模型对于数据格式有要求，日期字段必须是datetime格式，这里通过pd.to_datetime来进行转换。

-dd['ds'] = pd.to_datetime(dd['ds'])
-# 划分数据，划分为训练集和验证集，预测的数据设置为未来一个月
-df_train = dd[:-3]
-df_test = dd[-3:]
-# 数据的变动会受到季节、周、天的影响，存在一定的规律性，因此我们将这三个参数设置为True
-model = Prophet(yearly_seasonality=True, weekly_seasonality=True, daily_seasonality=True)
-# 采用中国的假期模式，其余参数均保持默认
-model.add_country_holidays(country_name="CN")
-model.fit(df_train)
-# make_future_dataframe: 作用是告诉模型我们要预测多长时间，以及时间的周期是什么。这里设置为30，即预测一个月时间的数据。
-future = model.make_future_dataframe(periods=3, freq='D')
-# 进行预测，返回预测的结果forecast
-forecast = model.predict(future)
-# forecast['additive_terms'] = forecast['weekly'] + forecast['yearly']；
-# 有：forecast['yhat']  = forecast['trend'] +  forecast['additive_terms'] 。
-# 因此：forecast['yhat']  = forecast['trend'] +forecast['weekly'] + forecast['yearly']。
-# 如果有节假日因素，那么就会有forecast['yhat']  = forecast['trend'] +forecast['weekly'] + forecast['yearly'] + forecast['holidays']。
-# print(forecast)
+    dd['ds'] = pd.to_datetime(dd['ds'])
+    # 划分数据，划分为训练集和验证集，预测的数据设置为未来一个月
+    df_train = dd[(dd['ds']>='2019-01-01')&(dd['ds']<='2023-10-31')][:-3]
+    df_test = dd[(dd['ds']>='2019-01-01')&(dd['ds']<='2023-10-31')][-3:]
+    # 数据的变动会受到季节、周、天的影响，存在一定的规律性，因此我们将这三个参数设置为True
+    model = Prophet(yearly_seasonality=True, weekly_seasonality=True, daily_seasonality=True)
+    # 采用中国的假期模式，其余参数均保持默认
+    model.add_country_holidays(country_name="CN")
+    model.fit(df_train)
+    # make_future_dataframe: 作用是告诉模型我们要预测多长时间，以及时间的周期是什么。这里设置为30，即预测一个月时间的数据。
+    future = model.make_future_dataframe(periods=3, freq='D')
+    # 进行预测，返回预测的结果forecast
+    forecast = model.predict(future)
+    # forecast['additive_terms'] = forecast['weekly'] + forecast['yearly']；
+    # 有：forecast['yhat']  = forecast['trend'] +  forecast['additive_terms'] 。
+    # 因此：forecast['yhat']  = forecast['trend'] +forecast['weekly'] + forecast['yearly']。
+    # 如果有节假日因素，那么就会有forecast['yhat']  = forecast['trend'] +forecast['weekly'] + forecast['yearly'] + forecast['holidays']。
+    # print(forecast)


-# 测试，把ds列，即data_series列设置为索引列
-df_test = df_test.set_index('ds')
+    # 测试，把ds列，即data_series列设置为索引列
+    df_test = df_test.set_index('ds')

-# 把预测到的数据取出ds列，预测值列yhat，同样把ds列设置为索引列。
-forecast = forecast[['ds','yhat']].set_index('ds')
+    # 把预测到的数据取出ds列，预测值列yhat，同样把ds列设置为索引列。
+    forecast = forecast[['ds','yhat']].set_index('ds')
+    print(forecast)

+    # join:按照索引进行连接，
+    # dropna：能够找到DataFrame类型数据的空值（缺失值），将空值所在的行/列删除后，将新的DataFrame作为返回值返回。
+    df_all = forecast.join(dd.set_index('ds')).dropna()
+    print(df_all.loc['2023-10'])
+    # # 创建一个ExcelWriter对象
+    # with pd.ExcelWriter(r'C:\Users\鸽子\Desktop\output.xlsx',mode='a',if_sheet_exists='replace') as writer:
+    #     # 将不同的子文件写入同一个Excel文件的不同工作表
+    #     df_all.to_excel(writer, sheet_name=f'Sheet{i+1}')

-# join:按照索引进行连接，
-# dropna：能够找到DataFrame类型数据的空值（缺失值），将空值所在的行/列删除后，将新的DataFrame作为返回值返回。
-df_all = forecast.join(df_test).dropna()
-print(df_all)
-df_all.plot()
-# 设置左上角小标
-plt.legend(['true', 'yhat'])
-plt.show()
+# df_all.plot()
+# # 设置左上角小标
+# plt.legend(['true', 'yhat'])
+# plt.show()



--- a/浙江电压等级电量/单日预测.py
+++ b/浙江电压等级电量/单日预测.py
@ -116,7 +116,7 @@ if __name__ == '__main__':
        print(target)
        with open(fr'C:\Users\user\Desktop\电压等级电量预测.txt', 'a', encoding='utf-8') as f:
            f.write(f'{level}月底电量偏差率:{round(target, 5)}\n')
-31
+