3 meses atrás · b3bbaee15e
--- a/data_processing/data_operation/data_handler.py
+++ b/data_processing/data_operation/data_handler.py
@@ -190,6 +190,7 @@ class DataHandler(object):
 
				         # 标准化特征和目标
			
 
				         scaled_train_data = train_scaler.fit_transform(train_data_cleaned[features])
			
 
				         scaled_target = target_scaler.fit_transform(train_data_cleaned[[target]])
			
 
				+        scaled_cap = target_scaler.transform(np.array([[self.opt.cap]]))[0,0]
			
 
				         train_data_cleaned[features] = scaled_train_data
			
 
				         train_data_cleaned[[target]] = scaled_target
			
 
				         # 3.缺值补值
			
@@ -208,7 +209,7 @@ class DataHandler(object):
 
				             train_x, valid_x, train_y, valid_y =  np.array(train_x), np.array(valid_x), np.array(train_y), np.array(valid_y)
			
 
				         else:
			
 
				             train_x, valid_x, train_y, valid_y = self.get_train_data(train_datas, col_time, features, target)
			
 
				-        return train_x, train_y, valid_x, valid_y, scaled_train_bytes, scaled_target_bytes
			
 
				+        return train_x, train_y, valid_x, valid_y, scaled_train_bytes, scaled_target_bytes, scaled_cap
			
 
				 
			
 
				     def pre_data_handler(self, data, feature_scaler, bp_data=False):
			
 
				         """
			
--- a/models_processing/losses/loss_cdq.py
+++ b/models_processing/losses/loss_cdq.py
@@ -1,141 +0,0 @@
 
				-#!/usr/bin/env python
			
 
				-# -*- coding: utf-8 -*-
			
 
				-# time: 2023/5/8 13:15
			
 
				-# file: loss.py.py
			
 
				-# author: David
			
 
				-# company: shenyang JY
			
 
				-import tensorflow as tf
			
 
				-tf.compat.v1.set_random_seed(1234)
			
 
				-
			
 
				-
			
 
				-def rmse(y_true, y_pred):
			
 
				-    return tf.sqrt(tf.reduce_mean(tf.square(y_pred - y_true)))
			
 
				-
			
 
				-class SouthLoss(tf.keras.losses.Loss):
			
 
				-    def __init__(self, opt, name='south_loss'):
			
 
				-        """
			
 
				-        南网新规则损失函数
			
 
				-        :param cap:装机容量
			
 
				-        """
			
 
				-        super(SouthLoss, self).__init__(name=name)
			
 
				-        self.cap = opt.cap*0.2    # 没有归一化cap，必须要先进行归一化
			
 
				-        self.opt = opt
			
 
				-        # self.cap01 = opt.cap*0.1
			
 
				-
			
 
				-    def call(self, y_true, y_predict):
			
 
				-        """
			
 
				-        自动调用
			
 
				-        :param y_true: 标签
			
 
				-        :param y_predict: 预测
			
 
				-        :return: 损失值
			
 
				-        """
			
 
				-        # 计算实际和预测的差值
			
 
				-        # y_true = y_true * self.opt.std['C_REAL_VALUE'] + self.opt.mean['C_REAL_VALUE']
			
 
				-        # y_predict = y_predict * self.opt.std['C_REAL_VALUE'] + self.opt.mean['C_REAL_VALUE']
			
 
				-        y_true = y_true[:, 15]
			
 
				-        y_predict = y_predict[:, 15]
			
 
				-        diff = y_true - y_predict
			
 
				-        logistic_values = tf.sigmoid(10000 * (y_true - self.cap))
			
 
				-        base = logistic_values * y_true + (1-logistic_values)*self.cap
			
 
				-        loss = K.square(diff/base)
			
 
				-        # loss = K.mean(loss, axis=-1)
			
 
				-        return loss
			
 
				-
			
 
				-    def call2(self, y_true, y_predict):
			
 
				-        y_true = y_true * self.opt.std['C_REAL_VALUE'] + self.opt.mean['C_REAL_VALUE']
			
 
				-        y_predict = y_predict * self.opt.std['C_REAL_VALUE'] + self.opt.mean['C_REAL_VALUE']
			
 
				-        y_true = y_true[:, 15]
			
 
				-        y_predict = y_predict[:, 15]
			
 
				-        diff = y_true - y_predict
			
 
				-        logistic_values = tf.sigmoid(10000 * (y_true - self.cap))
			
 
				-        base = logistic_values * y_true + (1 - logistic_values) * self.cap
			
 
				-        loss = K.square(diff / base)
			
 
				-
			
 
				-        mask_logical = tf.logical_and(tf.greater(y_true, self.cap01), tf.greater(y_predict, self.cap01))
			
 
				-        count = tf.reduce_sum(tf.cast(mask_logical, tf.float32), axis=-1)
			
 
				-        safe_count = tf.maximum(count, 1)
			
 
				-        # reduce_sum_loss = tf.reduce_sum(loss, axis=-1)
			
 
				-        mean_loss = loss / safe_count
			
 
				-        return mean_loss
			
 
				-
			
 
				-    def call1(self, y_true, y_predict):
			
 
				-        y_true = y_true * self.opt.std['C_REAL_VALUE'] + self.opt.mean['C_REAL_VALUE']
			
 
				-        y_predict = y_predict * self.opt.std['C_REAL_VALUE'] + self.opt.mean['C_REAL_VALUE']
			
 
				-        base = tf.where(y_true > self.cap, y_true, tf.ones_like(y_true)*self.cap)
			
 
				-        loss = (y_true - y_predict) / base
			
 
				-        squared_loss = tf.square(loss)
			
 
				-        mean_squared_loss = tf.reduce_mean(squared_loss, axis=[1])
			
 
				-        return  mean_squared_loss
			
 
				-
			
 
				-
			
 
				-class NorthEastLoss(tf.keras.losses.Loss):
			
 
				-    def __init__(self, opt, name='northeast_loss'):
			
 
				-        """
			
 
				-        东北新规则超短期损失函数
			
 
				-        """
			
 
				-        super(NorthEastLoss, self).__init__(name=name)
			
 
				-        self.opt = opt
			
 
				-        self.cap = round(opt.cap*0.1, 2)
			
 
				-
			
 
				-    def call(self, y_true, y_predict):
			
 
				-        # 这里我们添加了一个小的 epsilon 值来避免除以 0
			
 
				-        # y_true = y_true * self.opt.std['C_REAL_VALUE'] + self.opt.mean['C_REAL_VALUE']
			
 
				-        # y_predict = y_predict * self.opt.std['C_REAL_VALUE'] + self.opt.mean['C_REAL_VALUE']
			
 
				-
			
 
				-        mask_logical = tf.logical_and(tf.greater(y_true, self.cap), tf.greater(y_predict, self.cap))
			
 
				-        # mask = tf.cast(~mask_logical, tf.float32)
			
 
				-        # y_true = y_true * (1 - mask) + 0 * mask
			
 
				-        # y_predict = y_predict * (1 - mask) + 0 * mask
			
 
				-
			
 
				-
			
 
				-        epsilon = tf.keras.backend.epsilon()
			
 
				-        y_predict_safe = y_predict + epsilon
			
 
				-
			
 
				-        # 计算 (y_true - y_predict) / y_predict_safe
			
 
				-        difference_over_predict = tf.abs(y_predict - y_true) / tf.abs(y_predict_safe)
			
 
				-
			
 
				-        # 将结果中大于等于 1 的部分置为 1，剩下的保留原值
			
 
				-        masked_difference = tf.where(difference_over_predict >= 1, tf.ones_like(difference_over_predict)*1, difference_over_predict) #tf.where的操作是逐元素的，并且它不会改变张量中元素的数学性质（如可微性、可导性）。
			
 
				-
			
 
				-        # 这里我们先沿着特征维度求和，但你也可以选择平均（使用 tf.reduce_mean 而不是 tf.reduce_sum）
			
 
				-        count = tf.reduce_sum(tf.cast(mask_logical, tf.float32), axis=-1)
			
 
				-        sum_diff = tf.reduce_sum(masked_difference, axis=-1)
			
 
				-        # mean_loss = tf.reduce_mean(masked_difference, axis=[1])
			
 
				-        safe_count = tf.maximum(count, 1)
			
 
				-        mean = sum_diff / safe_count
			
 
				-        mean1 = tf.reduce_sum(masked_difference, axis=-1)
			
 
				-        return mean
			
 
				-
			
 
				-
			
 
				-class NorthWestLoss(tf.keras.losses.Loss):
			
 
				-    def __init__(self, name='northwest_loss'):
			
 
				-        """
			
 
				-        东北新规则超短期损失函数
			
 
				-        """
			
 
				-        super(NorthWestLoss, self).__init__(name=name)
			
 
				-
			
 
				-    def call(self, y_true, y_pred):
			
 
				-        # 保证预测值和真实值是浮点数
			
 
				-        y_pred = tf.cast(y_pred, tf.float32)
			
 
				-        y_true = tf.cast(y_true, tf.float32)
			
 
				-
			
 
				-        # 避免除零错误
			
 
				-        epsilon = 1e-8
			
 
				-        y_pred_adjusted = y_pred + epsilon
			
 
				-        y_true_adjusted = y_true + epsilon
			
 
				-
			
 
				-        # 计算 |Pr - Pn|
			
 
				-        abs_diff = tf.abs(y_pred - y_true)
			
 
				-
			
 
				-        # 计算 |Pr - Pn| 的总和
			
 
				-        sum_abs_diff = tf.reduce_sum(abs_diff)
			
 
				-
			
 
				-        # 计算每个差值的权重 |Pr - Pn| / sum(|Pr - Pn|)
			
 
				-        weights = abs_diff / (sum_abs_diff + epsilon)  # 添加 epsilon 避免除零
			
 
				-
			
 
				-        # 计算 |Pr/(Pr + Pn) - 0.5|
			
 
				-        ratios = tf.abs((y_pred_adjusted / (y_pred_adjusted + y_true_adjusted)) - 0.5)
			
 
				-
			
 
				-        # 计算最终的损失值
			
 
				-        loss = 1.0 - 2.0 * tf.reduce_sum(ratios * weights)
			
 
				-        return loss
			
--- a/models_processing/model_koi/bp.yaml
+++ b/models_processing/model_koi/bp.yaml
@@ -15,14 +15,13 @@ Model:
 
				   output_size: 16
			
 
				   patience: 10
			
 
				   predict_data_fill: true
			
 
				-  region: south129
			
 
				   shuffle_train_data: false
			
 
				   test_data_fill: false
			
 
				   time_step: 16
			
 
				   train_data_fill: false
			
 
				   use_cuda: false
			
 
				   valid_data_rate: 0.15
			
 
				-
			
 
				+region: south
			
 
				 calculate: []
			
 
				 cap: 50.0
			
 
				 dataloc: ./data
			
--- a/models_processing/model_koi/cnn.yaml
+++ b/models_processing/model_koi/cnn.yaml
@@ -15,14 +15,13 @@ Model:
 
				   output_size: 16
			
 
				   patience: 10
			
 
				   predict_data_fill: true
			
 
				-  region: south129
			
 
				   shuffle_train_data: false
			
 
				   test_data_fill: false
			
 
				   time_step: 16
			
 
				   train_data_fill: false
			
 
				   use_cuda: false
			
 
				   valid_data_rate: 0.15
			
 
				-
			
 
				+region: south
			
 
				 calculate: []
			
 
				 cap: 50.0
			
 
				 dataloc: ./data
			
--- a/models_processing/model_koi/losses.py
+++ b/models_processing/model_koi/losses.py
@@ -0,0 +1,122 @@
 
				+#!/usr/bin/env python
			
 
				+# -*- coding: utf-8 -*-
			
 
				+# time: 2023/5/8 13:15
			
 
				+# file: loss.py.py
			
 
				+# author: David
			
 
				+# company: shenyang JY
			
 
				+import tensorflow as tf
			
 
				+from tensorflow.keras import backend as K
			
 
				+tf.compat.v1.set_random_seed(1234)
			
 
				+
			
 
				+
			
 
				+class Rmse(tf.keras.losses.Loss):
			
 
				+    """
			
 
				+    自定义损失函数模板
			
 
				+    功能：实现名称设置、参数保存、张量运算分离
			
 
				+    """
			
 
				+
			
 
				+    def __init__(self,
			
 
				+                 name,  # 设置损失名称
			
 
				+                 reduction='mean',
			
 
				+                 **kwargs):
			
 
				+        super().__init__(name=name, reduction=reduction)
			
 
				+
			
 
				+        # 可添加自定义参数（自动序列化）
			
 
				+        self.param = kwargs.get('param', 1.0)
			
 
				+
			
 
				+    def call(self, y_true, y_pred):
			
 
				+        """核心计算逻辑（分离张量运算和非张量运算）"""
			
 
				+        # 非张量运算（预处理）
			
 
				+        coefficient = tf.constant(self.param, dtype=y_pred.dtype)
			
 
				+
			
 
				+        # 张量运算（保持计算图兼容性）
			
 
				+        squared_difference = tf.square(y_pred - y_true)
			
 
				+        loss = tf.reduce_mean(squared_difference, axis=-1) * coefficient
			
 
				+        return loss
			
 
				+
			
 
				+
			
 
				+class SouthLoss(tf.keras.losses.Loss):
			
 
				+    def __init__(self, cap, name, reduction='sum_over_batch_size'):
			
 
				+        """
			
 
				+        南网新规则损失函数
			
 
				+        :param cap:装机容量
			
 
				+        """
			
 
				+        super(SouthLoss, self).__init__(name=name, reduction=reduction)
			
 
				+        self.cap = tf.cast(cap, tf.float32)     # 传入的是0.2cap
			
 
				+
			
 
				+    def get_config(self):
			
 
				+        """返回所有需要序列化的参数"""
			
 
				+        config = super().get_config()
			
 
				+        config.update({
			
 
				+            'cap': float(self.cap.numpy())  # 将 Tensor 转换为 Python float
			
 
				+        })
			
 
				+        return config
			
 
				+
			
 
				+    @classmethod
			
 
				+    def from_config(cls, config):
			
 
				+        """显式处理反序列化逻辑"""
			
 
				+        # 提取 cap 并重建实例
			
 
				+        cap = config.pop('cap')  # 从配置中获取原始值
			
 
				+        return cls(cap=cap, **config)
			
 
				+
			
 
				+    def call(self, y_true, y_predict):
			
 
				+        """
			
 
				+        自动调用
			
 
				+        :param y_true: 标签
			
 
				+        :param y_predict: 预测
			
 
				+        :return: 损失值
			
 
				+        """
			
 
				+        # 计算实际和预测的差值
			
 
				+        diff = y_true - y_predict
			
 
				+        logistic_values = tf.sigmoid(10000 * (y_true - self.cap))
			
 
				+        base = logistic_values * y_true + (1-logistic_values)*self.cap
			
 
				+        loss = K.square(diff/base)
			
 
				+        # loss = K.mean(loss, axis=-1)
			
 
				+        return loss
			
 
				+
			
 
				+    def call2(self, y_true, y_predict):
			
 
				+        y_true = y_true * self.opt.std['C_REAL_VALUE'] + self.opt.mean['C_REAL_VALUE']
			
 
				+        y_predict = y_predict * self.opt.std['C_REAL_VALUE'] + self.opt.mean['C_REAL_VALUE']
			
 
				+        y_true = y_true[:, 15]
			
 
				+        y_predict = y_predict[:, 15]
			
 
				+        diff = y_true - y_predict
			
 
				+        logistic_values = tf.sigmoid(10000 * (y_true - self.cap))
			
 
				+        base = logistic_values * y_true + (1 - logistic_values) * self.cap
			
 
				+        loss = K.square(diff / base)
			
 
				+
			
 
				+        mask_logical = tf.logical_and(tf.greater(y_true, self.cap01), tf.greater(y_predict, self.cap01))
			
 
				+        count = tf.reduce_sum(tf.cast(mask_logical, tf.float32), axis=-1)
			
 
				+        safe_count = tf.maximum(count, 1)
			
 
				+        # reduce_sum_loss = tf.reduce_sum(loss, axis=-1)
			
 
				+        mean_loss = loss / safe_count
			
 
				+        return mean_loss
			
 
				+
			
 
				+    def call1(self, y_true, y_predict):
			
 
				+        y_true = y_true * self.opt.std['C_REAL_VALUE'] + self.opt.mean['C_REAL_VALUE']
			
 
				+        y_predict = y_predict * self.opt.std['C_REAL_VALUE'] + self.opt.mean['C_REAL_VALUE']
			
 
				+        base = tf.where(y_true > self.cap, y_true, tf.ones_like(y_true)*self.cap)
			
 
				+        loss = (y_true - y_predict) / base
			
 
				+        squared_loss = tf.square(loss)
			
 
				+        mean_squared_loss = tf.reduce_mean(squared_loss, axis=[1])
			
 
				+        return  mean_squared_loss
			
 
				+
			
 
				+
			
 
				+
			
 
				+region_loss_d = {
			
 
				+    'northeast': lambda region: Rmse(region),
			
 
				+    'south': lambda cap, region: SouthLoss(cap, region)
			
 
				+}
			
 
				+
			
 
				+
			
 
				+# 根据地区调用对应逻辑
			
 
				+def region_loss(opt):
			
 
				+    handler = region_loss_d.get(opt.region, opt.region)
			
 
				+    # 判断处理类型并执行
			
 
				+    if callable(handler):
			
 
				+        # 如果是lambda或函数，直接调用
			
 
				+        if opt.region == "south":  # 需要额外参数的地区
			
 
				+            return handler(opt.cap, opt.region)
			
 
				+        else:
			
 
				+            return handler(opt.region)
			
 
				+    else:
			
 
				+        raise TypeError("无效的损失函数")
			
--- a/models_processing/model_koi/lstm.yaml
+++ b/models_processing/model_koi/lstm.yaml
@@ -15,13 +15,13 @@ Model:
 
				   output_size: 16
			
 
				   patience: 10
			
 
				   predict_data_fill: true
			
 
				-  region: south129
			
 
				   shuffle_train_data: false
			
 
				   test_data_fill: false
			
 
				   time_step: 16
			
 
				   train_data_fill: false
			
 
				   use_cuda: false
			
 
				   valid_data_rate: 0.15
			
 
				+region: south
			
 
				 calculate: []
			
 
				 cap: 50.0
			
 
				 dataloc: ./data