fix multithread issue in DNN

2019-12-16 22:27:14 -05:00
parent 2a7bc6145f
commit c76c8e7bfb
2 changed files with 144 additions and 112 deletions
@@ -760,9 +760,21 @@ def integration_tests():
    response = get_result(upload_code='ottertuneTestTuningDNN')
    assert response['status'] == 'good'

+    # 2rd iteration Test DNN
+    upload_result(result_dir='./integrationTests/data/', prefix='1__',
+                  upload_code='ottertuneTestTuningDNN')
+    response = get_result(upload_code='ottertuneTestTuningDNN')
+    assert response['status'] == 'good'
+
    # Test GPR
    LOG.info('Test GPR (gaussian process regression)')
    upload_result(result_dir='./integrationTests/data/', prefix='0__',
                  upload_code='ottertuneTestTuningGPR')
    response = get_result(upload_code='ottertuneTestTuningGPR')
    assert response['status'] == 'good'
+
+    # 2rd iteration Test GPR
+    upload_result(result_dir='./integrationTests/data/', prefix='1__',
+                  upload_code='ottertuneTestTuningGPR')
+    response = get_result(upload_code='ottertuneTestTuningGPR')
+    assert response['status'] == 'good'
@@ -46,38 +46,52 @@ class NeuralNet(object):
        self.explore_iters = explore_iters
        self.noise_scale_begin = noise_scale_begin
        self.noise_scale_end = noise_scale_end
-        self.optimizer = tf.train.AdamOptimizer(learning_rate=self.learning_rate)
-        # input X is placeholder, weights are variables.
-        self.model = keras.Sequential([
-            keras.layers.Dense(64, activation=tf.nn.relu, input_shape=[n_input]),
-            keras.layers.Dropout(0.5),
-            keras.layers.Dense(64, activation=tf.nn.relu),
-            keras.layers.Dense(1)
-        ])
-        self.model.compile(loss='mean_squared_error',
-                           optimizer=self.optimizer,
-                           metrics=['mean_squared_error', 'mean_absolute_error'])
        self.vars = {}
        self.ops = {}
-        self.build_graph()

-    def save_weights(self, weights_file):
-        self.model.save_weights(weights_file)
+        self.session = tf.Session()
+        self.graph = tf.get_default_graph()
+        with self.graph.as_default():
+            with self.session.as_default():   # pylint: disable=not-context-manager
+                self.optimizer = tf.train.AdamOptimizer(learning_rate=self.learning_rate)
+                # input X is placeholder, weights are variables.
+                self.model = keras.Sequential([
+                    keras.layers.Dense(64, activation=tf.nn.relu, input_shape=[n_input]),
+                    keras.layers.Dropout(0.5),
+                    keras.layers.Dense(64, activation=tf.nn.relu),
+                    keras.layers.Dense(1)
+                ])
+                self.model.compile(loss='mean_squared_error',
+                                   optimizer=self.optimizer,
+                                   metrics=['mean_squared_error', 'mean_absolute_error'])
+        self._build_graph()

-    def load_weights(self, weights_file):
+    def save_weights_file(self, weights_file):
+        with self.graph.as_default():
+            with self.session.as_default():  # pylint: disable=not-context-manager
+                self.model.save_weights(weights_file)
+
+    def load_weights_file(self, weights_file):
        try:
-            self.model.load_weights(weights_file)
+            with self.graph.as_default():
+                with self.session.as_default():  # pylint: disable=not-context-manager
+                    self.model.load_weights(weights_file)
            if self.debug:
                LOG.info('Neural Network Model weights file exists, load weights from the file')
        except Exception:  # pylint: disable=broad-except
            LOG.info('Weights file does not match neural network model, train model from scratch')

    def get_weights_bin(self):
-        return pickle.dumps(self.model.get_weights())
+        with self.graph.as_default():
+            with self.session.as_default():  # pylint: disable=not-context-manager
+                weights = self.model.get_weights()
+                return pickle.dumps(weights)

    def set_weights_bin(self, weights):
        try:
-            self.model.set_weights(pickle.loads(weights))
+            with self.graph.as_default():
+                with self.session.as_default():  # pylint: disable=not-context-manager
+                    self.model.set_weights(pickle.loads(weights))
            if self.debug:
                LOG.info('Neural Network Model weights exists, load the existing weights')
        except Exception:  # pylint: disable=broad-except
@@ -85,58 +99,62 @@ class NeuralNet(object):

    # Build same neural network as self.model, But input X is variables,
    # weights are placedholders. Find optimial X using gradient descent.
-    def build_graph(self):
+    def _build_graph(self):
        batch_size = self.batch_size
-        self.graph = tf.Graph()
        with self.graph.as_default():
-            x_ = tf.Variable(tf.ones([batch_size, self.n_input]))
-            w1_ = tf.placeholder(tf.float32, [self.n_input, 64])
-            b1_ = tf.placeholder(tf.float32, [64])
-            w2_ = tf.placeholder(tf.float32, [64, 64])
-            b2_ = tf.placeholder(tf.float32, [64])
-            w3_ = tf.placeholder(tf.float32, [64, 1])
-            b3_ = tf.placeholder(tf.float32, [1])
-            l1_ = tf.nn.relu(tf.add(tf.matmul(x_, w1_), b1_))
-            l2_ = tf.nn.relu(tf.add(tf.matmul(l1_, w2_), b2_))
-            y_ = tf.add(tf.matmul(l2_, w3_), b3_)
-            optimizer_ = tf.train.AdamOptimizer(learning_rate=self.learning_rate)
-            train_ = optimizer_.minimize(y_)
+            with self.session.as_default():  # pylint: disable=not-context-manager
+                x_ = tf.Variable(tf.ones([batch_size, self.n_input]))
+                w1_ = tf.placeholder(tf.float32, [self.n_input, 64])
+                b1_ = tf.placeholder(tf.float32, [64])
+                w2_ = tf.placeholder(tf.float32, [64, 64])
+                b2_ = tf.placeholder(tf.float32, [64])
+                w3_ = tf.placeholder(tf.float32, [64, 1])
+                b3_ = tf.placeholder(tf.float32, [1])
+                l1_ = tf.nn.relu(tf.add(tf.matmul(x_, w1_), b1_))
+                l2_ = tf.nn.relu(tf.add(tf.matmul(l1_, w2_), b2_))
+                y_ = tf.add(tf.matmul(l2_, w3_), b3_)
+                optimizer_ = tf.train.AdamOptimizer(learning_rate=self.learning_rate)
+                train_ = optimizer_.minimize(y_)

-            self.vars['x_'] = x_
-            self.vars['y_'] = y_
-            self.vars['w1_'] = w1_
-            self.vars['w2_'] = w2_
-            self.vars['w3_'] = w3_
-            self.vars['b1_'] = b1_
-            self.vars['b2_'] = b2_
-            self.vars['b3_'] = b3_
-            self.ops['train_'] = train_
+                self.vars['x_'] = x_
+                self.vars['y_'] = y_
+                self.vars['w1_'] = w1_
+                self.vars['w2_'] = w2_
+                self.vars['w3_'] = w3_
+                self.vars['b1_'] = b1_
+                self.vars['b2_'] = b2_
+                self.vars['b3_'] = b3_
+                self.ops['train_'] = train_

    def fit(self, X_train, y_train, fit_epochs=500):
-        self.history = self.model.fit(
-            X_train, y_train, epochs=fit_epochs, verbose=0)
-        if self.debug:
-            mse = self.history.history['mean_squared_error']
-            i = 0
-            size = len(mse)
-            while(i < size):
-                LOG.info("Neural network training phase, epoch %d: mean_squared_error %f",
-                         i, mse[i])
-                i += self.debug_interval
-            LOG.info("Neural network training phase, epoch %d: mean_squared_error %f",
-                     size - 1, mse[size - 1])
+        with self.graph.as_default():
+            with self.session.as_default():  # pylint: disable=not-context-manager
+                self.history = self.model.fit(
+                    X_train, y_train, epochs=fit_epochs, verbose=0)
+                if self.debug:
+                    mse = self.history.history['mean_squared_error']
+                    i = 0
+                    size = len(mse)
+                    while(i < size):
+                        LOG.info("Neural network training phase, epoch %d: mean_squared_error %f",
+                                 i, mse[i])
+                        i += self.debug_interval
+                    LOG.info("Neural network training phase, epoch %d: mean_squared_error %f",
+                             size - 1, mse[size - 1])

    def predict(self, X_pred):
-        return self.model.predict(X_pred)
+        with self.graph.as_default():
+            with self.session.as_default():  # pylint: disable=not-context-manager
+                return self.model.predict(X_pred)

    # Reference: Parameter Space Noise for Exploration.ICLR 2018, https://arxiv.org/abs/1706.01905
-    def add_noise(self, weights):
-        scale = self.adaptive_noise_scale()
+    def _add_noise(self, weights):
+        scale = self._adaptive_noise_scale()
        size = weights.shape[-1]
        noise = scale * np.random.normal(size=size)
        return weights + noise

-    def adaptive_noise_scale(self):
+    def _adaptive_noise_scale(self):
        if self.recommend_iters > self.explore_iters:
            scale = self.noise_scale_end
        else:
@@ -147,69 +165,71 @@ class NeuralNet(object):
    def recommend(self, X_start, X_min=None, X_max=None, recommend_epochs=500, explore=False):
        batch_size = len(X_start)
        assert(batch_size == self.batch_size)
-        w1, b1 = self.model.get_layer(index=0).get_weights()
-        w2, b2 = self.model.get_layer(index=2).get_weights()
-        w3, b3 = self.model.get_layer(index=3).get_weights()

-        if explore is True:
-            w1 = self.add_noise(w1)
-            b1 = self.add_noise(b1)
-            w2 = self.add_noise(w2)
-            b2 = self.add_noise(b2)
-            w3 = self.add_noise(w3)
-            b3 = self.add_noise(b3)
+        with self.graph.as_default():
+            with self.session.as_default() as sess:  # pylint: disable=not-context-manager
+                w1, b1 = self.model.get_layer(index=0).get_weights()
+                w2, b2 = self.model.get_layer(index=2).get_weights()
+                w3, b3 = self.model.get_layer(index=3).get_weights()

-        y_predict = self.predict(X_start)
-        if self.debug:
-            LOG.info("Recommend phase, y prediction: min %f, max %f, mean %f",
-                     np.min(y_predict), np.max(y_predict), np.mean(y_predict))
+                if explore is True:
+                    w1 = self._add_noise(w1)
+                    b1 = self._add_noise(b1)
+                    w2 = self._add_noise(w2)
+                    b2 = self._add_noise(b2)
+                    w3 = self._add_noise(w3)
+                    b3 = self._add_noise(b3)

-        with tf.Session(graph=self.graph) as sess:
-            init = tf.global_variables_initializer()
-            sess.run(init)
-            assign_x_op = self.vars['x_'].assign(X_start)
-            sess.run(assign_x_op)
-            y_before = sess.run(self.vars['y_'],
-                                feed_dict={self.vars['w1_']: w1, self.vars['w2_']: w2,
-                                           self.vars['w3_']: w3, self.vars['b1_']: b1,
-                                           self.vars['b2_']: b2, self.vars['b3_']: b3})
-            if self.debug:
-                LOG.info("Recommend phase, y before gradient descent: min %f, max %f, mean %f",
-                         np.min(y_before), np.max(y_before), np.mean(y_before))
+                y_predict = self.predict(X_start)
+                if self.debug:
+                    LOG.info("Recommend phase, y prediction: min %f, max %f, mean %f",
+                             np.min(y_predict), np.max(y_predict), np.mean(y_predict))

-            for i in range(recommend_epochs):
-                sess.run(self.ops['train_'],
-                         feed_dict={self.vars['w1_']: w1, self.vars['w2_']: w2,
-                                    self.vars['w3_']: w3, self.vars['b1_']: b1,
-                                    self.vars['b2_']: b2, self.vars['b3_']: b3})
+                init = tf.global_variables_initializer()
+                sess.run(init)
+                assign_x_op = self.vars['x_'].assign(X_start)
+                sess.run(assign_x_op)
+                y_before = sess.run(self.vars['y_'],
+                                    feed_dict={self.vars['w1_']: w1, self.vars['w2_']: w2,
+                                               self.vars['w3_']: w3, self.vars['b1_']: b1,
+                                               self.vars['b2_']: b2, self.vars['b3_']: b3})
+                if self.debug:
+                    LOG.info("Recommend phase, y before gradient descent: min %f, max %f, mean %f",
+                             np.min(y_before), np.max(y_before), np.mean(y_before))

-                # constrain by X_min and X_max
-                if X_min is not None and X_max is not None:
-                    X_train = sess.run(self.vars['x_'])
-                    X_train = np.minimum(X_train, X_max)
-                    X_train = np.maximum(X_train, X_min)
-                    constraint_x_op = self.vars['x_'].assign(X_train)
-                    sess.run(constraint_x_op)
+                for i in range(recommend_epochs):
+                    sess.run(self.ops['train_'],
+                             feed_dict={self.vars['w1_']: w1, self.vars['w2_']: w2,
+                                        self.vars['w3_']: w3, self.vars['b1_']: b1,
+                                        self.vars['b2_']: b2, self.vars['b3_']: b3})

-                if self.debug and i % self.debug_interval == 0:
-                    y_train = sess.run(self.vars['y_'],
+                    # constrain by X_min and X_max
+                    if X_min is not None and X_max is not None:
+                        X_train = sess.run(self.vars['x_'])
+                        X_train = np.minimum(X_train, X_max)
+                        X_train = np.maximum(X_train, X_min)
+                        constraint_x_op = self.vars['x_'].assign(X_train)
+                        sess.run(constraint_x_op)
+
+                    if self.debug and i % self.debug_interval == 0:
+                        y_train = sess.run(self.vars['y_'],
+                                           feed_dict={self.vars['w1_']: w1, self.vars['w2_']: w2,
+                                                      self.vars['w3_']: w3, self.vars['b1_']: b1,
+                                                      self.vars['b2_']: b2, self.vars['b3_']: b3})
+                        LOG.info("Recommend phase, epoch %d, y: min %f, max %f, mean %f",
+                                 i, np.min(y_train), np.max(y_train), np.mean(y_train))
+
+                y_recommend = sess.run(self.vars['y_'],
                                       feed_dict={self.vars['w1_']: w1, self.vars['w2_']: w2,
                                                  self.vars['w3_']: w3, self.vars['b1_']: b1,
                                                  self.vars['b2_']: b2, self.vars['b3_']: b3})
-                    LOG.info("Recommend phase, epoch %d, y: min %f, max %f, mean %f",
-                             i, np.min(y_train), np.max(y_train), np.mean(y_train))
+                X_recommend = sess.run(self.vars['x_'])
+                res = NeuralNetResult(minl=y_recommend, minl_conf=X_recommend)

-            y_recommend = sess.run(self.vars['y_'],
-                                   feed_dict={self.vars['w1_']: w1, self.vars['w2_']: w2,
-                                              self.vars['w3_']: w3, self.vars['b1_']: b1,
-                                              self.vars['b2_']: b2, self.vars['b3_']: b3})
-            X_recommend = sess.run(self.vars['x_'])
-            res = NeuralNetResult(minl=y_recommend, minl_conf=X_recommend)
+                if self.debug:
+                    LOG.info("Recommend phase, epoch %d, y after gradient descent: \
+                             min %f, max %f, mean %f", recommend_epochs, np.min(y_recommend),
+                             np.max(y_recommend), np.mean(y_recommend))

-            if self.debug:
-                LOG.info("Recommend phase, epoch %d, y after gradient descent: \
-                         min %f, max %f, mean %f", recommend_epochs, np.min(y_recommend),
-                         np.max(y_recommend), np.mean(y_recommend))
-
-        self.recommend_iters += 1
-        return res
+                self.recommend_iters += 1
+                return res