Spaces:

ierhon
/

neural-chatbot-constructor

Sleeping

App Files Files Community

ierhon commited on Feb 4

Commit

6de5c93

•

1 Parent(s): 31dee74

Fix dropout

Browse files

Files changed (1) hide show

chatbot_constructor.py +5 -5

chatbot_constructor.py CHANGED Viewed

@@ -54,7 +54,7 @@ def train(message: str = "", dropout: float = 0.5, learning_rate: float = 0.001,
     else:
         input_layer = Input(shape=(inp_len,))
         emb_layer = Embedding(input_dim=vocab_size, output_dim=emb_size, input_length=inp_len)(input_layer)
-        dropout1_layer = Dropout(0.25)(emb_layer)
         attn_layer = MultiHeadAttention(num_heads=4, key_dim=128)(dropout1_layer, dropout1_layer, dropout1_layer)
         noise_layer = GaussianNoise(0.1)(attn_layer)
         conv1_layer = Conv1D(kernels_count, kernel_size, padding='same', activation='relu', strides=1, input_shape=(64, 128))(noise_layer)
@@ -66,14 +66,14 @@ def train(message: str = "", dropout: float = 0.5, learning_rate: float = 0.001,
         conv2_flatten_layer = Flatten()(conv2_layer)
         conv3_flatten_layer = Flatten()(conv3_layer)
         concat1_layer = Concatenate()([flatten_layer, attn_flatten_layer, conv1_flatten_layer, conv2_flatten_layer, conv3_flatten_layer])
-        dropout2_layer = Dropout(0.5)(concat1_layer)
         dense1_layer = Dense(512, activation="linear")(dropout2_layer)
         prelu1_layer = PReLU()(dense1_layer)
-        dropout3_layer = Dropout(0.5)(prelu1_layer)
         dense2_layer = Dense(256, activation="tanh")(dropout3_layer)
-        dropout4_layer = Dropout(0.5)(dense2_layer)
         dense3_layer = Dense(256, activation="relu")(dropout4_layer)
-        dropout5_layer = Dropout(0.5)(dense3_layer)
         dense4_layer = Dense(100, activation="tanh")(dropout5_layer)
         concat2_layer = Concatenate()([dense4_layer, prelu1_layer, attn_flatten_layer, conv1_flatten_layer])
         dense4_layer = Dense(resps_len, activation="softmax")(concat2_layer)

     else:
         input_layer = Input(shape=(inp_len,))
         emb_layer = Embedding(input_dim=vocab_size, output_dim=emb_size, input_length=inp_len)(input_layer)
+        dropout1_layer = Dropout(dropout)(emb_layer)
         attn_layer = MultiHeadAttention(num_heads=4, key_dim=128)(dropout1_layer, dropout1_layer, dropout1_layer)
         noise_layer = GaussianNoise(0.1)(attn_layer)
         conv1_layer = Conv1D(kernels_count, kernel_size, padding='same', activation='relu', strides=1, input_shape=(64, 128))(noise_layer)
         conv2_flatten_layer = Flatten()(conv2_layer)
         conv3_flatten_layer = Flatten()(conv3_layer)
         concat1_layer = Concatenate()([flatten_layer, attn_flatten_layer, conv1_flatten_layer, conv2_flatten_layer, conv3_flatten_layer])
+        dropout2_layer = Dropout(dropout)(concat1_layer)
         dense1_layer = Dense(512, activation="linear")(dropout2_layer)
         prelu1_layer = PReLU()(dense1_layer)
+        dropout3_layer = Dropout(dropout)(prelu1_layer)
         dense2_layer = Dense(256, activation="tanh")(dropout3_layer)
+        dropout4_layer = Dropout(dropout)(dense2_layer)
         dense3_layer = Dense(256, activation="relu")(dropout4_layer)
+        dropout5_layer = Dropout(dropout)(dense3_layer)
         dense4_layer = Dense(100, activation="tanh")(dropout5_layer)
         concat2_layer = Concatenate()([dense4_layer, prelu1_layer, attn_flatten_layer, conv1_flatten_layer])
         dense4_layer = Dense(resps_len, activation="softmax")(concat2_layer)