00001
00002
00003
00004
00005
00006
00007
00008
00009
00010
00011
00012
00013
00014
00015
00016
00017
00018
00019
00020
00021
00022
00023
00024
00025
00026
00027
00028
00029
00030
00031
00032
00033
00034
00035
00036
00037
00038
00040
#ifndef EntropyContrast_INC
00041
#define EntropyContrast_INC
00042 #define PROB_TABLE_LIMIT 10000000
00043
00044
00045
#include <plearn_learners/generic/PLearner.h>
00046
00047
00048
00049
00050 #define MY_PRECISION 0.0000000000001
00051 #define MY_LOG_PRECISION 0.0001
00052
#include <plearn/var/TransposeProductVariable.h>
00053
#include <plearn/var/ConcatColumnsVariable.h>
00054
#include <plearn/var/VarRowVariable.h>
00055
#include <plearn/math/random.h>
00056
00057
namespace PLearn {
00058
using namespace std;
00059
00060 class EntropyContrast:
public PLearner
00061 {
00062
00063
private:
00064
00065 typedef PLearner inherited;
00066 int n ;
00067 int evaluate_every_n_epochs;
00068 bool evaluate_first_epoch;
00069
00070 Mat w;
00071 Mat v;
00072
00073
00074 Vec x ;
00075 Vec f_x ;
00076 Vec grad_C_real_wrt_f_x;
00077
00078 Vec grad_C_extra_cost_wrt_f_x;
00079
00080 Vec x_hat;
00081 Vec f_x_hat ;
00082 Vec grad_C_generated_wrt_f_x_hat;
00083
00084 VMat test_set;
00085 VMat validation_set;
00086
00087
00088
00089 real alpha ;
00090
00091
00092 int nhidden;
00093
00094 Vec mu_f;
00095 Vec sigma_f ;
00096
00097 Vec mu_f_hat ;
00098 Vec sigma_f_hat ;
00099
00100 Vec mu_f_square ;
00101 Vec sigma_f_square ;
00102 Mat grad_H_f_x_wrt_w;
00103 Mat grad_H_f_x_hat_wrt_w ;
00104 Mat grad_H_f_x_wrt_v;
00105 Mat grad_H_f_x_hat_wrt_v ;
00106
00107 Vec grad_H_f_x_wrt_bias_output ;
00108 Vec grad_H_f_x_wrt_bias_hidden ;
00109
00110 Vec grad_H_f_x_hat_wrt_bias_output ;
00111 Vec grad_H_f_x_hat_wrt_bias_hidden ;
00112
00113 Mat grad_H_g_wrt_w ;
00114
00115 Vec sigma_g ;
00116 Vec mu_g ;
00117 Vec g_x;
00118
00119 Vec bias_hidden ;
00120 Vec z_x;
00121
00122 Vec z_x_hat ;
00123
00124
00125 Vec bias_output ;
00126
00127 Vec full_sum ;
00128
00129 real full ;
00130
00131
00132 Mat df_dx ;
00133 Mat grad_C_wrt_df_dx ;
00134 Mat grad_extra_wrt_w,
grad_extra_wrt_v ;
00135 Vec grad_extra_wrt_bias_hidden ,
grad_extra_wrt_bias_output ;
00136
00137
00138
00139
00140
00141
public:
00142
00143
00144
00145
00146
00147 string cost_real ;
00148 string cost_gen ;
00149 string cost_extra;
00150 string gen_method;
00151 string evaluation_method;
00152
00153 int nconstraints;
00154
00155 int inputsize ;
00156
00157 real learning_rate ;
00158 real decay_factor ;
00159 real weight_real ,
weight_gen,
weight_extra ;
00160 real weight_decay_output;
00161 real weight_decay_hidden;
00162 int n_seen_examples;
00163 real starting_learning_rate;
00164
00165
00166
00167
00168
00169
00170
00171
00172
EntropyContrast();
00173
00174
00175
00176
00177
private:
00179
00180
void build_();
00181 string getInfo()
00182 {
00183 time_t tt;
00184 time(&tt);
00185
string time_str(ctime(&tt));
00186
vector<string> tokens =
split(time_str);
00187
string info = tokens[3];
00188 info +=
"> ";
00189
return info;
00190 }
00191
00192
00193
void initialize_NNcontinuous();
00194
void update_NNcontinuous();
00195
void computeNNcontinuous_hidden(
const Vec& input_units,
Vec &hidden_units);
00196
void computeNNcontinuous_constraints(
Vec& hidden_units,
Vec &output_units);
00197
void get_NNcontinuous_output(
const Vec & x ,
Vec & f_x,
Vec & z_x);
00198
void update_mu_sigma_f(
const Vec & f_x,
Vec & mu,
Vec & sigma) ;
00199
void update_alpha(
int stage,
int current_input_index) ;
00200
void compute_diversity_cost(
const Vec & f_x,
const Vec & cost,
Vec & grad_C_extra_cost_wrt_f_x );
00201
void get_real_grad_variance_wrt_f(
const Vec & f_x,
Vec & grad ) ;
00202
void get_gen_grad_variance_wrt_f(
const Vec & f_x,
Vec & grad ) ;
00203
void set_NNcontinuous_gradient(
Vec &grad_C_real_wrt_f_x,
Mat &grad_H_f_x_wrt_w,
Mat &grad_H_f_x_wrt_v,
Vec &z_x,
Vec &x,
00204
Vec &grad_H_f_x_wrt_bias_output,
Vec &grad_H_f_x_wrt_bias_hidden);
00205
void gen_normal_0_1(
Vec &output) ;
00206
void set_NNcontinuous_gradient_from_extra_cost(
Mat &grad_C_wrt_df_dx,
const Vec &input );
00207
void compute_df_dx(
Mat &df_dx,
const Vec & input) ;
00208
void compute_extra_grad_wrt_df_dx(
Mat &grad_C_wrt_df_dx) ;
00209
void update_NNcontinuous_from_extra_cost() ;
00210
00211
00212
00213
protected:
00215
00216
static void declareOptions(
OptionList& ol);
00217
00218
public:
00219
00220
00221
00222
00223
00225
virtual void build();
00226
00228
virtual void makeDeepCopyFromShallowCopy(map<const void*, void*>& copies);
00229
00230
00231
00232
00233
PLEARN_DECLARE_OBJECT(
EntropyContrast);
00234
00235
00236
00237
00238
00239
00240
00243
00244
virtual int outputsize() const;
00245
00248
00249 virtual
void forget();
00250
00251
00254
00255 virtual
void train();
00256
00257
00258
00260 virtual
void computeOutput(const
Vec& input,
Vec& output) const;
00261
00263
void reconstruct(const
Vec& output,
Vec& input) const;
00264
00267 virtual
void computeCostsFromOutputs(const
Vec& input, const
Vec& output,
00268 const
Vec& target,
Vec& costs) const;
00269
00270
00272 virtual
TVec<
string> getTestCostNames() const;
00273
00274
00276 virtual
TVec<
string> getTrainCostNames() const;
00277
00278
00279 };
00280
00281
00282 DECLARE_OBJECT_PTR(
EntropyContrast);
00283
00284 }
00285
00286 #endif
00287