00001
00002
00003
00004
00005
00006
00007
00008
00009
00010
00011
00012
00013
00014
00015
00016
00017
00018
00019
00020
00021
00022
00023
00024
00025
00026
00027
00028
00029
00030
00031
00032
00033
00034
00035
00036
00037
00038
00039
00040
00041
00042
00043
00044
#include "AutoSDBVMatrix.h"
00045
00046
00047
00048
namespace PLearn {
00049
using namespace std;
00050
00051 AutoSDBVMatrix::AutoSDBVMatrix(
const string& dbname)
00052 :sdb_(
extract_filename(dbname),
extract_directory(dbname),
SDB::readonly, true), string_field_map()
00053 {
00054 metadatadir =
extract_directory(dbname) +
extract_filename(dbname) +
".metadata";
00055
if(!
force_mkdir(metadatadir))
00056
PLWARNING(
"In AutoSDBVMatrix constructor, could not create directory %s",metadatadir.c_str());
00057
00058
const Schema& sc =
sdb_.
getSchema();
00059
00060
00061
getMappings();
00062
00063
row_ =
Row(&sc);
00064 Schema::const_iterator it = sc.begin();
00065 Schema::const_iterator itend = sc.end();
00066
00067 width_=
sdb_.
width();
00068 length_ =
sdb_.
length();
00069
00070
00071
00072 map_sr =
TVec<map<string,real> >(width_);
00073 map_rs =
TVec<map<real,string> >(width_);
00074
00075
int i=0;
00076
for(it=sc.begin(); it!=itend; ++it)
00077 {
00078
if(it->field_type==
DateType)
00079 declareField(i++, it->name, VMField::Date);
00080
else
00081 declareField(i++, it->name, VMField::UnknownType);
00082 }
00083 }
00084
00085 void AutoSDBVMatrix::getNewRow(
int i,
const Vec& v)
const
00086
{
00087
sdb_.
getInRow(i,
row_);
00088
Row::const_iterator it =
row_.
begin();
00089
int w =
width();
00090
if(w!=v.
length())
00091
PLERROR(
"In AutoSDBVMatrix::getNewRow length of v must be width of VMatrix");
00092
00093
int j=0;
00094
while(j<w)
00095 {
00096
if(it.
isString())
00097 v[j]=
string_field_map.find(it.
name())->second[it.
asString()];
00098
else if(it.
isMissing())
00099 v[j] =
MISSING_VALUE;
00100
else if(it.
isCharacter())
00101 v[j] = (
real)*(it.
asCharacter());
00102
else
00103 v[j] = (
real)it.
toDouble();
00104 ++j;
00105 ++it;
00106 }
00107 }
00108
00109
00110 void AutoSDBVMatrix::getMappings()
00111 {
00112
const Schema& sc =
sdb_.
getSchema();
00113
00114
for(Schema::const_iterator it= sc.begin(); it < sc.end(); ++it)
00115
if(it->field_type ==
StringType)
00116 {
00117
string field_filename= metadatadir +
slash + it->name +
".strings";
00118
real dft_val=
MISSING_VALUE;
00119
00120
if(
isfile(field_filename +
".others"))
00121
PLearn::load(field_filename +
".others", dft_val);
00122
00123
string_field_map[it->name]=
StringFieldMapping(field_filename, dft_val);
00124
num2string_map[it->name]=
NumToStringMapping(field_filename);
00125 }
00126 }
00127
00128
00129 }
00130
00131