00001
00002
00003
00004
00005
00006
00007
00008
00009
00010
00011
00012
00013
00014
00015
00016
00017
00018
00019
00020
00021
00022
00023
00024
00025
00026
00027
00028
00029
00030
00031
00032
00033
00034
00035
00036
00037
00038
00039
00040
00041
00042
00043
00044
#include "NistDB.h"
00045
00046
namespace PLearn {
00047
using namespace std;
00048
00049
00050 #define DO_RESCALE
00051
00052 NistDB::NistDB(
bool train)
00053 :
VMatrix(60000, 28*28+1)
00054 {
00055
if(train)
00056 {
00057
imagef.open(
"/u/lisa/Database/MNIST/train-images-idx3-ubyte");
00058
labelf.open(
"/u/lisa/Database/MNIST/train-labels-idx1-ubyte");
00059 length_ = 60000;
00060 }
00061
else
00062 {
00063
00064
00065
00066
imagef.open(
"/u/lisa/Database/MNIST/t10k-images-idx3-ubyte");
00067
labelf.open(
"/u/lisa/Database/MNIST/t10k-labels-idx1-ubyte");
00068 length_ = 10000;
00069 }
00070
if(!
imagef)
00071
PLERROR(
"In NistDB constructor could not open imagefile for reading");
00072
if(!
labelf)
00073
PLERROR(
"In NistDB constructor could not open labelfile for reading");
00074 }
00075
00076 real NistDB::get(
int i,
int j)
const
00077
{
00078
#ifdef BOUNDCHECK
00079
if(i<0 || i>=
length() || j<0 || j>=
width())
00080
PLERROR(
"In NistDB::get OUT OF BOUNDS");
00081
#endif
00082
if(j==
width()-1)
00083 {
00084
labelf.seekg(8+i);
00085
return real(
labelf.get());
00086 }
00087
else
00088 {
00089
imagef.seekg(16+i*(28*28)+j);
00090
#ifdef DO_RESCALE
00091
return real(
imagef.get())/255.0;
00092
#else
00093
return real(
imagef.get());
00094
#endif
00095
}
00096 }
00097
00098 void NistDB::getSubRow(
int i,
int j,
Vec v)
const
00099
{
00100
#ifdef BOUNDCHECK
00101
if(i<0 || i>=
length() || j<0 || j+v.
length()>
width())
00102
PLERROR(
"In NistDB::getSubRow OUT OF BOUNDS");
00103
#endif
00104
00105
int npixelstoread = v.
length();
00106
if(j+v.
length()==
width())
00107 {
00108
labelf.seekg(8+i);
00109 v[v.
length()-1] =
real(
labelf.get());
00110 npixelstoread--;
00111 }
00112
00113
if(j<
width()-1)
00114 {
00115
imagef.seekg(16+i*(28*28)+j);
00116
#if __GNUC__ < 3 && !defined(WIN32)
00117
imagef.read(
buf, npixelstoread);
00118
#else
00119
imagef.read(reinterpret_cast<char*>(
buf), npixelstoread);
00120
#endif
00121
for(
int k=0;
k<npixelstoread;
k++)
00122 {
00123
#ifdef DO_RESCALE
00124
v[
k] =
real(buf[
k])/255.0;
00125
#else
00126
v[
k] = real(buf[
k]);
00127
#endif
00128
}
00129 }
00130 }
00131
00132
00133
00134
00135
00136
00137
00138
00139
00140 }