]> git.treefish.org Git - phys/latlib.git/blob - configcache.cpp
only storing concurrent config file HASHES instead of full names.
[phys/latlib.git] / configcache.cpp
1 #include "configcache.h"
2
3 #include <stdlib.h>
4 #include <iostream>
5 #include <time.h>
6 #include <dirent.h>
7
8 #define HEADER_READOK   0
9 #define HEADER_READERR  1
10 #define HEADER_READLAST 2
11
12 configcache::configcache(const string& cacheid, const int& nequi, const int& nskip, const string& datadir, char **configmem, const int& configMemSize, const int& cachemode,
13                          writeout *out_a){
14   out = out_a;
15
16   NEQUI = nequi;
17   NSKIP = nskip;
18   DATADIR = datadir;
19   CACHEID = cacheid;
20
21   configMem = (char*)malloc(configMemSize);
22   tmpConfig = (char*)malloc(configMemSize);
23
24   *configmem = configMem;
25   configSize = configMemSize;
26
27   outBuffer = NULL;
28   inBuffer = NULL;
29
30   MODE = cachemode;
31
32   refetchDataFiles = false;
33 }
34
35 string configcache::getFileId(const bool& shortid)
36 {
37   stringstream fileid;
38
39   if(!shortid) fileid << CACHEID << "_" << NEQUI << "_" << NSKIP;
40   for(int ipara=0; ipara<Paras.size(); ipara++)
41     fileid << "_" << Paras[ipara].id << Paras[ipara].val;
42
43   return fileid.str();
44 }
45
46 void configcache::fetchDataFiles()
47 {
48   struct dirent *de=NULL;
49   DIR *d=NULL;
50   static infiledesc filedesc;
51   
52   d=opendir(DATADIR.c_str());
53   if(d != NULL){
54     while(de = readdir(d)){
55       string filename = de->d_name;
56       if(isValidInFile(filename, &filedesc)) 
57         {
58           inFiles.push_back(filedesc);
59         }
60     }
61   }
62 }
63
64 bool configcache::isValidInFile(const string& infile, infiledesc *filedesc)
65 {
66   char *inchar, *inParts;
67   string truncIn, truncOut;
68
69   filedesc->filename = infile;
70   filedesc->doVirtualEquilibration = false;
71
72   if( infile.size() < 4 ) return false;
73
74   if( infile.substr(infile.size()-4) == ".dat" )
75     filedesc->extended = false;
76   else if( infile.substr(infile.size()-4) == "edat" )
77     filedesc->extended = true;
78   else
79     return false;
80
81   inchar = new char [infile.size()+1];
82   strcpy (inchar, infile.c_str());
83   
84   inParts = strtok( inchar, "_" );
85   for(int iPart=0; inParts!=NULL; iPart++)
86     {
87       if( iPart>3 ) { truncIn += "_"; truncIn += inParts; }
88
89       switch(iPart)
90         {
91         case 1: if(inParts != CACHEID) return false; break;
92         case 2: 
93           if (atoi(inParts) > NEQUI) 
94             return false; 
95           else if (atoi(inParts) < NEQUI)
96             filedesc->doVirtualEquilibration = true;
97           filedesc->nequi = atoi(inParts);
98           break;
99         case 3: 
100           if(atoi(inParts) != NSKIP) 
101             return false;
102           filedesc->nskip = atoi(inParts);
103           break;
104         }
105       inParts = strtok( NULL, "_");
106     }
107   truncIn = truncIn.substr(0, truncIn.size()-4);
108
109   delete[] inchar;
110
111   if( truncIn.find( getFileId(true) + "_" ) == string::npos ) return false;
112
113   return true;
114 }
115
116 int configcache::readHeader()
117 {
118   long unsigned int headersize;
119   
120   if( readDataToMem((char *)&headersize, sizeof(long unsigned int)) == sizeof(long unsigned int) && inFile.is_open() ) {
121     if ( headersize == 0 )
122       return HEADER_READLAST;
123
124     pair<unsigned long, void *> newHeader;
125
126     if( readDataToMem((char *)&newHeader.first, sizeof(unsigned long)) == sizeof(unsigned long) && inFile.is_open() ) {
127       newHeader.second = malloc(headersize);
128
129       if( readDataToMem((char *)newHeader.second, headersize) == headersize && inFile.is_open() ) {
130         headerStore.push_back(newHeader);
131         return HEADER_READOK;
132       }
133       else {
134         if(out) *out->log << "CCACHE: Could not read heade-data! Closing dat-file: " << openFileDesc.filename << endl << flush;
135         inFile.close();
136         return HEADER_READERR;
137       }
138     }
139     else {
140       if(out) *out->log << "CCACHE: Could not read headerid-hash! Closing dat-file: " << openFileDesc.filename << endl << flush;
141       inFile.close();
142       return HEADER_READERR;
143     }
144   }
145   else {
146     if(out) *out->log << "CCACHE: Could not read header size. Closing dat-file: " << openFileDesc.filename << endl << flush;
147     inFile.close();
148     return HEADER_READERR;
149   }
150 }
151
152 bool configcache::readAllHeaders()
153 {
154   int readHeaderStatus;
155
156   deleteHeaderStore();
157   
158   do {
159     readHeaderStatus = readHeader();
160   }
161   while ( readHeaderStatus == HEADER_READOK );
162
163   if ( readHeaderStatus == HEADER_READLAST ) return true;
164   else if ( readHeaderStatus == HEADER_READERR ) return false;
165 }
166
167 void * configcache::getHeader(const string& headerid) {
168   for (vector< pair<unsigned long, void *> >::iterator headerStoreIt = headerStore.begin(); headerStoreIt != headerStore.end(); ++headerStoreIt)
169     if ( headerStoreIt->first == hash(headerid) )
170       return headerStoreIt->second;
171   
172   return NULL;
173 }
174
175 bool configcache::readConfig(vector<unsigned long> *excludeFileHashes)
176 {   
177   if(DATADIR == "" || MODE == CACHE_MODE_DISABLED) return false;
178
179   if(refetchDataFiles){
180     refetchDataFiles = false;
181     fetchDataFiles();
182   }
183
184   while(true)
185     {
186       if( (!inFile.is_open()) && inFiles.size() == 0 ) return false;
187
188       while( (!inFile.is_open()) && inFiles.size() > 0 ) {
189         bool excludethisfile=false;
190
191         openFileDesc = inFiles.back();
192
193         if (excludeFileHashes != NULL)
194           for (vector<unsigned long>::iterator exit = excludeFileHashes->begin(); exit != excludeFileHashes->end(); ++exit)
195             if ( *exit == hash(inFiles.back().filename) ) {
196               excludethisfile = true;
197               break;
198             }
199               
200         if ( ! excludethisfile ) {
201           if(out) *out->log << "CCACHE: Opening dat-file: " << inFiles.back().filename << endl << flush;
202           inFile.open( (DATADIR + "/" + inFiles.back().filename).c_str(), std::ios::binary );
203         }
204         else
205           if(out) *out->log << "CCACHE: Excluded dat-file: " << inFiles.back().filename << endl << flush;
206         
207         inFiles.pop_back();
208         
209         if( !inFile.is_open() ) continue;
210
211         inBuffer = new boost::iostreams::filtering_istreambuf;
212         inBuffer->push( boost::iostreams::bzip2_decompressor() );
213         inBuffer->push(inFile);
214       }
215
216       if( inFile.is_open() ) 
217         {
218           if (openFileDesc.doVirtualEquilibration) {
219             if(out) *out->log << "CCACHE: Trying virtual equilibration." << endl << flush;
220             openFileDesc.doVirtualEquilibration = false;
221             for (int iskip=0; iskip < (NEQUI-openFileDesc.nequi)/openFileDesc.nskip; iskip++) {
222               if( readFullBlock(tmpConfig, configSize) != configSize || ! inFile.is_open() )
223                 break;
224             }
225           }
226
227           if( readFullBlock(tmpConfig, configSize) == configSize && inFile.is_open() )
228             {
229               memcpy(configMem, tmpConfig, configSize);
230               return true;
231             }
232           else {
233             if(out) *out->log << "CCACHE: Could not read configuration. Closing dat-file: " << openFileDesc.filename << endl << flush;
234             inFile.close();
235           }
236         }
237     }
238 }
239
240 void configcache::openOutFile()
241 {
242   time_t secstamp = time(NULL);
243
244   outFileName.str("");
245   outFileName << DATADIR << "/" << secstamp << "_" << getFileId() << "_.edat.tmp";
246
247   outFile.open( outFileName.str().c_str(), std::ios::binary );
248
249   outBuffer = new boost::iostreams::filtering_ostreambuf;
250   outBuffer->push(boost::iostreams::bzip2_compressor());
251   outBuffer->push(outFile);
252 }
253
254 void configcache::writeHeader(const string& headerid, const char *header, long unsigned int size) {
255   unsigned long headeridhash;
256
257   if( DATADIR == "" || MODE < 2 ) return;
258
259   if(!outFile.is_open())
260     openOutFile();
261
262   headeridhash = hash(headerid);
263
264   boost::iostreams::write(*outBuffer, (char*)&size, sizeof(long unsigned int));
265   boost::iostreams::write(*outBuffer, (char*)&headeridhash, sizeof(unsigned long));
266   boost::iostreams::write(*outBuffer, header, size);
267 }
268
269 void configcache::writeConfig()
270 {
271   long unsigned int zeroheader=0;
272
273   if ( DATADIR == "" || MODE < 2 ) return;
274
275   if ( ! outFile.is_open() )
276     openOutFile();
277   
278   boost::iostreams::write(*outBuffer, (char*)&zeroheader, sizeof(long unsigned int));
279
280   boost::iostreams::write(*outBuffer, configMem, configSize);
281 }
282
283 void configcache::addPara(const string& parid, const double& val){
284   parameter newPara;
285   newPara.id = parid;
286   newPara.val = val;
287   Paras.push_back(newPara);
288 }
289
290 int configcache::getParIndex(const string& parid){
291   for(int ipara=0; ipara<Paras.size(); ipara++)
292     if(Paras[ipara].id == parid) return ipara;
293 }
294
295 void configcache::setPara(const string& parid, const double& value){
296   Paras[getParIndex(parid)].val = value;
297   finishOutFile();
298   if(inBuffer != NULL) { delete inBuffer; inBuffer=NULL; } 
299   inFile.close();
300   inFiles.clear();
301
302   refetchDataFiles = true;
303 }
304
305 configcache::~configcache()
306 {
307   finishOutFile();
308   delete inBuffer;
309   inBuffer = NULL;
310 }
311
312 void configcache::finishOutFile()
313 {
314   if( outBuffer != NULL )
315     {
316       delete outBuffer;
317       outBuffer = NULL;
318     }
319
320   if( outFile.is_open() )
321     {
322       outFile.close();
323       rename( outFileName.str().c_str(), outFileName.str().substr(0, outFileName.str().size()-4).c_str() );
324     }
325 }
326
327 int configcache::readFullBlock(char *tmpData, long unsigned int dataSize)
328 {
329   /* try to read header */
330   if ( openFileDesc.extended )
331     if ( ! readAllHeaders() ) 
332       return -1;
333
334   /* read data */
335   return readDataToMem(tmpData, dataSize);
336 }
337
338 int configcache::readDataToMem(char *tmpData, long unsigned int dataSize)
339 {
340   int readturn = -1;
341
342   if ( dataSize == 0 ) return 0;
343
344   try { readturn = boost::iostreams::read(*inBuffer, tmpData, dataSize); }
345   catch(boost::iostreams::bzip2_error& error) { 
346     if(out) *out->log << "CCACHE: Caught bzip2 exception with error code: " << error.error() << endl << flush;
347     inFile.close();
348   } 
349   catch (std::exception const& ex) {
350     if(out) *out->log << "CCACHE: Caught exception: " << ex.what() << endl << flush;
351     inFile.close();
352   }
353   catch( ... ) {
354     if(out) *out->log << "CCACHE: Caught unknown exception while reading." << endl << flush;
355     inFile.close();
356   }
357
358   return readturn;
359 }
360
361 unsigned long configcache::hash(const string& str)
362 {
363   unsigned long hash = 5381;
364
365   for(string::const_iterator it=str.begin();it!=str.end();it++) 
366     hash = ((hash << 5) + hash) + *it; /* hash * 33 + character */
367
368   return hash;
369 }
370
371 void configcache::deleteHeaderStore()
372 {
373   while ( headerStore.size() > 0 ) {
374     free(headerStore.back().second);
375     headerStore.pop_back();
376   }
377 }