]> git.treefish.org Git - phys/latlib.git/blobdiff - configcache.cpp
only storing concurrent config file HASHES instead of full names.
[phys/latlib.git] / configcache.cpp
index 7718163da73038107a32f95d1ab9f55a5cd54adb..1095775e8b097dd9afaf8a641d6a10f17630619c 100644 (file)
@@ -5,7 +5,14 @@
 #include <time.h>
 #include <dirent.h>
 
-configcache::configcache(const string& cacheid, const int& nequi, const int& nskip, const string& datadir, char **configmem, const int& configMemSize){
+#define HEADER_READOK   0
+#define HEADER_READERR  1
+#define HEADER_READLAST 2
+
+configcache::configcache(const string& cacheid, const int& nequi, const int& nskip, const string& datadir, char **configmem, const int& configMemSize, const int& cachemode,
+                        writeout *out_a){
+  out = out_a;
+
   NEQUI = nequi;
   NSKIP = nskip;
   DATADIR = datadir;
@@ -20,6 +27,8 @@ configcache::configcache(const string& cacheid, const int& nequi, const int& nsk
   outBuffer = NULL;
   inBuffer = NULL;
 
+  MODE = cachemode;
+
   refetchDataFiles = false;
 }
 
@@ -38,27 +47,36 @@ void configcache::fetchDataFiles()
 {
   struct dirent *de=NULL;
   DIR *d=NULL;
+  static infiledesc filedesc;
   
   d=opendir(DATADIR.c_str());
   if(d != NULL){
     while(de = readdir(d)){
       string filename = de->d_name;
-      if(isValidInFile(filename)) 
+      if(isValidInFile(filename, &filedesc)) 
        {
-         inFiles.push_back(filename);
+         inFiles.push_back(filedesc);
        }
     }
   }
 }
 
-bool configcache::isValidInFile(const string& infile)
+bool configcache::isValidInFile(const string& infile, infiledesc *filedesc)
 {
   char *inchar, *inParts;
   string truncIn, truncOut;
 
+  filedesc->filename = infile;
+  filedesc->doVirtualEquilibration = false;
+
   if( infile.size() < 4 ) return false;
 
-  if( infile.substr(infile.size()-3) != "dat" ) return false;
+  if( infile.substr(infile.size()-4) == ".dat" )
+    filedesc->extended = false;
+  else if( infile.substr(infile.size()-4) == "edat" )
+    filedesc->extended = true;
+  else
+    return false;
 
   inchar = new char [infile.size()+1];
   strcpy (inchar, infile.c_str());
@@ -71,8 +89,18 @@ bool configcache::isValidInFile(const string& infile)
       switch(iPart)
        {
        case 1: if(inParts != CACHEID) return false; break;
-       case 2: if(atoi(inParts) < NEQUI) return false; break;
-       case 3: if(atoi(inParts) < NSKIP) return false; break;
+       case 2: 
+         if (atoi(inParts) > NEQUI) 
+           return false; 
+         else if (atoi(inParts) < NEQUI)
+           filedesc->doVirtualEquilibration = true;
+         filedesc->nequi = atoi(inParts);
+         break;
+       case 3: 
+         if(atoi(inParts) != NSKIP) 
+           return false;
+         filedesc->nskip = atoi(inParts);
+         break;
        }
       inParts = strtok( NULL, "_");
     }
@@ -85,9 +113,68 @@ bool configcache::isValidInFile(const string& infile)
   return true;
 }
 
-bool configcache::readConfig()
+int configcache::readHeader()
 {
-  if(DATADIR == "") return false;
+  long unsigned int headersize;
+  
+  if( readDataToMem((char *)&headersize, sizeof(long unsigned int)) == sizeof(long unsigned int) && inFile.is_open() ) {
+    if ( headersize == 0 )
+      return HEADER_READLAST;
+
+    pair<unsigned long, void *> newHeader;
+
+    if( readDataToMem((char *)&newHeader.first, sizeof(unsigned long)) == sizeof(unsigned long) && inFile.is_open() ) {
+      newHeader.second = malloc(headersize);
+
+      if( readDataToMem((char *)newHeader.second, headersize) == headersize && inFile.is_open() ) {
+       headerStore.push_back(newHeader);
+       return HEADER_READOK;
+      }
+      else {
+       if(out) *out->log << "CCACHE: Could not read heade-data! Closing dat-file: " << openFileDesc.filename << endl << flush;
+       inFile.close();
+       return HEADER_READERR;
+      }
+    }
+    else {
+      if(out) *out->log << "CCACHE: Could not read headerid-hash! Closing dat-file: " << openFileDesc.filename << endl << flush;
+      inFile.close();
+      return HEADER_READERR;
+    }
+  }
+  else {
+    if(out) *out->log << "CCACHE: Could not read header size. Closing dat-file: " << openFileDesc.filename << endl << flush;
+    inFile.close();
+    return HEADER_READERR;
+  }
+}
+
+bool configcache::readAllHeaders()
+{
+  int readHeaderStatus;
+
+  deleteHeaderStore();
+  
+  do {
+    readHeaderStatus = readHeader();
+  }
+  while ( readHeaderStatus == HEADER_READOK );
+
+  if ( readHeaderStatus == HEADER_READLAST ) return true;
+  else if ( readHeaderStatus == HEADER_READERR ) return false;
+}
+
+void * configcache::getHeader(const string& headerid) {
+  for (vector< pair<unsigned long, void *> >::iterator headerStoreIt = headerStore.begin(); headerStoreIt != headerStore.end(); ++headerStoreIt)
+    if ( headerStoreIt->first == hash(headerid) )
+      return headerStoreIt->second;
+  
+  return NULL;
+}
+
+bool configcache::readConfig(vector<unsigned long> *excludeFileHashes)
+{   
+  if(DATADIR == "" || MODE == CACHE_MODE_DISABLED) return false;
 
   if(refetchDataFiles){
     refetchDataFiles = false;
@@ -98,49 +185,99 @@ bool configcache::readConfig()
     {
       if( (!inFile.is_open()) && inFiles.size() == 0 ) return false;
 
-      while( (!inFile.is_open()) && inFiles.size() > 0 )
-       {
-         inFile.open( (DATADIR + "/" + inFiles.back()).c_str(), std::ios::binary );
-         inFiles.pop_back();
+      while( (!inFile.is_open()) && inFiles.size() > 0 ) {
+       bool excludethisfile=false;
 
-         if( !inFile.is_open() ) continue;
+       openFileDesc = inFiles.back();
 
-         inBuffer = new boost::iostreams::filtering_istreambuf;
-         inBuffer->push( boost::iostreams::bzip2_decompressor() );
-         inBuffer->push(inFile);
+       if (excludeFileHashes != NULL)
+         for (vector<unsigned long>::iterator exit = excludeFileHashes->begin(); exit != excludeFileHashes->end(); ++exit)
+           if ( *exit == hash(inFiles.back().filename) ) {
+             excludethisfile = true;
+             break;
+           }
+             
+       if ( ! excludethisfile ) {
+         if(out) *out->log << "CCACHE: Opening dat-file: " << inFiles.back().filename << endl << flush;
+         inFile.open( (DATADIR + "/" + inFiles.back().filename).c_str(), std::ios::binary );
        }
+       else
+         if(out) *out->log << "CCACHE: Excluded dat-file: " << inFiles.back().filename << endl << flush;
+       
+       inFiles.pop_back();
+       
+       if( !inFile.is_open() ) continue;
+
+       inBuffer = new boost::iostreams::filtering_istreambuf;
+       inBuffer->push( boost::iostreams::bzip2_decompressor() );
+       inBuffer->push(inFile);
+      }
 
       if( inFile.is_open() ) 
        {
-         if( boost::iostreams::read(*inBuffer, tmpConfig, configSize) == configSize )
+         if (openFileDesc.doVirtualEquilibration) {
+           if(out) *out->log << "CCACHE: Trying virtual equilibration." << endl << flush;
+           openFileDesc.doVirtualEquilibration = false;
+           for (int iskip=0; iskip < (NEQUI-openFileDesc.nequi)/openFileDesc.nskip; iskip++) {
+             if( readFullBlock(tmpConfig, configSize) != configSize || ! inFile.is_open() )
+               break;
+           }
+         }
+
+         if( readFullBlock(tmpConfig, configSize) == configSize && inFile.is_open() )
            {
              memcpy(configMem, tmpConfig, configSize);
              return true;
            }
-         else inFile.close();
+         else {
+           if(out) *out->log << "CCACHE: Could not read configuration. Closing dat-file: " << openFileDesc.filename << endl << flush;
+           inFile.close();
+         }
        }
     }
 }
 
-void configcache::writeConfig()
+void configcache::openOutFile()
 {
-  if( DATADIR == "") return;
+  time_t secstamp = time(NULL);
 
-  if(!outFile.is_open()){
-    time_t secstamp = time(NULL);
+  outFileName.str("");
+  outFileName << DATADIR << "/" << secstamp << "_" << getFileId() << "_.edat.tmp";
 
-    outFileName.str("");
-    outFileName << DATADIR << "/" << secstamp << "_" << getFileId() << "_.dat.tmp";    
-    outFile.open( outFileName.str().c_str(), std::ios::binary );
+  outFile.open( outFileName.str().c_str(), std::ios::binary );
 
-    outBuffer = new boost::iostreams::filtering_ostreambuf;
-    outBuffer->push(boost::iostreams::bzip2_compressor());
-    outBuffer->push(outFile);
-  }
+  outBuffer = new boost::iostreams::filtering_ostreambuf;
+  outBuffer->push(boost::iostreams::bzip2_compressor());
+  outBuffer->push(outFile);
+}
 
-  boost::iostreams::write(*outBuffer, configMem, configSize);
+void configcache::writeHeader(const string& headerid, const char *header, long unsigned int size) {
+  unsigned long headeridhash;
+
+  if( DATADIR == "" || MODE < 2 ) return;
 
-  outFile.flush();
+  if(!outFile.is_open())
+    openOutFile();
+
+  headeridhash = hash(headerid);
+
+  boost::iostreams::write(*outBuffer, (char*)&size, sizeof(long unsigned int));
+  boost::iostreams::write(*outBuffer, (char*)&headeridhash, sizeof(unsigned long));
+  boost::iostreams::write(*outBuffer, header, size);
+}
+
+void configcache::writeConfig()
+{
+  long unsigned int zeroheader=0;
+
+  if ( DATADIR == "" || MODE < 2 ) return;
+
+  if ( ! outFile.is_open() )
+    openOutFile();
+  
+  boost::iostreams::write(*outBuffer, (char*)&zeroheader, sizeof(long unsigned int));
+
+  boost::iostreams::write(*outBuffer, configMem, configSize);
 }
 
 void configcache::addPara(const string& parid, const double& val){
@@ -186,3 +323,55 @@ void configcache::finishOutFile()
       rename( outFileName.str().c_str(), outFileName.str().substr(0, outFileName.str().size()-4).c_str() );
     }
 }
+
+int configcache::readFullBlock(char *tmpData, long unsigned int dataSize)
+{
+  /* try to read header */
+  if ( openFileDesc.extended )
+    if ( ! readAllHeaders() ) 
+      return -1;
+
+  /* read data */
+  return readDataToMem(tmpData, dataSize);
+}
+
+int configcache::readDataToMem(char *tmpData, long unsigned int dataSize)
+{
+  int readturn = -1;
+
+  if ( dataSize == 0 ) return 0;
+
+  try { readturn = boost::iostreams::read(*inBuffer, tmpData, dataSize); }
+  catch(boost::iostreams::bzip2_error& error) { 
+    if(out) *out->log << "CCACHE: Caught bzip2 exception with error code: " << error.error() << endl << flush;
+    inFile.close();
+  } 
+  catch (std::exception const& ex) {
+    if(out) *out->log << "CCACHE: Caught exception: " << ex.what() << endl << flush;
+    inFile.close();
+  }
+  catch( ... ) {
+    if(out) *out->log << "CCACHE: Caught unknown exception while reading." << endl << flush;
+    inFile.close();
+  }
+
+  return readturn;
+}
+
+unsigned long configcache::hash(const string& str)
+{
+  unsigned long hash = 5381;
+
+  for(string::const_iterator it=str.begin();it!=str.end();it++) 
+    hash = ((hash << 5) + hash) + *it; /* hash * 33 + character */
+
+  return hash;
+}
+
+void configcache::deleteHeaderStore()
+{
+  while ( headerStore.size() > 0 ) {
+    free(headerStore.back().second);
+    headerStore.pop_back();
+  }
+}