]> git.treefish.org Git - phys/latlib.git/blobdiff - configcache.cpp
added support for using excluded config-files for equilibration.
[phys/latlib.git] / configcache.cpp
index 96dc470ef8e247b740b2ab8fbcd8c8b670229121..6cd46a179a2772792ba5bc2caf202ec1fb5dbe98 100644 (file)
@@ -5,9 +5,13 @@
 #include <time.h>
 #include <dirent.h>
 
+#define HEADER_READOK   0
+#define HEADER_READERR  1
+#define HEADER_READLAST 2
+
 configcache::configcache(const string& cacheid, const int& nequi, const int& nskip, const string& datadir, char **configmem, const int& configMemSize, const int& cachemode,
-                        writeout *out_a){
-  out = out_a;
+                        ostream *_log){
+  log = _log;
 
   NEQUI = nequi;
   NSKIP = nskip;
@@ -67,7 +71,12 @@ bool configcache::isValidInFile(const string& infile, infiledesc *filedesc)
 
   if( infile.size() < 4 ) return false;
 
-  if( infile.substr(infile.size()-3) != "dat" ) return false;
+  if( infile.substr(infile.size()-4) == ".dat" )
+    filedesc->extended = false;
+  else if( infile.substr(infile.size()-4) == "edat" )
+    filedesc->extended = true;
+  else
+    return false;
 
   inchar = new char [infile.size()+1];
   strcpy (inchar, infile.c_str());
@@ -104,9 +113,71 @@ bool configcache::isValidInFile(const string& infile, infiledesc *filedesc)
   return true;
 }
 
-bool configcache::readConfig()
+int configcache::readHeader()
+{
+  long unsigned int headersize;
+  
+  if( readDataToMem((char *)&headersize, sizeof(long unsigned int)) == sizeof(long unsigned int) && inFile.is_open() ) {
+    if ( headersize == 0 )
+      return HEADER_READLAST;
+
+    pair<unsigned long, void *> newHeader;
+
+    if( readDataToMem((char *)&newHeader.first, sizeof(unsigned long)) == sizeof(unsigned long) && inFile.is_open() ) {
+      newHeader.second = malloc(headersize);
+
+      if( readDataToMem((char *)newHeader.second, headersize) == headersize && inFile.is_open() ) {
+       headerStore.push_back(newHeader);
+       return HEADER_READOK;
+      }
+      else {
+       if(log) *log << "CCACHE: Could not read heade-data! Closing dat-file: " << openFileDesc.filename << endl << flush;
+       inFile.close();
+       return HEADER_READERR;
+      }
+    }
+    else {
+      if(log) *log << "CCACHE: Could not read headerid-hash! Closing dat-file: " << openFileDesc.filename << endl << flush;
+      inFile.close();
+      return HEADER_READERR;
+    }
+  }
+  else {
+    if(log) *log << "CCACHE: Could not read header size. Closing dat-file: " << openFileDesc.filename << endl << flush;
+    inFile.close();
+    return HEADER_READERR;
+  }
+}
+
+bool configcache::readAllHeaders()
+{
+  int readHeaderStatus;
+
+  deleteHeaderStore();
+  
+  do {
+    readHeaderStatus = readHeader();
+  }
+  while ( readHeaderStatus == HEADER_READOK );
+
+  if ( readHeaderStatus == HEADER_READLAST ) return true;
+  else if ( readHeaderStatus == HEADER_READERR ) return false;
+}
+
+void * configcache::getHeader(const string& headerid) {
+  for (vector< pair<unsigned long, void *> >::iterator headerStoreIt = headerStore.begin(); headerStoreIt != headerStore.end(); ++headerStoreIt)
+    if ( headerStoreIt->first == hash(headerid) )
+      return headerStoreIt->second;
+  
+  return NULL;
+}
+
+/* returns number of equilibration-steps left */
+int configcache::readConfig(vector<unsigned long> *excludeFileHashes)
 {
-  if(DATADIR == "" || MODE == CACHE_MODE_DISABLED) return false;
+  int nequileft = NEQUI;
+
+  if(DATADIR == "" || MODE == CACHE_MODE_DISABLED) return nequileft;
 
   if(refetchDataFiles){
     refetchDataFiles = false;
@@ -115,62 +186,92 @@ bool configcache::readConfig()
 
   while(true)
     {
-      if( (!inFile.is_open()) && inFiles.size() == 0 ) return false;
+      vector<infiledesc>::iterator inFileIt = getNextInfile(excludeFileHashes);
 
-      while( (!inFile.is_open()) && inFiles.size() > 0 )
-       {
-         if(out) *out->log << "CCACHE: Opening dat-file: " << inFiles.back().filename << endl << flush;
+      if( (!inFile.is_open()) && inFileIt == inFiles.end() ) return nequileft;
 
-         openFileDesc = inFiles.back();
-         inFile.open( (DATADIR + "/" + inFiles.back().filename).c_str(), std::ios::binary );
-         inFiles.pop_back();
+      while( (!inFile.is_open()) && inFiles.size() > 0 ) {
+       openFileDesc = *inFileIt;
 
-         if( !inFile.is_open() ) continue;
+       if(log) *log << "CCACHE: Opening dat-file: " << inFileIt->filename << endl << flush;
+       inFile.open( (DATADIR + "/" + inFileIt->filename).c_str(), std::ios::binary );
+       
+       inFiles.erase(inFileIt);
+       
+       if( !inFile.is_open() ) continue;
 
-         inBuffer = new boost::iostreams::filtering_istreambuf;
-         inBuffer->push( boost::iostreams::bzip2_decompressor() );
-         inBuffer->push(inFile);
-       }
+       inBuffer = new boost::iostreams::filtering_istreambuf;
+       inBuffer->push( boost::iostreams::bzip2_decompressor() );
+       inBuffer->push(inFile);
+      }
 
       if( inFile.is_open() ) 
        {
          if (openFileDesc.doVirtualEquilibration) {
-           if(out) *out->log << "CCACHE: Trying virtual equilibration." << endl << flush;
+           if(log) *log << "CCACHE: Trying virtual equilibration." << endl << flush;
            openFileDesc.doVirtualEquilibration = false;
            for (int iskip=0; iskip < (NEQUI-openFileDesc.nequi)/openFileDesc.nskip; iskip++) {
-             if( readConfigToMem(tmpConfig) != configSize || ! inFile.is_open() )
+             if( readFullBlock(tmpConfig, configSize) != configSize || ! inFile.is_open() )
                break;
+             else if ( (NEQUI-openFileDesc.nequi) - (iskip+1)*openFileDesc.nskip < nequileft ) {
+               memcpy(configMem, tmpConfig, configSize);
+               nequileft = (NEQUI-openFileDesc.nequi) - (iskip+1)*openFileDesc.nskip;
+             }
            }
          }
 
-         if( readConfigToMem(tmpConfig) == configSize && inFile.is_open() )
+         if( readFullBlock(tmpConfig, configSize) == configSize && inFile.is_open() )
            {
              memcpy(configMem, tmpConfig, configSize);
-             return true;
+             return -1;
            }
          else {
-           if(out) *out->log << "CCACHE: Closing dat-file: " << openFileDesc.filename << endl << flush;
+           if(log) *log << "CCACHE: Could not read configuration. Closing dat-file: " << openFileDesc.filename << endl << flush;
            inFile.close();
          }
        }
     }
 }
 
-void configcache::writeConfig()
+void configcache::openOutFile()
 {
+  time_t secstamp = time(NULL);
+
+  outFileName.str("");
+  outFileName << DATADIR << "/" << secstamp << "_" << getFileId() << "_.edat.tmp";
+
+  outFile.open( outFileName.str().c_str(), std::ios::binary );
+
+  outBuffer = new boost::iostreams::filtering_ostreambuf;
+  outBuffer->push(boost::iostreams::bzip2_compressor());
+  outBuffer->push(outFile);
+}
+
+void configcache::writeHeader(const string& headerid, const char *header, long unsigned int size) {
+  unsigned long headeridhash;
+
   if( DATADIR == "" || MODE < 2 ) return;
 
-  if(!outFile.is_open()){
-    time_t secstamp = time(NULL);
+  if(!outFile.is_open())
+    openOutFile();
 
-    outFileName.str("");
-    outFileName << DATADIR << "/" << secstamp << "_" << getFileId() << "_.dat.tmp";    
-    outFile.open( outFileName.str().c_str(), std::ios::binary );
+  headeridhash = hash(headerid);
 
-    outBuffer = new boost::iostreams::filtering_ostreambuf;
-    outBuffer->push(boost::iostreams::bzip2_compressor());
-    outBuffer->push(outFile);
-  }
+  boost::iostreams::write(*outBuffer, (char*)&size, sizeof(long unsigned int));
+  boost::iostreams::write(*outBuffer, (char*)&headeridhash, sizeof(unsigned long));
+  boost::iostreams::write(*outBuffer, header, size);
+}
+
+void configcache::writeConfig()
+{
+  long unsigned int zeroheader=0;
+
+  if ( DATADIR == "" || MODE < 2 ) return;
+
+  if ( ! outFile.is_open() )
+    openOutFile();
+  
+  boost::iostreams::write(*outBuffer, (char*)&zeroheader, sizeof(long unsigned int));
 
   boost::iostreams::write(*outBuffer, configMem, configSize);
 }
@@ -219,23 +320,73 @@ void configcache::finishOutFile()
     }
 }
 
-int configcache::readConfigToMem(char *tmpConfig)
+int configcache::readFullBlock(char *tmpData, long unsigned int dataSize)
+{
+  /* try to read header */
+  if ( openFileDesc.extended )
+    if ( ! readAllHeaders() ) 
+      return -1;
+
+  /* read data */
+  return readDataToMem(tmpData, dataSize);
+}
+
+int configcache::readDataToMem(char *tmpData, long unsigned int dataSize)
 {
   int readturn = -1;
 
-  try { readturn = boost::iostreams::read(*inBuffer, tmpConfig, configSize); }
+  if ( dataSize == 0 ) return 0;
+
+  try { readturn = boost::iostreams::read(*inBuffer, tmpData, dataSize); }
   catch(boost::iostreams::bzip2_error& error) { 
-    if(out) *out->log << "CCACHE: Caught bzip2 exception with error code: " << error.error() << endl << flush;
+    if(log) *log << "CCACHE: Caught bzip2 exception with error code: " << error.error() << endl << flush;
     inFile.close();
   } 
   catch (std::exception const& ex) {
-    if(out) *out->log << "CCACHE: Caught exception: " << ex.what() << endl << flush;
+    if(log) *log << "CCACHE: Caught exception: " << ex.what() << endl << flush;
     inFile.close();
   }
   catch( ... ) {
-    if(out) *out->log << "CCACHE: Caught unknown exception while reading." << endl << flush;
+    if(log) *log << "CCACHE: Caught unknown exception while reading." << endl << flush;
     inFile.close();
   }
 
   return readturn;
 }
+
+unsigned long configcache::hash(const string& str)
+{
+  unsigned long hash = 5381;
+
+  for(string::const_iterator it=str.begin();it!=str.end();it++) 
+    hash = ((hash << 5) + hash) + *it; /* hash * 33 + character */
+
+  return hash;
+}
+
+void configcache::deleteHeaderStore()
+{
+  while ( headerStore.size() > 0 ) {
+    free(headerStore.back().second);
+    headerStore.pop_back();
+  }
+}
+
+vector<infiledesc>::iterator configcache::getNextInfile(vector<unsigned long> *excludeFileHashes) {
+  for (vector<infiledesc>::iterator init = inFiles.begin(); init != inFiles.end(); ++init) {
+    if (excludeFileHashes != NULL) {
+      bool excludethisfile = false;
+
+      for (vector<unsigned long>::iterator exit = excludeFileHashes->begin(); exit != excludeFileHashes->end(); ++exit)
+       if ( *exit == hash(init->filename) ) {
+         excludethisfile = true;
+         break;
+       }
+
+      if (excludethisfile)
+       continue;
+    }
+    return init;
+  }
+  return inFiles.end();
+}