d5/de8/adaptiveRMaxPlaner_8h_source.html

 // =========================================================================
 #ifndef GUM_ADAPTIVE_RMAX_PLANER_H
 #define GUM_ADAPTIVE_RMAX_PLANER_H
 // =========================================================================
 #include <agrum/FMDP/SDyna/Strategies/IDecisionStrategy.h>
 #include <agrum/FMDP/fmdp.h>
 #include <agrum/FMDP/learning/fmdpLearner.h>
 #include <agrum/FMDP/planning/structuredPlaner.h>
 #include <agrum/FMDP/simulation/statesCounter.h>
 // =========================================================================

 namespace gum {

   class AdaptiveRMaxPlaner
       : public StructuredPlaner< double >
       , public IDecisionStrategy {
     // ###################################################################
     // ###################################################################
     public:
     // ==========================================================================
     // ==========================================================================
     static AdaptiveRMaxPlaner*
        ReducedAndOrderedInstance(const ILearningStrategy* learner,
                                  double                   discountFactor = 0.9,
                                  double                   epsilon = 0.00001,
                                  bool                     verbose = true) {
       return new AdaptiveRMaxPlaner(new MDDOperatorStrategy< double >(),
                                     discountFactor,
                                     epsilon,
                                     learner,
                                     verbose);
     }

     // ==========================================================================
     // ==========================================================================
     static AdaptiveRMaxPlaner* TreeInstance(const ILearningStrategy* learner,
                                             double discountFactor = 0.9,
                                             double epsilon = 0.00001,
                                             bool   verbose = true) {
       return new AdaptiveRMaxPlaner(new TreeOperatorStrategy< double >(),
                                     discountFactor,
                                     epsilon,
                                     learner,
                                     verbose);
     }


     // ###################################################################
     // ###################################################################
     private:
     // ==========================================================================
     // ==========================================================================
     AdaptiveRMaxPlaner(IOperatorStrategy< double >* opi,
                        double                       discountFactor,
                        double                       epsilon,
                        const ILearningStrategy*     learner,
                        bool                         verbose);

     // ==========================================================================
     // ==========================================================================
     public:
     ~AdaptiveRMaxPlaner();


     // ###################################################################
     // ###################################################################

     public:
     // ==========================================================================
     // ==========================================================================
     void initialize(const FMDP< double >* fmdp);


     // ==========================================================================
     // ==========================================================================
     void makePlanning(Idx nbStep = 1000000);


     // ###################################################################
     // ###################################################################

     protected:
     // ==========================================================================
     // ==========================================================================
     virtual void _initVFunction();

     // ==========================================================================
     // ==========================================================================
     virtual MultiDimFunctionGraph< double >* _valueIteration();


     // ###################################################################
     // ###################################################################

     protected:
     // ==========================================================================
     // ==========================================================================
     virtual void _evalPolicy();


     private:
     void __makeRMaxFunctionGraphs();

     std::pair< NodeId, NodeId > __visitLearner(const IVisitableGraphLearner*,
                                                NodeId currentNodeId,
                                                MultiDimFunctionGraph< double >*,
                                                MultiDimFunctionGraph< double >*);
     void                        __clearTables();

     private:
     HashTable< Idx, MultiDimFunctionGraph< double >* > __actionsRMaxTable;
     HashTable< Idx, MultiDimFunctionGraph< double >* > __actionsBoolTable;
     const ILearningStrategy*                           __fmdpLearner;

     double __rThreshold;
     double __rmax;


     // ###################################################################
     // ###################################################################
     public:
     void checkState(const Instantiation& newState, Idx actionId) {
       if (!__initializedTable[actionId]) {
         __counterTable[actionId]->reset(newState);
         __initializedTable[actionId] = true;
       } else
         __counterTable[actionId]->incState(newState);
     }

     private:
     HashTable< Idx, StatesCounter* > __counterTable;
     HashTable< Idx, bool >           __initializedTable;

     bool __initialized;
   };

 } /* namespace gum */

 #endif   // GUM_ADAPTIVE_RMAX_PLANER_H
gum::AdaptiveRMaxPlaner::makePlanning
void makePlanning(Idx nbStep=1000000)
Performs a value iteration.
Definition: adaptiveRMaxPlaner.cpp:114

gum::AdaptiveRMaxPlaner::__counterTable
HashTable< Idx, StatesCounter *> __counterTable
Definition: adaptiveRMaxPlaner.h:210

gum::AdaptiveRMaxPlaner::__actionsBoolTable
HashTable< Idx, MultiDimFunctionGraph< double > *> __actionsBoolTable
Definition: adaptiveRMaxPlaner.h:189

gum::StructuredPlaner
<agrum/FMDP/planning/structuredPlaner.h>
Definition: structuredPlaner.h:70

gum::AdaptiveRMaxPlaner::~AdaptiveRMaxPlaner
~AdaptiveRMaxPlaner()
Default destructor.
Definition: adaptiveRMaxPlaner.cpp:76

gum::AdaptiveRMaxPlaner::_valueIteration
virtual MultiDimFunctionGraph< double > * _valueIteration()
Performs a single step of value iteration.
Definition: adaptiveRMaxPlaner.cpp:146

statesCounter.h
Copyright 2005-2019 Pierre-Henri WUILLEMIN et Christophe GONZALES (LIP6) {prenom.nom}_at_lip6.fr.

gum::IDecisionStrategy
<agrum/FMDP/SDyna/IDecisionStrategy.h>
Definition: IDecisionStrategy.h:51

gum::AdaptiveRMaxPlaner::ReducedAndOrderedInstance
static AdaptiveRMaxPlaner * ReducedAndOrderedInstance(const ILearningStrategy *learner, double discountFactor=0.9, double epsilon=0.00001, bool verbose=true)
Definition: adaptiveRMaxPlaner.h:65

gum::AdaptiveRMaxPlaner::__visitLearner
std::pair< NodeId, NodeId > __visitLearner(const IVisitableGraphLearner *, NodeId currentNodeId, MultiDimFunctionGraph< double > *, MultiDimFunctionGraph< double > *)
Definition: adaptiveRMaxPlaner.cpp:309

gum::IOperatorStrategy< double >

gum::IVisitableGraphLearner
<agrum/FMDP/SDyna/IVisitableGraphLearner.h>
Definition: IVisitableGraphLearner.h:53

gum::AdaptiveRMaxPlaner::__clearTables
void __clearTables()
Definition: adaptiveRMaxPlaner.cpp:345

gum::AdaptiveRMaxPlaner::__fmdpLearner
const ILearningStrategy * __fmdpLearner
Definition: adaptiveRMaxPlaner.h:190

gum::AdaptiveRMaxPlaner::AdaptiveRMaxPlaner
AdaptiveRMaxPlaner(IOperatorStrategy< double > *opi, double discountFactor, double epsilon, const ILearningStrategy *learner, bool verbose)
Default constructor.
Definition: adaptiveRMaxPlaner.cpp:63

gum::FMDP< double >

gum::MDDOperatorStrategy
<agrum/FMDP/planning/mddOperatorStrategy.h>
Definition: mddOperatorStrategy.h:50

gum
Copyright 2005-2019 Pierre-Henri WUILLEMIN et Christophe GONZALES (LIP6) {prenom.nom}_at_lip6.fr.
Definition: agrum.h:25

gum::HashTable
The class for generic Hash Tables.
Definition: hashTable.h:679

gum::AdaptiveRMaxPlaner::__initializedTable
HashTable< Idx, bool > __initializedTable
Definition: adaptiveRMaxPlaner.h:211

structuredPlaner.h
Copyright 2005-2019 Pierre-Henri WUILLEMIN et Christophe GONZALES (LIP6) {prenom.nom}_at_lip6.fr.

IDecisionStrategy.h
Copyright 2005-2019 Pierre-Henri WUILLEMIN et Christophe GONZALES (LIP6) {prenom.nom}_at_lip6.fr.

fmdp.h
Copyright 2005-2019 Pierre-Henri WUILLEMIN et Christophe GONZALES (LIP6) {prenom.nom}_at_lip6.fr.

gum::ILearningStrategy
<agrum/FMDP/SDyna/ILearningStrategy.h>
Definition: ILearningStrategy.h:55

gum::AdaptiveRMaxPlaner::__makeRMaxFunctionGraphs
void __makeRMaxFunctionGraphs()
Definition: adaptiveRMaxPlaner.cpp:238

gum::TreeOperatorStrategy
<agrum/FMDP/planning/treeOperatorStrategy.h>
Definition: treeOperatorStrategy.h:50

gum::AdaptiveRMaxPlaner::__actionsRMaxTable
HashTable< Idx, MultiDimFunctionGraph< double > *> __actionsRMaxTable
Definition: adaptiveRMaxPlaner.h:188

gum::AdaptiveRMaxPlaner::TreeInstance
static AdaptiveRMaxPlaner * TreeInstance(const ILearningStrategy *learner, double discountFactor=0.9, double epsilon=0.00001, bool verbose=true)
Definition: adaptiveRMaxPlaner.h:79

gum::MultiDimFunctionGraph< double >

gum::AdaptiveRMaxPlaner::__rThreshold
double __rThreshold
Definition: adaptiveRMaxPlaner.h:192

gum::Instantiation
Class for assigning/browsing values to tuples of discrete variables.
Definition: instantiation.h:83

gum::AdaptiveRMaxPlaner
<agrum/FMDP/planning/adaptiveRMaxPlaner.h>
Definition: adaptiveRMaxPlaner.h:53

gum::AdaptiveRMaxPlaner::initialize
void initialize(const FMDP< double > *fmdp)
Initializes data structure needed for making the planning.
Definition: adaptiveRMaxPlaner.cpp:97

gum::StructuredPlaner< double >::fmdp
INLINE const FMDP< double > * fmdp()
Returns a const ptr on the Factored Markov Decision Process on which we&#39;re planning.
Definition: structuredPlaner.h:137

gum::AdaptiveRMaxPlaner::__rmax
double __rmax
Definition: adaptiveRMaxPlaner.h:193

gum::AdaptiveRMaxPlaner::_initVFunction
virtual void _initVFunction()
Performs a single step of value iteration.
Definition: adaptiveRMaxPlaner.cpp:133

gum::Idx
Size Idx
Type for indexes.
Definition: types.h:53

gum::AdaptiveRMaxPlaner::checkState
void checkState(const Instantiation &newState, Idx actionId)
Definition: adaptiveRMaxPlaner.h:201

fmdpLearner.h
Copyright 2005-2019 Pierre-Henri WUILLEMIN et Christophe GONZALES (LIP6) {prenom.nom}_at_lip6.fr.

gum::NodeId
Size NodeId
Type for node ids.
Definition: graphElements.h:98

gum::AdaptiveRMaxPlaner::__initialized
bool __initialized
Definition: adaptiveRMaxPlaner.h:213

gum::AdaptiveRMaxPlaner::_evalPolicy
virtual void _evalPolicy()
Perform the required tasks to extract an optimal policy.
Definition: adaptiveRMaxPlaner.cpp:194