dd/d00/fmdpLearner__tpl_8h_source.html

 /***************************************************************************
  *  Copyright (C) 2005 by Christophe GONZALES and Pierre-Henri WUILLEMIN   *
  *  {prenom.nom}_at_lip6.fr                                                *
  *                                                                         *
  *  This program is free software; you can redistribute it and/or modify   *
  *  it under the terms of the GNU General Public License as published by   *
  *  the Free Software Foundation; either version 2 of the License, or      *
  *  (at your option) any later version.                                    *
  *                                                                         *
  *  This program is distributed in the hope that it will be useful,        *
  *  but WITHOUT ANY WARRANTY; without even the implied warranty of         *
  *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the           *
  *  GNU General Public License for more details.                           *
  *                                                                         *
  *  You should have received a copy of the GNU General Public License      *
  *  along with this program; if not, write to the                          *
  *  Free Software Foundation, Inc.,                                        *
  *  59 Temple Place - Suite 330, Boston, MA 02111-1307, USA.               *
  ***************************************************************************/
 // =========================================================================
 #include <agrum/FMDP/learning/fmdpLearner.h>
 // =========================================================================

 namespace gum {

   // ==========================================================================
   // Constructor & destructor.
   // ==========================================================================

   // ###################################################################
   // Default constructor
   // ###################################################################
   template < TESTNAME    VariableAttributeSelection,
              TESTNAME    RewardAttributeSelection,
              LEARNERNAME LearnerSelection >
   FMDPLearner< VariableAttributeSelection,
                RewardAttributeSelection,
                LearnerSelection >::FMDPLearner(double lT,
                                                bool   actionReward,
                                                double sT) :
       __actionReward(actionReward),
       __learningThreshold(lT), __similarityThreshold(sT) {
     GUM_CONSTRUCTOR(FMDPLearner);
     __rewardLearner = nullptr;
   }


   // ###################################################################
   // Default destructor
   // ###################################################################
   template < TESTNAME    VariableAttributeSelection,
              TESTNAME    RewardAttributeSelection,
              LEARNERNAME LearnerSelection >
   FMDPLearner< VariableAttributeSelection,
                RewardAttributeSelection,
                LearnerSelection >::~FMDPLearner() {
     for (auto actionIter = __actionLearners.beginSafe();
          actionIter != __actionLearners.endSafe();
          ++actionIter) {
       for (auto learnerIter = actionIter.val()->beginSafe();
            learnerIter != actionIter.val()->endSafe();
            ++learnerIter)
         delete learnerIter.val();
       delete actionIter.val();
       if (__actionRewardLearners.exists(actionIter.key()))
         delete __actionRewardLearners[actionIter.key()];
     }

     if (__rewardLearner) delete __rewardLearner;

     GUM_DESTRUCTOR(FMDPLearner);
   }


   // ==========================================================================
   //
   // ==========================================================================

   // ###################################################################
   //
   // ###################################################################
   template < TESTNAME    VariableAttributeSelection,
              TESTNAME    RewardAttributeSelection,
              LEARNERNAME LearnerSelection >
   void FMDPLearner< VariableAttributeSelection,
                     RewardAttributeSelection,
                     LearnerSelection >::initialize(FMDP< double >* fmdp) {
     __fmdp = fmdp;

     __modaMax = 0;
     __rmax = 0.0;

     Set< const DiscreteVariable* > mainVariables;
     for (auto varIter = __fmdp->beginVariables();
          varIter != __fmdp->endVariables();
          ++varIter) {
       mainVariables.insert(*varIter);
       __modaMax = __modaMax < (*varIter)->domainSize() ? (*varIter)->domainSize()
                                                        : __modaMax;
     }

     for (auto actionIter = __fmdp->beginActions();
          actionIter != __fmdp->endActions();
          ++actionIter) {
       // Adding a Hashtable for the action
       __actionLearners.insert(*actionIter, new VarLearnerTable());

       // Adding a learner for each variable
       for (auto varIter = __fmdp->beginVariables();
            varIter != __fmdp->endVariables();
            ++varIter) {
         MultiDimFunctionGraph< double >* varTrans = __instantiateFunctionGraph();
         varTrans->setTableName("ACTION : " + __fmdp->actionName(*actionIter)
                                + " - VARIABLE : " + (*varIter)->name());
         __fmdp->addTransitionForAction(*actionIter, *varIter, varTrans);
         __actionLearners[*actionIter]->insert(
            (*varIter),
            __instantiateVarLearner(
               varTrans, mainVariables, __fmdp->main2prime(*varIter)));
       }

       if (__actionReward) {
         MultiDimFunctionGraph< double >* reward = __instantiateFunctionGraph();
         reward->setTableName("REWARD - ACTION : "
                              + __fmdp->actionName(*actionIter));
         __fmdp->addRewardForAction(*actionIter, reward);
         __actionRewardLearners.insert(
            *actionIter, __instantiateRewardLearner(reward, mainVariables));
       }
     }

     if (!__actionReward) {
       MultiDimFunctionGraph< double >* reward = __instantiateFunctionGraph();
       reward->setTableName("REWARD");
       __fmdp->addReward(reward);
       __rewardLearner = __instantiateRewardLearner(reward, mainVariables);
     }
   }

   // ###################################################################
   //
   // ###################################################################
   template < TESTNAME    VariableAttributeSelection,
              TESTNAME    RewardAttributeSelection,
              LEARNERNAME LearnerSelection >
   bool FMDPLearner< VariableAttributeSelection,
                     RewardAttributeSelection,
                     LearnerSelection >::addObservation(Idx                actionId,
                                                        const Observation* newObs) {
     for (SequenceIteratorSafe< const DiscreteVariable* > varIter =
             __fmdp->beginVariables();
          varIter != __fmdp->endVariables();
          ++varIter) {
       __actionLearners[actionId]
          ->getWithDefault(*varIter, nullptr)
          ->addObservation(newObs);
       __actionLearners[actionId]->getWithDefault(*varIter, nullptr)->updateGraph();
     }

     if (__actionReward) {
       __actionRewardLearners[actionId]->addObservation(newObs);
       __actionRewardLearners[actionId]->updateGraph();
     } else {
       __rewardLearner->addObservation(newObs);
       __rewardLearner->updateGraph();
     }

     __rmax =
        __rmax < std::abs(newObs->reward()) ? std::abs(newObs->reward()) : __rmax;

     return false;
   }

   // ###################################################################
   //
   // ###################################################################
   template < TESTNAME    VariableAttributeSelection,
              TESTNAME    RewardAttributeSelection,
              LEARNERNAME LearnerSelection >
   Size FMDPLearner< VariableAttributeSelection,
                     RewardAttributeSelection,
                     LearnerSelection >::size() {
     Size s = 0;
     for (SequenceIteratorSafe< Idx > actionIter = __fmdp->beginActions();
          actionIter != __fmdp->endActions();
          ++actionIter) {
       for (SequenceIteratorSafe< const DiscreteVariable* > varIter =
               __fmdp->beginVariables();
            varIter != __fmdp->endVariables();
            ++varIter)
         s += __actionLearners[*actionIter]
                 ->getWithDefault(*varIter, nullptr)
                 ->size();
       if (__actionReward) s += __actionRewardLearners[*actionIter]->size();
     }

     if (!__actionReward) s += __rewardLearner->size();

     return s;
   }


   // ###################################################################
   //
   // ###################################################################
   template < TESTNAME    VariableAttributeSelection,
              TESTNAME    RewardAttributeSelection,
              LEARNERNAME LearnerSelection >
   void FMDPLearner< VariableAttributeSelection,
                     RewardAttributeSelection,
                     LearnerSelection >::updateFMDP() {
     for (SequenceIteratorSafe< Idx > actionIter = __fmdp->beginActions();
          actionIter != __fmdp->endActions();
          ++actionIter) {
       for (SequenceIteratorSafe< const DiscreteVariable* > varIter =
               __fmdp->beginVariables();
            varIter != __fmdp->endVariables();
            ++varIter)
         __actionLearners[*actionIter]
            ->getWithDefault(*varIter, nullptr)
            ->updateFunctionGraph();
       if (__actionReward)
         __actionRewardLearners[*actionIter]->updateFunctionGraph();
     }

     if (!__actionReward) __rewardLearner->updateFunctionGraph();
   }
 }   // End of namespace gum
gum::SequenceIteratorSafe
Safe iterators for Sequence.
Definition: sequence.h:1203

gum::FMDPLearner::__instantiateFunctionGraph
MultiDimFunctionGraph< double > * __instantiateFunctionGraph()
Initializes the learner.
Definition: fmdpLearner.h:105

gum::FMDPLearner::initialize
void initialize(FMDP< double > *fmdp)
Initializes the learner.
Definition: fmdpLearner_tpl.h:94

gum::FMDPLearner::__actionReward
bool __actionReward
Definition: fmdpLearner.h:251

gum::FMDP::beginActions
SequenceIteratorSafe< Idx > beginActions() const
Returns an iterator reference to he beginning of the list of actions.
Definition: fmdp.h:134

gum::FMDP::addReward
void addReward(const MultiDimImplementation< GUM_SCALAR > *reward)
Adds a default variable reward.
Definition: fmdp.h:225

gum::FMDP::actionName
const std::string & actionName(Idx actionId) const
Returns name of action given in parameter.
Definition: fmdp_tpl.h:344

gum::FMDPLearner::__actionLearners
HashTable< Idx, VarLearnerTable *> __actionLearners
Definition: fmdpLearner.h:249

gum::FMDP::beginVariables
SequenceIteratorSafe< const DiscreteVariable *> beginVariables() const
Returns an iterator reference to he beginning of the list of variables.
Definition: fmdp.h:92

gum::FMDP< double >

gum
gum is the global namespace for all aGrUM entities
Definition: agrum.h:25

gum::FMDPLearner::~FMDPLearner
~FMDPLearner()
Default destructor.
Definition: fmdpLearner_tpl.h:63

gum::FMDPLearner::addObservation
bool addObservation(Idx actionId, const Observation *obs)
Gives to the learner a new transition.
Definition: fmdpLearner_tpl.h:155

gum::LEARNERNAME
LEARNERNAME
Definition: templateStrategy.h:60

gum::FMDPLearner::__rmax
double __rmax
learnerSize
Definition: fmdpLearner.h:234

gum::FMDPLearner::__fmdp
FMDP< double > * __fmdp
The FMDP to store the learned model.
Definition: fmdpLearner.h:247

gum::Observation
Definition: observation.h:50

gum::FMDPLearner::__instantiateRewardLearner
RewardLearnerType * __instantiateRewardLearner(MultiDimFunctionGraph< double > *target, Set< const DiscreteVariable * > &mainVariables)
Initializes the learner.
Definition: fmdpLearner.h:159

gum::Set
Representation of a setA Set is a structure that contains arbitrary elements.
Definition: set.h:162

gum::FMDPLearner::size
Size size()
learnerSize
Definition: fmdpLearner_tpl.h:189

gum::FMDPLearner::VarLearnerTable
HashTable< const DiscreteVariable *, VariableLearnerType *> VarLearnerTable
Definition: fmdpLearner.h:70

gum::FMDP::addTransitionForAction
void addTransitionForAction(Idx actionId, const DiscreteVariable *var, const MultiDimImplementation< GUM_SCALAR > *transition)
Adds a variable transition table to specified action.
Definition: fmdp_tpl.h:195

gum::Observation::reward
double reward() const
Returns the modality assumed by the given variable in this observation.
Definition: observation.h:116

gum::FMDPLearner::__actionRewardLearners
HashTable< Idx, RewardLearnerType *> __actionRewardLearners
Definition: fmdpLearner.h:252

gum::TESTNAME
TESTNAME
Definition: templateStrategy.h:37

gum::FMDPLearner
Definition: fmdpLearner.h:57

gum::FMDP::addRewardForAction
void addRewardForAction(Idx actionId, const MultiDimImplementation< GUM_SCALAR > *reward)
Adds a default variable reward.
Definition: fmdp_tpl.h:299

gum::FMDP::main2prime
const DiscreteVariable * main2prime(const DiscreteVariable *mainVar) const
Returns the primed variable associate to the given main variable.
Definition: fmdp.h:106

gum::MultiDimFunctionGraph< double >

gum::FMDPLearner::updateFMDP
void updateFMDP()
Starts an update of datastructure in the associated FMDP.
Definition: fmdpLearner_tpl.h:218

gum::FMDP::endActions
SequenceIteratorSafe< Idx > endActions() const
Returns an iterator reference to the end of the list of actions.
Definition: fmdp.h:141

gum::FMDPLearner::__instantiateVarLearner
VariableLearnerType * __instantiateVarLearner(MultiDimFunctionGraph< double > *target, Set< const DiscreteVariable * > &mainVariables, const DiscreteVariable *learnedVar)
Initializes the learner.
Definition: fmdpLearner.h:126

gum::Idx
Size Idx
Type for indexes.
Definition: types.h:50

gum::FMDPLearner::__modaMax
double __modaMax
learnerSize
Definition: fmdpLearner.h:240

gum::FMDP::endVariables
SequenceIteratorSafe< const DiscreteVariable *> endVariables() const
Returns an iterator reference to the end of the list of variables.
Definition: fmdp.h:99

gum::Size
std::size_t Size
In aGrUM, hashed values are unsigned long int.
Definition: types.h:45

gum::FMDPLearner::__rewardLearner
RewardLearnerType * __rewardLearner
Definition: fmdpLearner.h:253

gum::MultiDimFunctionGraph::setTableName
void setTableName(const std::string &name)
Sets the name of the table represented by this structure.
Definition: multiDimFunctionGraph_tpl.h:621

fmdpLearner.h
Headers of the FMDPLearner class.

gum::Set::insert
void insert(const Key &k)
Inserts a new element into the set.
Definition: set_tpl.h:610