#include <agrum/FMDP/learning/fmdpLearner.h>

Inheritance diagram for gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >:

Collaboration diagram for gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >:

Public Member Functions
Constructor & destructor.
	FMDPLearner (double learningThreshold, bool actionReward, double similarityThreshold=0.05)
	Default constructor. More...

	~FMDPLearner ()
	Default destructor. More...

Initialization
void	initialize (FMDP< double > *fmdp)
	Initializes the learner. More...

MultiDimFunctionGraph< double > *	__instantiateFunctionGraph ()
	Initializes the learner. More...

MultiDimFunctionGraph< double > *	__instantiateFunctionGraph (Int2Type< IMDDILEARNER >)
	Initializes the learner. More...

MultiDimFunctionGraph< double > *	__instantiateFunctionGraph (Int2Type< ITILEARNER >)
	Initializes the learner. More...

VariableLearnerType *	__instantiateVarLearner (MultiDimFunctionGraph< double > target, Set< const DiscreteVariable > &mainVariables, const DiscreteVariable *learnedVar)
	Initializes the learner. More...

VariableLearnerType *	__instantiateVarLearner (MultiDimFunctionGraph< double > target, Set< const DiscreteVariable > &mainVariables, const DiscreteVariable *learnedVar, Int2Type< IMDDILEARNER >)
	Initializes the learner. More...

VariableLearnerType *	__instantiateVarLearner (MultiDimFunctionGraph< double > target, Set< const DiscreteVariable > &mainVariables, const DiscreteVariable *learnedVar, Int2Type< ITILEARNER >)
	Initializes the learner. More...

RewardLearnerType *	__instantiateRewardLearner (MultiDimFunctionGraph< double > target, Set< const DiscreteVariable > &mainVariables)
	Initializes the learner. More...

RewardLearnerType *	__instantiateRewardLearner (MultiDimFunctionGraph< double > target, Set< const DiscreteVariable > &mainVariables, Int2Type< IMDDILEARNER >)
	Initializes the learner. More...

RewardLearnerType *	__instantiateRewardLearner (MultiDimFunctionGraph< double > target, Set< const DiscreteVariable > &mainVariables, Int2Type< ITILEARNER >)
	Initializes the learner. More...

Incremental methods
bool	addObservation (Idx actionId, const Observation *obs)
	Gives to the learner a new transition. More...

void	updateFMDP ()
	Starts an update of datastructure in the associated FMDP. More...

Miscelleanous methods
double	__rmax
	learnerSize More...

double	__modaMax
	learnerSize More...

Size	size ()
	learnerSize More...

const IVisitableGraphLearner *	varLearner (Idx actionId, const DiscreteVariable *var) const
	extractCount More...

virtual double	rMax () const
	learnerSize More...

virtual double	modaMax () const
	learnerSize More...

Detailed Description

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>
class gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >

Definition at line 57 of file fmdpLearner.h.

Member Typedef Documentation

◆ RewardLearnerType

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

typedef LearnerSelect< LearnerSelection, IMDDI< RewardAttributeSelection, true >, ITI< RewardAttributeSelection, true > >::type gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::RewardLearnerType

private

Definition at line 67 of file fmdpLearner.h.

◆ VariableLearnerType

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

typedef LearnerSelect< LearnerSelection, IMDDI< VariableAttributeSelection, false >, ITI< VariableAttributeSelection, false > >::type gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::VariableLearnerType

private

Definition at line 62 of file fmdpLearner.h.

◆ VarLearnerTable

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

typedef HashTable< const DiscreteVariable*, VariableLearnerType* > gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::VarLearnerTable

private

Definition at line 70 of file fmdpLearner.h.

Constructor & Destructor Documentation

◆ FMDPLearner()

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::FMDPLearner	(	double	learningThreshold,
		bool	actionReward,
		double	similarityThreshold = `0.05`
	)

Default constructor.

Definition at line 45 of file fmdpLearner_tpl.h.

References gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__rewardLearner.

                                                           :
       __actionReward(actionReward),
       __learningThreshold(lT), __similarityThreshold(sT) {
     GUM_CONSTRUCTOR(FMDPLearner);
     __rewardLearner = nullptr;
   }

◆ ~FMDPLearner()

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::~FMDPLearner ( )

Default destructor.

Definition at line 63 of file fmdpLearner_tpl.h.

References gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionLearners, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionRewardLearners, and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__rewardLearner.

                                                 {
     for (auto actionIter = __actionLearners.beginSafe();
          actionIter != __actionLearners.endSafe();
          ++actionIter) {
       for (auto learnerIter = actionIter.val()->beginSafe();
            learnerIter != actionIter.val()->endSafe();
            ++learnerIter)
         delete learnerIter.val();
       delete actionIter.val();
       if (__actionRewardLearners.exists(actionIter.key()))
         delete __actionRewardLearners[actionIter.key()];
     }
 
     if (__rewardLearner) delete __rewardLearner;
 
     GUM_DESTRUCTOR(FMDPLearner);
   }

Member Function Documentation

◆ __instantiateFunctionGraph() [1/3]

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

MultiDimFunctionGraph< double >* gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateFunctionGraph ( )

inline

Initializes the learner.

Definition at line 105 of file fmdpLearner.h.

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::initialize().

                                                                   {
       return __instantiateFunctionGraph(Int2Type< LearnerSelection >());
     }

Here is the caller graph for this function:

◆ __instantiateFunctionGraph() [2/3]

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

MultiDimFunctionGraph< double >* gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateFunctionGraph ( Int2Type< IMDDILEARNER > )

inline

Initializes the learner.

Definition at line 110 of file fmdpLearner.h.

References gum::MultiDimFunctionGraph< GUM_SCALAR, TerminalNodePolicy >::getReducedAndOrderedInstance().

                                                             {
       return MultiDimFunctionGraph< double, ExactTerminalNodePolicy >::
          getReducedAndOrderedInstance();
     }

Here is the call graph for this function:

◆ __instantiateFunctionGraph() [3/3]

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

MultiDimFunctionGraph< double >* gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateFunctionGraph ( Int2Type< ITILEARNER > )

inline

Initializes the learner.

Definition at line 116 of file fmdpLearner.h.

                                                           {
       return MultiDimFunctionGraph< double,
                                     ExactTerminalNodePolicy >::getTreeInstance();
     }

◆ __instantiateRewardLearner() [1/3]

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

RewardLearnerType* gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateRewardLearner	(	MultiDimFunctionGraph< double > *	target,
		Set< const DiscreteVariable * > &	mainVariables
	)

inline

Initializes the learner.

Definition at line 159 of file fmdpLearner.h.

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::initialize().

                                                                                   {
       return __instantiateRewardLearner(
          target, mainVariables, Int2Type< LearnerSelection >());
     }

Here is the caller graph for this function:

◆ __instantiateRewardLearner() [2/3]

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

RewardLearnerType* gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateRewardLearner	(	MultiDimFunctionGraph< double > *	target,
		Set< const DiscreteVariable * > &	mainVariables,
		Int2Type< IMDDILEARNER >
	)

inline

Initializes the learner.

Definition at line 166 of file fmdpLearner.h.

References gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__learningThreshold, and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__similarityThreshold.

                                                             {
       return new RewardLearnerType(
          target, __learningThreshold, __similarityThreshold, mainVariables);
     }

◆ __instantiateRewardLearner() [3/3]

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

RewardLearnerType* gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateRewardLearner	(	MultiDimFunctionGraph< double > *	target,
		Set< const DiscreteVariable * > &	mainVariables,
		Int2Type< ITILEARNER >
	)

inline

Initializes the learner.

Definition at line 174 of file fmdpLearner.h.

References gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__learningThreshold, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::addObservation(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::size(), and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::updateFMDP().

                                                           {
       return new RewardLearnerType(target, __learningThreshold, mainVariables);
     }

Here is the call graph for this function:

◆ __instantiateVarLearner() [1/3]

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

VariableLearnerType* gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateVarLearner	(	MultiDimFunctionGraph< double > *	target,
		Set< const DiscreteVariable * > &	mainVariables,
		const DiscreteVariable *	learnedVar
	)

inline

Initializes the learner.

Definition at line 126 of file fmdpLearner.h.

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::initialize().

                                                                             {
       return __instantiateVarLearner(
          target, mainVariables, learnedVar, Int2Type< LearnerSelection >());
     }

Here is the caller graph for this function:

◆ __instantiateVarLearner() [2/3]

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

VariableLearnerType* gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateVarLearner	(	MultiDimFunctionGraph< double > *	target,
		Set< const DiscreteVariable * > &	mainVariables,
		const DiscreteVariable *	learnedVar,
		Int2Type< IMDDILEARNER >
	)

inline

Initializes the learner.

Definition at line 134 of file fmdpLearner.h.

References gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__learningThreshold, and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__similarityThreshold.

                                                          {
       return new VariableLearnerType(target,
                                      __learningThreshold,
                                      __similarityThreshold,
                                      mainVariables,
                                      learnedVar);
     }

◆ __instantiateVarLearner() [3/3]

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

VariableLearnerType* gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateVarLearner	(	MultiDimFunctionGraph< double > *	target,
		Set< const DiscreteVariable * > &	mainVariables,
		const DiscreteVariable *	learnedVar,
		Int2Type< ITILEARNER >
	)

inline

Initializes the learner.

Definition at line 146 of file fmdpLearner.h.

References gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__learningThreshold.

                                                        {
       return new VariableLearnerType(
          target, __learningThreshold, mainVariables, learnedVar);
     }

◆ addObservation()

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

bool gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::addObservation	(	Idx	actionId,
		const Observation *	obs
	)

virtual

Gives to the learner a new transition.

Parameters

actionId	: the action on which the transition was made
obs	: the observed transition

Returns: true if learning this transition implies structural changes (can trigger a new planning)

Implements gum::ILearningStrategy.

Definition at line 155 of file fmdpLearner_tpl.h.

References gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionLearners, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionReward, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionRewardLearners, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__fmdp, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__rewardLearner, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__rmax, gum::FMDP< GUM_SCALAR >::beginVariables(), gum::FMDP< GUM_SCALAR >::endVariables(), and gum::Observation::reward().

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateRewardLearner().

                                                                                   {
     for (SequenceIteratorSafe< const DiscreteVariable* > varIter =
             __fmdp->beginVariables();
          varIter != __fmdp->endVariables();
          ++varIter) {
       __actionLearners[actionId]
          ->getWithDefault(*varIter, nullptr)
          ->addObservation(newObs);
       __actionLearners[actionId]->getWithDefault(*varIter, nullptr)->updateGraph();
     }
 
     if (__actionReward) {
       __actionRewardLearners[actionId]->addObservation(newObs);
       __actionRewardLearners[actionId]->updateGraph();
     } else {
       __rewardLearner->addObservation(newObs);
       __rewardLearner->updateGraph();
     }
 
     __rmax =
        __rmax < std::abs(newObs->reward()) ? std::abs(newObs->reward()) : __rmax;
 
     return false;
   }

Here is the call graph for this function:

Here is the caller graph for this function:

◆ initialize()

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

void gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::initialize ( FMDP< double > * fmdp )

virtual

Initializes the learner.

Implements gum::ILearningStrategy.

Definition at line 94 of file fmdpLearner_tpl.h.

                                                                        {
     __fmdp = fmdp;
 
     __modaMax = 0;
     __rmax = 0.0;
 
     Set< const DiscreteVariable* > mainVariables;
     for (auto varIter = __fmdp->beginVariables();
          varIter != __fmdp->endVariables();
          ++varIter) {
       mainVariables.insert(*varIter);
       __modaMax = __modaMax < (*varIter)->domainSize() ? (*varIter)->domainSize()
                                                        : __modaMax;
     }
 
     for (auto actionIter = __fmdp->beginActions();
          actionIter != __fmdp->endActions();
          ++actionIter) {
       // Adding a Hashtable for the action
       __actionLearners.insert(*actionIter, new VarLearnerTable());
 
       // Adding a learner for each variable
       for (auto varIter = __fmdp->beginVariables();
            varIter != __fmdp->endVariables();
            ++varIter) {
         MultiDimFunctionGraph< double >* varTrans = __instantiateFunctionGraph();
         varTrans->setTableName("ACTION : " + __fmdp->actionName(*actionIter)
                                + " - VARIABLE : " + (*varIter)->name());
         __fmdp->addTransitionForAction(*actionIter, *varIter, varTrans);
         __actionLearners[*actionIter]->insert(
            (*varIter),
            __instantiateVarLearner(
               varTrans, mainVariables, __fmdp->main2prime(*varIter)));
       }
 
       if (__actionReward) {
         MultiDimFunctionGraph< double >* reward = __instantiateFunctionGraph();
         reward->setTableName("REWARD - ACTION : "
                              + __fmdp->actionName(*actionIter));
         __fmdp->addRewardForAction(*actionIter, reward);
         __actionRewardLearners.insert(
            *actionIter, __instantiateRewardLearner(reward, mainVariables));
       }
     }
 
     if (!__actionReward) {
       MultiDimFunctionGraph< double >* reward = __instantiateFunctionGraph();
       reward->setTableName("REWARD");
       __fmdp->addReward(reward);
       __rewardLearner = __instantiateRewardLearner(reward, mainVariables);
     }
   }

Here is the call graph for this function:

◆ modaMax()

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

virtual double gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::modaMax ( ) const

inlinevirtual

learnerSize

Returns

Implements gum::ILearningStrategy.

Definition at line 237 of file fmdpLearner.h.

References gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__modaMax.

237 { return __modaMax; }

gum::FMDPLearner::__modaMax

double __modaMax

learnerSize

Definition: fmdpLearner.h:240

◆ rMax()

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

virtual double gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::rMax ( ) const

inlinevirtual

learnerSize

Returns

Implements gum::ILearningStrategy.

Definition at line 231 of file fmdpLearner.h.

References gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__rmax.

231 { return __rmax; }

gum::FMDPLearner::__rmax

double __rmax

learnerSize

Definition: fmdpLearner.h:234

◆ size()

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

Size gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::size ( )

virtual

learnerSize

Returns

Implements gum::ILearningStrategy.

Definition at line 189 of file fmdpLearner_tpl.h.

References gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionLearners, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionReward, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionRewardLearners, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__fmdp, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__rewardLearner, gum::FMDP< GUM_SCALAR >::beginActions(), gum::FMDP< GUM_SCALAR >::beginVariables(), gum::FMDP< GUM_SCALAR >::endActions(), and gum::FMDP< GUM_SCALAR >::endVariables().

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateRewardLearner().

                                              {
     Size s = 0;
     for (SequenceIteratorSafe< Idx > actionIter = __fmdp->beginActions();
          actionIter != __fmdp->endActions();
          ++actionIter) {
       for (SequenceIteratorSafe< const DiscreteVariable* > varIter =
               __fmdp->beginVariables();
            varIter != __fmdp->endVariables();
            ++varIter)
         s += __actionLearners[*actionIter]
                 ->getWithDefault(*varIter, nullptr)
                 ->size();
       if (__actionReward) s += __actionRewardLearners[*actionIter]->size();
     }
 
     if (!__actionReward) s += __rewardLearner->size();
 
     return s;
   }

Here is the call graph for this function:

Here is the caller graph for this function:

◆ updateFMDP()

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

void gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::updateFMDP ( )

virtual

Starts an update of datastructure in the associated FMDP.

Implements gum::ILearningStrategy.

Definition at line 218 of file fmdpLearner_tpl.h.

References gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionLearners, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionReward, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionRewardLearners, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__fmdp, gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__rewardLearner, gum::FMDP< GUM_SCALAR >::beginActions(), gum::FMDP< GUM_SCALAR >::beginVariables(), gum::FMDP< GUM_SCALAR >::endActions(), and gum::FMDP< GUM_SCALAR >::endVariables().

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateRewardLearner().

                                                    {
     for (SequenceIteratorSafe< Idx > actionIter = __fmdp->beginActions();
          actionIter != __fmdp->endActions();
          ++actionIter) {
       for (SequenceIteratorSafe< const DiscreteVariable* > varIter =
               __fmdp->beginVariables();
            varIter != __fmdp->endVariables();
            ++varIter)
         __actionLearners[*actionIter]
            ->getWithDefault(*varIter, nullptr)
            ->updateFunctionGraph();
       if (__actionReward)
         __actionRewardLearners[*actionIter]->updateFunctionGraph();
     }
 
     if (!__actionReward) __rewardLearner->updateFunctionGraph();
   }

Here is the call graph for this function:

Here is the caller graph for this function:

◆ varLearner()

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

const IVisitableGraphLearner* gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::varLearner	(	Idx	actionId,
		const DiscreteVariable *	var
	)		const

inlinevirtual

extractCount

Implements gum::ILearningStrategy.

Definition at line 226 of file fmdpLearner.h.

References gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionLearners.

                                                                                 {
       return __actionLearners[actionId]->getWithDefault(var, nullptr);
     }

Member Data Documentation

◆ __actionLearners

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

HashTable< Idx, VarLearnerTable* > gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionLearners

private

Definition at line 249 of file fmdpLearner.h.

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::addObservation(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::initialize(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::size(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::updateFMDP(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::varLearner(), and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::~FMDPLearner().

◆ __actionReward

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

bool gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionReward

private

Definition at line 251 of file fmdpLearner.h.

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::addObservation(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::initialize(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::size(), and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::updateFMDP().

◆ __actionRewardLearners

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

HashTable< Idx, RewardLearnerType* > gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__actionRewardLearners

private

Definition at line 252 of file fmdpLearner.h.

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::addObservation(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::initialize(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::size(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::updateFMDP(), and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::~FMDPLearner().

◆ __fmdp

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

FMDP< double >* gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__fmdp

private

The FMDP to store the learned model.

Definition at line 247 of file fmdpLearner.h.

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::addObservation(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::initialize(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::size(), and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::updateFMDP().

◆ __learningThreshold

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

const double gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__learningThreshold

private

Definition at line 255 of file fmdpLearner.h.

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateRewardLearner(), and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateVarLearner().

◆ __modaMax

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

double gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__modaMax

private

learnerSize

Returns

Definition at line 240 of file fmdpLearner.h.

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::initialize(), and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::modaMax().

◆ __rewardLearner

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

RewardLearnerType* gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__rewardLearner

private

Definition at line 253 of file fmdpLearner.h.

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::addObservation(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::FMDPLearner(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::initialize(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::size(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::updateFMDP(), and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::~FMDPLearner().

◆ __rmax

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

double gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__rmax

private

learnerSize

Returns

Definition at line 234 of file fmdpLearner.h.

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::addObservation(), gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::initialize(), and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::rMax().

◆ __similarityThreshold

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>

const double gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__similarityThreshold

private

Definition at line 256 of file fmdpLearner.h.

Referenced by gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateRewardLearner(), and gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >::__instantiateVarLearner().

The documentation for this class was generated from the following files:

agrum/FMDP/learning/fmdpLearner.h
agrum/FMDP/learning/fmdpLearner_tpl.h

Public Member Functions

Miscelleanous methods

Detailed Description

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection> class gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >

Member Typedef Documentation

◆ RewardLearnerType

◆ VariableLearnerType

◆ VarLearnerTable

Constructor & Destructor Documentation

◆ FMDPLearner()

◆ ~FMDPLearner()

Member Function Documentation

◆ __instantiateFunctionGraph() [1/3]

◆ __instantiateFunctionGraph() [2/3]

◆ __instantiateFunctionGraph() [3/3]

◆ __instantiateRewardLearner() [1/3]

◆ __instantiateRewardLearner() [2/3]

◆ __instantiateRewardLearner() [3/3]

◆ __instantiateVarLearner() [1/3]

◆ __instantiateVarLearner() [2/3]

◆ __instantiateVarLearner() [3/3]

◆ addObservation()

◆ initialize()

◆ modaMax()

◆ rMax()

◆ size()

◆ updateFMDP()

◆ varLearner()

Member Data Documentation

◆ __actionLearners

◆ __actionReward

◆ __actionRewardLearners

◆ __fmdp

◆ __learningThreshold

◆ __modaMax

◆ __rewardLearner

◆ __rmax

◆ __similarityThreshold

template<TESTNAME VariableAttributeSelection, TESTNAME RewardAttributeSelection, LEARNERNAME LearnerSelection>
class gum::FMDPLearner< VariableAttributeSelection, RewardAttributeSelection, LearnerSelection >