doxygen/visp-daily/tutorial-rbt-sequence_8cpp-example.html

#include <visp3/core/vpConfig.h>

#include <visp3/core/vpException.h>

#include <visp3/core/vpImageException.h>

#include <visp3/core/vpRGBa.h>


#include <visp3/io/vpVideoReader.h>

#include <visp3/io/vpVideoWriter.h>


#include <visp3/rbt/vpRBTracker.h>


#ifdef ENABLE_VISP_NAMESPACE

using namespace VISP_NAMESPACE_NAME;

#endif


#include "render-based-tutorial-utils.h"


struct CmdArguments

{

  CmdArguments() : startFrame(0), frameStep(1), stepByStep(false)

  {


  }


  void registerArguments(vpJsonArgumentParser &parser)

  {

    parser

      .addArgument("--color", colorSequence, true, "The color sequence (in video reader format, eg., /path/to/I\%04d.png)")

      .addArgument("--depth", depthFolder, false, "The depth images associated to the color sequence. Frames should be aligned")

      .addArgument("--start", startFrame, false, "The first frame of the sequence")

      .addArgument("--step", frameStep, false, "How many frames should be read between calls to the tracker")

      .addFlag("--step-by-step", stepByStep, "Go through the sequence interactively, frame by frame");

  }


  void postProcessArguments()

  {

    if (colorSequence.empty()) {

      throw vpException(vpException::badValue, "Input sequence should not be empty");

    }

  }


  std::string colorSequence;

  std::string depthFolder;

  unsigned int startFrame;

  unsigned int frameStep;

  bool stepByStep;

};


int main(int argc, const char **argv)

{

  vpRBTrackerTutorial::BaseArguments baseArgs;

  CmdArguments sequenceArgs;

  vpRBTrackerTutorial::vpRBExperimentLogger logger;

  vpRBTrackerTutorial::vpRBExperimentPlotter plotter;


  vpJsonArgumentParser parser("Tutorial showing how to use the Render-Based Tracker on an offline sequence", "--config", "/");

  baseArgs.registerArguments(parser);

  sequenceArgs.registerArguments(parser);

  logger.registerArguments(parser);

  plotter.registerArguments(parser);


  parser.parse(argc, argv);


  baseArgs.postProcessArguments();

  sequenceArgs.postProcessArguments();

  plotter.postProcessArguments(baseArgs.display);


  if (baseArgs.enableRenderProfiling) {

    vpRBTrackerTutorial::enableRendererProfiling();

  }


  baseArgs.display = true;

  // Get the option values


  logger.startLog();


  // Set tracking and rendering parameters

  vpCameraParameters cam;


  vpRBTracker tracker;

  tracker.loadConfigurationFile(baseArgs.trackerConfiguration);

  tracker.startTracking();

  cam = tracker.getCameraParameters();


  //VideoReader to read images from disk


  vpImage<vpRGBa> Icol;

  vpVideoReader readerRGB;

  readerRGB.setFileName(sequenceArgs.colorSequence);

  readerRGB.setFirstFrameIndex(sequenceArgs.startFrame);

  readerRGB.open(Icol);

  readerRGB.acquire(Icol);


  const int width = readerRGB.getWidth();

  const int height = readerRGB.getHeight();


  vpImage<unsigned char> Id(height, width);

  vpImage<float> depth(height, width);

  vpImage<unsigned char> depthDisplay(height, width);

  vpImage<float> IProba(height, width);

  vpImage<unsigned char> IProbaDisplay(height, width);

  vpImage<vpRGBa> IRender(height, width);

  vpImage<vpRGBa> InormDisplay(height, width);

  vpImage<unsigned char> ICannyDisplay(height, width);


  vpImageConvert::convert(Icol, Id);


  // Main window creation and displaying


  std::vector<std::shared_ptr<vpDisplay>> displays, debugDisplays;


  if (baseArgs.display) {

    displays = vpRBTrackerTutorial::createDisplays(Id, Icol, depthDisplay, IProbaDisplay);

    if (baseArgs.debugDisplay) {

      debugDisplays = vpDisplayFactory::makeDisplayGrid(

        1, 3,

        0, 0,

        20, 20,

        "Normals in object frame", InormDisplay,

        "Depth canny", ICannyDisplay,

        "Color render", IRender

      );

    }

    plotter.init(displays);

  }


  vpHomogeneousMatrix cMo;


  nlohmann::json result = nlohmann::json::array();


  // Manual initialization of the tracker

  std::cout << "Starting init" << std::endl;


  if (baseArgs.hasInlineInit()) {

    tracker.setPose(baseArgs.cMoInit);

  }

  else if (baseArgs.display) {

    tracker.initClick(Id, baseArgs.initFile, true);

  }

  else {

    throw vpException(vpException::notImplementedError, "Cannot initialize tracking: no auto init function provided");

  }


  if (baseArgs.display) {

    vpDisplay::flush(Id);

  }


  int im = sequenceArgs.startFrame;

  unsigned int iter = 1;

  // Main tracking loop

  double expStart = vpTime::measureTimeMs();


  while (true) {

    double frameStart = vpTime::measureTimeMs();

    // Acquire images

    for (unsigned int sp = 0; sp < sequenceArgs.frameStep; ++sp) {


      readerRGB.acquire(Icol);

      vpImageConvert::convert(Icol, Id);

      if (!sequenceArgs.depthFolder.empty()) {

        std::stringstream depthName;

        depthName << sequenceArgs.depthFolder << "/" << std::setfill('0') << std::setw(6) << im << ".npy";

        visp::cnpy::NpyArray npz_data = visp::cnpy::npy_load(depthName.str());

        vpImage<uint16_t> dataArray(npz_data.data<uint16_t>(), npz_data.shape[0], npz_data.shape[1], false);

        float scale = 9.999999747378752e-05;

        depth.resize(dataArray.getHeight(), dataArray.getWidth());

        depthDisplay.resize(dataArray.getHeight(), dataArray.getWidth());

#ifdef VISP_HAVE_OPENMP

#pragma omp parallel for

#endif

        for (unsigned int i = 0; i < dataArray.getSize(); ++i) {

          float value = static_cast<float>(dataArray.bitmap[i]) * scale;

          depth.bitmap[i] = value;

          depthDisplay.bitmap[i] = value > baseArgs.maxDepthDisplay ? 0.f : static_cast<unsigned char>((depth.bitmap[i] / baseArgs.maxDepthDisplay) * 255.f);

        }

      }

    }


    // Pose tracking

    double trackingStart = vpTime::measureTimeMs();

    if (depth.getSize() == 0) {

      tracker.track(Id, Icol);

    }

    else {

      tracker.track(Id, Icol, depth);

    }

    std::cout << "Tracking took " << vpTime::measureTimeMs() - trackingStart << "ms" << std::endl;


    if (baseArgs.display) {

      if (baseArgs.debugDisplay) {

        const vpRBFeatureTrackerInput &lastFrame = tracker.getMostRecentFrame();


        vpRBTrackerTutorial::displayNormals(lastFrame.renders.normals, InormDisplay);


        vpRBTrackerTutorial::displayCanny(lastFrame.renders.silhouetteCanny, ICannyDisplay, lastFrame.renders.isSilhouette);

        if (lastFrame.renders.color.getSize() > 0) {

          IRender = lastFrame.renders.color;

          vpDisplay::display(IRender);

          vpDisplay::flush(IRender);

        }

      }


      tracker.displayMask(IProbaDisplay);

      vpDisplay::display(IProbaDisplay);

      vpDisplay::flush(IProbaDisplay);

      vpDisplay::display(Id);

      vpDisplay::display(Icol);

      tracker.display(Id, Icol, depthDisplay);

      vpDisplay::displayFrame(Icol, cMo, cam, 0.05, vpColor::none, 2);


      vpDisplay::flush(Icol);

      vpDisplay::flush(Id);

      if (depth.getSize() > 0) {

        vpDisplay::display(depthDisplay);

        vpDisplay::flush(depthDisplay);

      }

    }


    tracker.getPose(cMo);

    result.push_back(cMo);


    logger.logFrame(tracker, iter, Id, Icol, depthDisplay, IProbaDisplay);


    if (sequenceArgs.stepByStep && baseArgs.display) {

      vpDisplay::getClick(Id, true);

    }


    std::cout << "Iter: " << iter << std::endl;

    ++im;

    ++iter;

    if (im > readerRGB.getLastFrameIndex()) {

      break;

    }


    double frameEnd = vpTime::measureTimeMs();

    std::cout << "Frame took: " << frameEnd - frameStart << "ms" << std::endl;

    plotter.plot(tracker, (frameEnd - expStart) / 1000.0);


  }


  logger.close();


  return EXIT_SUCCESS;

}

vpCameraParameters
Generic class defining intrinsic camera parameters.
Definition: vpCameraParameters.h:310

vpColor::none
static const vpColor none
Definition: vpColor.h:210

vpDisplay::getClick
static bool getClick(const vpImage< unsigned char > &I, bool blocking=true)
Definition: vpDisplay_uchar.cpp:855

vpDisplay::display
static void display(const vpImage< unsigned char > &I)
Definition: vpDisplay_uchar.cpp:830

vpDisplay::displayFrame
static void displayFrame(const vpImage< unsigned char > &I, const vpHomogeneousMatrix &cMo, const vpCameraParameters &cam, double size, const vpColor &color=vpColor::none, unsigned int thickness=1, const vpImagePoint &offset=vpImagePoint(0, 0), const std::string &frameName="", const vpColor &textColor=vpColor::black, const vpImagePoint &textOffset=vpImagePoint(15, 15))
Definition: vpDisplay_uchar.cpp:413

vpDisplay::flush
static void flush(const vpImage< unsigned char > &I)
Definition: vpDisplay_uchar.cpp:806

vpException
error that can be emitted by ViSP classes.
Definition: vpException.h:60

vpException::badValue
@ badValue
Used to indicate that a value is not in the allowed range.
Definition: vpException.h:73

vpException::notImplementedError
@ notImplementedError
Not implemented.
Definition: vpException.h:69

vpFrameGrabber::getWidth
unsigned int getWidth() const
Return the number of columns in the image.
Definition: vpFrameGrabber.cpp:43

vpFrameGrabber::getHeight
unsigned int getHeight() const
Return the number of rows in the image.
Definition: vpFrameGrabber.cpp:38

vpHomogeneousMatrix
Implementation of an homogeneous matrix and operations on such kind of matrices.
Definition: vpHomogeneousMatrix.h:221

vpImageConvert::convert
static void convert(const vpImage< unsigned char > &src, vpImage< vpRGBa > &dest)
Definition: vpImageConvert.cpp:73

vpImage< vpRGBa >

vpImage::getSize
unsigned int getSize() const
Definition: vpImage.h:221

vpJsonArgumentParser
Command line argument parsing with support for JSON files. If a JSON file is supplied,...
Definition: vpJsonArgumentParser.h:138

vpJsonArgumentParser::addArgument
vpJsonArgumentParser & addArgument(const std::string &name, T &parameter, const bool required=true, const std::string &help="No description")
Add an argument that can be provided by the user, either via command line or through the json file.
Definition: vpJsonArgumentParser.h:189

vpJsonArgumentParser::addFlag
vpJsonArgumentParser & addFlag(const std::string &name, bool &parameter, const std::string &help="No description")
Add an argument that acts as a flag when specified on the command line. When this flag is specified,...
Definition: vpJsonArgumentParser.cpp:97

vpRBFeatureTrackerInput
All the data related to a single tracking frame. This contains both the input data (from a real camer...
Definition: vpRBFeatureTrackerInput.h:112

vpRBFeatureTrackerInput::renders
vpRBRenderData renders
camera parameters
Definition: vpRBFeatureTrackerInput.h:120

vpRBTracker
Definition: vpRBTracker.h:68

vpRBTracker::track
void track(const vpImage< unsigned char > &I)
Definition: vpRBTracker.cpp:163

vpRBTracker::getCameraParameters
vpCameraParameters getCameraParameters() const
Definition: vpRBTracker.cpp:99

vpRBTracker::displayMask
void displayMask(vpImage< unsigned char > &Imask) const
Definition: vpRBTracker.cpp:551

vpRBTracker::getPose
void getPose(vpHomogeneousMatrix &cMo) const
Definition: vpRBTracker.cpp:64

vpRBTracker::getMostRecentFrame
const vpRBFeatureTrackerInput & getMostRecentFrame() const
Definition: vpRBTracker.h:82

vpRBTracker::loadConfigurationFile
void loadConfigurationFile(const std::string &filename)
Definition: vpRBTracker.cpp:582

vpRBTracker::display
void display(const vpImage< unsigned char > &I, const vpImage< vpRGBa > &IRGB, const vpImage< unsigned char > &depth)
Definition: vpRBTracker.cpp:558

vpRBTracker::setPose
void setPose(const vpHomogeneousMatrix &cMo)
Definition: vpRBTracker.cpp:69

vpRBTracker::startTracking
void startTracking()
Definition: vpRBTracker.cpp:193

vpVideoReader
Class that enables to manipulate easily a video file or a sequence of images. As it inherits from the...
Definition: vpVideoReader.h:181

vpVideoReader::acquire
void acquire(vpImage< vpRGBa > &I)
Definition: vpVideoReader.cpp:243

vpVideoReader::getLastFrameIndex
long getLastFrameIndex()
Definition: vpVideoReader.h:313

vpVideoReader::open
void open(vpImage< vpRGBa > &I)
Definition: vpVideoReader.cpp:174

vpVideoReader::setFileName
void setFileName(const std::string &filename)
Definition: vpVideoReader.cpp:86

vpVideoReader::setFirstFrameIndex
void setFirstFrameIndex(const long first_frame)
Definition: vpVideoReader.h:354

VISP_NAMESPACE_NAME
Definition: vpEigenConversion.h:44

visp::cnpy::npy_load
VISP_EXPORT NpyArray npy_load(std::string fname)
Definition: vpIoTools_npy.cpp:420

vpDisplayFactory::makeDisplayGrid
std::vector< std::shared_ptr< vpDisplay > > makeDisplayGrid(unsigned int rows, unsigned int cols, unsigned int startX, unsigned int startY, unsigned int paddingX, unsigned int paddingY, Args &... args)
Create a grid of displays, given a set of images. All the displays will be initialized in the correct...
Definition: vpDisplayFactory.h:279

vpTime::measureTimeMs
VISP_EXPORT double measureTimeMs()

CmdArguments
Definition: tutorial-rbt-sequence.cpp:19

CmdArguments::stepByStep
bool stepByStep
Definition: tutorial-rbt-sequence.cpp:46

CmdArguments::frameStep
unsigned int frameStep
Definition: tutorial-rbt-sequence.cpp:45

CmdArguments::registerArguments
void registerArguments(vpJsonArgumentParser &parser)
Definition: tutorial-rbt-sequence.cpp:25

CmdArguments::colorSequence
std::string colorSequence
Definition: tutorial-rbt-sequence.cpp:42

CmdArguments::depthFolder
std::string depthFolder
Definition: tutorial-rbt-sequence.cpp:43

CmdArguments::postProcessArguments
void postProcessArguments()
Definition: tutorial-rbt-sequence.cpp:35

CmdArguments::startFrame
unsigned int startFrame
Definition: tutorial-rbt-sequence.cpp:44

visp::cnpy::NpyArray
Definition: vpIoTools.h:87

visp::cnpy::NpyArray::shape
std::vector< size_t > shape
Definition: vpIoTools.h:124

visp::cnpy::NpyArray::data
T * data()
Definition: vpIoTools.h:100

vpRBRenderData::silhouetteCanny
vpImage< vpRGBf > silhouetteCanny
Definition: vpRBFeatureTrackerInput.h:58

vpRBRenderData::color
vpImage< vpRGBa > color
Definition: vpRBFeatureTrackerInput.h:57

vpRBRenderData::normals
vpImage< vpRGBf > normals
Definition: vpRBFeatureTrackerInput.h:55

vpRBRenderData::isSilhouette
vpImage< unsigned char > isSilhouette
Image containing the orientation of the gradients.
Definition: vpRBFeatureTrackerInput.h:59