PointNet

De RoViT
Saltar a: navegación, buscar

Contenido

En qué consiste el sistema?

En este trabajo se propone el uso de una red neuronal convolucional para clasificar objetos en tres dimensiones. La capa de entrada de la red toma nubes de puntos sin color y las convierte a una representación volumétrica. Una vez convertidas, las utiliza para alimentar la red. La red consta de una sucesión de capas de convolución y pooling seguidas de dos capas totalmente conectadas. Todo el desarrollo se ha efectuado sobre el framework Caffe.

La capa de entrada se ha desarrollado exprofeso para este problema.

El mejor índice de acierto conseguido con este sistema ha sido de ~77% con el dataset ModelNet10 tras entrenar durante 200 iteraciones.

La capa de entrada convierte de nube de puntos a rejilla de ocupación

Cómo lo pongo en marcha?

El sistema se ha construido sobre caffe, el cual se encuentra en el repositorio del proyecto.

Lo primero es clonarlo git clone https://bitbucket.org/rovitlib/pfmfran2016.git

Después hay que compilar café siguiendo el tutorial de su propia página web http://caffe.berkeleyvision.org/installation.html.

Una vez instalado caffe podemos entrenar y testear PointNet, que está ubicada en la carpeta models/3dcnn/. Encontraremos 3 ficheros:

  • 3dcnn_77.prototxt: Arquitectura de entrenamiento de la red. Es preciso modificar los parámetros de la capa de entrada para que apunten a tu conjunto de entrenamiento.
  • 3dcnn_Test_77.prototxt:Arquitectura de test de la red. Es preciso modificar los parámetros de la capa de entrada para que apunten a tu conjunto de test.
  • solver_77.prototxt: Parámetros del solucionador y otras configuraciones del comportamiento de caffe.

Documentacion

Este proyecto forma parte del Trabajo de Fin de Master de Francisco Gómez Donoso y la documentación asociada se puede encontrar en el repositorio del mismo https://bitbucket.org/rovitlib/pfmfran2016.git.

Publicaciones relacionadas

A. Garcia-Garcia, F. Gomez-Donoso, J. Garcia-Rodriguez, S. Orts-Escolano, M. Cazorla, J. Azorin-Lopez. "Point Net: A 3D convolutional neural network for real-time object class recognition". International Joint Conference on Neural Networks (IJCNN 2016). Vancouver, Canada.

Herramientas personales
Espacios de nombres

Variantes
Acciones
Navegación
Herramientas