MoGe - Monocular Geometry Estimation¶
Systemvoraussetzungen¶
- Python 3.13 (für CUDA und PyTorch)
- CUDA Compilation Tools, Release 12.8, Version V12.8.93
- PyTorch 2.7.0+cu128
- TorchVision 0.22.0+cu128
- GPU: Nvidia GTX1070 mit Max-Q Design
Experimente und Tests¶
Experimente mit Bild im Bild: Ab wann wird die Tiefe in ebenen Bildern (z. B. auf Papier gedruckte Bilder) berechnet und wann wird dieses Bild als solches erkannt? Wenn wir als Menschen durch optische Täuschungen getäuscht werden, könnte dies auch das MoGe-Modell betreffen. Ich würde gerne noch die komplementäre Variante testen. Es stellt sich die Frage, ob es möglich ist, dreidimensionale Objekte so anzuordnen, eventuell mit einem Rahmen, dass das Modell getäuscht wird und die Szenerie als ein flaches Bild wahrnimmt.
Weitere Fragen¶
wie genau lassen sich die Meshes/Punktwolken vergleichen?
pyKinectAzure¶
Für die Nutzung von pyKinectAzure ist Python 3.11 erforderlich, da ansonsten Open3D für die Punktwolkenberechnung und -darstellung nicht funktioniert. In manchen Szenarien erkannte die Kinect deutlich die Fläche eines gedruckten Bildes.