1 min readJul 10, 2020
Grundsätzlich stimmt das natürlich, bei größerer Auflösung können auch kleinere Objekte bei größerem Abstand besser abgebildet werden.
Dass die Auflösung in diesem Fall aber 224x224 Pixel sein muss, hat zwei Gründe:
- Der K210 hat schlicht nicht genügend RAM, um größere Auflösungen verarbeiten zu können (mehr Bildpunkte bedeuten mehr Daten, welche verarbeitet werden müssen)
- Die Implementierung des MobileNet in Keras sieht max. 224x224 Pixel vor. Bei höheren Auflösungen könnten die vortrainierten Imagenet-Gewichtungen nicht verwendet werden, das Netz müsste “from Scratch” trainiert werden, was sehr viele Trainingsdaten und sehr viel Rechenleistung erfordert. Möglicherweise wären auch Änderungen an der Implementierung selbst erforderlich, weil die Kapazität des NN bei deutlich höheren Auflösungen nicht mehr ausreichen würde.