Evaluation de l’impact du traitement d’images sur les performances d’une IA de détection d’objets 

Problématique : Quelle est la qualité image nécessaire pour une IA ?
Afin d’obtenir une image infrarouge de bonne qualité pour l’œil humain il est nécessaire d’appliquer un ensemble d’algorithmes de correction parfois lourds en calcul. Dans le cas où c’est une intelligence artificielle qui analyse l’image et non un œil humain, est-il nécessaire d’appliquer tous ces algorithmes ou est-il possible de réduire le temps de calcul nécessaire à la correction de l’image infrarouge ?

Le projet
La chaîne de traitement de l’image infrarouge est composée de plusieurs algorithmes dans le but de passer d’une image brute issue du capteur à une image exploitable et compréhensible pour un œil humain. Cependant, même si ces algorithmes permettent de générer la plus belle image possible pour un humain, on ne sait pas s’ils sont tous utiles pour une intelligence artificielle (IA). De plus, les algorithmes de correction infrarouge nécessitant une calibration, étape chronophage et coûteuse en production, on cherchera à la minimiser. La chaîne de traitement classique est présentée en figure 1 avec les différents blocs algorithmiques.

Figure 1 : Chaîne de traitement de l’image infrarouge

Afin de réaliser cette étude, on se base sur le dataset de détection de piétons de Lynred composé de 5700 images. On commence par tester l’impact de la calibration sur les performances de détection d’une IA. Sur la figure 2, l’Average Precision (AP) obtenue pour une calibration légère en fonction de la température à laquelle est faite la calibration. Les résultats sont présentés pour deux réseaux de neurones, un réseau léger (en bleu) et un réseau plus lourd (en vert). On remarque que les performances sont très dépendantes de la température de calibration, l’AP variant de 40 à plus de 70. Cela implique que cette calibration offrira une bonne qualité d’image uniquement sur une plage de température de fonctionnement du capteur très réduite.

Figure 2 : Performances d’une IA pour une calibration légère

Pour une calibration plus lourde appelée shutterless, on obtient les résultats présentés en figure 3. Les performances sont beaucoup moins dépendantes de la température de calibration, permettant d’assurer une qualité image supérieure sur une plus grande plage de température de fonctionnement du capteur. En effet, l’AP est constante à 70 sur la majorité de l’intervalle de température.

Figure 3 : Performances d’une IA pour une calibration plus lourde

Cela constitue le premier résultat important de cette étude : une calibration plus lourde induit une différence significative sur les performances de détection d’une IA. Par conséquent, les résultats suivants seront présentés en considérant une calibration shutterless.

La figure 4 présente la qualité d’image obtenue pour différentes combinaisons d’algorithmes

Figure 4 : Qualité d’image pour différentes combinaisons d’algorithmes

La figure 5 présente les performances de détection obtenues pour chaque combinaison d’algorithme ainsi que les temps de calcul associés (courbe rouge). Tous les résultats incluent un algorithme de correction basé sur une calibration shutterless ainsi que l’algorithme Tone Mapping (TM) sans lequel les performances chutent drastiquement.

Figure 5 : Performances obtenues pour différentes combinaisons d’algorithmes

On remarque que la performance maximale (42.52ms par image) n’est pas obtenue par la chaîne de traitement la plus lourde (55.13ms par image). On remarque aussi que la chaîne algorithmique composée d’un seul algorithme (32.17ms) arrive en troisième position. Ainsi, on obtient un gain de 25% en temps de calcul en appliquant un seul algorithme pour une réduction de performance de détection de seulement 0.8%.

En conclusion, la chaîne de traitement optimale pour une IA de détection d’objets n’est composée que de deux algorithmes et il est même possible de n’appliquer qu’un seul algorithme si on accepte une perte minime de performances. La plupart des algorithmes permettant de générer une belle image pour l’œil humain ne sont donc pas nécessaires pour une IA et peuvent même dégrader ses performances.
Enfin, les algorithmes shutterless et tone mapping semblent indispensables afin d’obtenir des performances de détection correctes. De futures études s’intéresseront à ce point, en essayant de s’affranchir de ces deux algorithmes.

Auteur : Christophe KARAM 

Mots clés : infrared correction pipeline, deep learning, artificial intelligence, pedestrian detection

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn