• AI Camera with AI engine

Vidéosurveillance : les perspectives infinies des métadonnées

On ne s’en rend pas toujours compte, mais chaque jour, des dizaines de caméras peuvent capturer nos faits et gestes. En France, selon une étude récente[1], on dénombre plus de 11 400 caméras de surveillance sur la voie publique dans les grandes villes, un chiffre qui a été multiplié par 2,4 en à peine 6 ans. A cela s’ajoutent les systèmes de vidéosurveillance dans d’autres lieux comme les centres commerciaux, les entreprises, ou encore chez les particuliers. La caméra de vidéosurveillance est un outil largement déployé sur le territoire et nous sommes en train de vivre une période charnière de transformation technologique sur le marché de la sécurité. La démocratisation de l’Intelligence Artificielle et l’avènement des métadonnées issues de l’analyse d’image sont en train de rebattre les cartes en matière de vidéosurveillance. Des évolutions aussi stimulantes technologiquement qu’éthiquement : sur ces deux plans, la France et l’Europe ont une longueur d’avance.

 

Souriez, vous êtes filmés !

D’une utilisation militaire pendant la Seconde Guerre Mondiale à la démocratisation de l’usage domestique, jusqu’à la vidéosurveillance connectée que nous connaissons aujourd’hui, le marché n’est pas nouveau et a déjà connu plusieurs petites révolutions.

Au départ, il s’agissait uniquement de positionner une caméra pour enregistrer un espace défini. Un des premiers changements majeurs a été l’arrivée de la caméra IP - ou caméra réseau - qui, connectée via un réseau Ethernet est passée d’un simple capteur à un outil informatique à part entière. C’est à ce moment, dans le courant des années 2000 lorsque le marché de la vidéoprotection était en plein ébullition, que les premiers algorithmes d’intelligence artificielle ont été développé et déployés sur ces systèmes, permettant d’analyser les flux vidéo et de donner naissance à l’industrie de l’analyse d’image via les caméras de sécurité. Grâce à un principe d’analyse de volumes de pixels en mouvement dans l’image, ces systèmes peuvent par exemple détecter un mouvement anormal dans la vidéo, comprendre qu’il s’agit de la présence d’un individu et remonter l’information. Seul bémol, la précision de ces analyses est conditionnée par l’environnement dans lequel le système se trouve. Prenons le cas de la surveillance du portail d’une propriété privée : en cas de fortes pluies ou de vents violents, la détection peut être erronée et remonter de fausses alertes ou passer carrément à côté d’une intrusion. Autre freins sur ces technologies, le coût en infrastructure, en effet pour analyser ces vidéos et fournir un résultat pertinent il est nécessaire de déployer des serveurs informatiques avec une grande capacité de calcul.   Et ce ne sont pas les seuls griefs qui ont pu être notés au fur et à mesure des années. Les caméras de sécurité sont décriées dans leur utilisation car elles soulèvent un autre problème opérationnel : il faut traiter toutes ces vidéos collectées. Cela nécessite un dispositif humain conséquent, notamment au sein des centres de sécurité urbains.

Mais c’est sans compter l’évolution récente des systèmes de vidéosurveillance, qui, boostés par les avancées de l’intelligence artificielle, sont aujourd’hui de plus en plus performants et autonomes.  

 

Deep Learning et métadonnées : le bond en avant de la vidéosurveillance

C’est une réalité : plus les algorithmes sont précis, plus les caméras équipées d’analyse d’image deviennent pro-actives dans la remontée d’informations auprès de l’utilisateur d’un système de vidéosurveillance. L’Intelligence Artificielle nouvelle génération permet aujourd’hui d’aller plus loin et de faire des pré-analyses plus pointues des situations. Dans le cas d’une ville, les nouveaux algorithmes vont par exemple être en mesure d’attirer le regard des opérateurs sur des attroupements, ou des mouvements de foule anormaux. Comment cela est-il possible ? Tout simplement via une nouvelle méthode de conception de ces algorithmes d’analyse d’image appelée « Deep Learning » ou Apprentissage Profond permettant d’utiliser de grands volumes de données pour « entrainer » une Intelligence Artificielle. Parce que le volume de données à disposition a explosé ces dernières années. Les données sont très présentes dans notre quotidien et plus faciles à obtenir. Lorsque l’on « entraine » les systèmes d’Intelligence Artificielle avec toutes ces données, ils sont en mesure de reconnaître des formes différentes : un homme, une femme, un chat, mais aussi de reconnaitre le couleurs, un homme portant un tee-shirt rouge et une moustache, un enfant sur une trottinette, un visage en particulier… Tout cela est permis par les algorithmes de Deep Learning, capables de traiter un nombre exponentiel de données. A cela vient s’ajouter les progrès en termes de puissance de calcul et miniaturisation des processeurs informatique qui s’intègrent aujourd’hui directement dans les caméras de sécurité, rendant ainsi le coût de déploiement de ces technologies beaucoup plus accessibles pour les utilisateurs finaux.

Les systèmes actuels de vidéosurveillance sont donc devenus experts en détection et reconnaissance de formes. A partir de ce qu’ils ont détecté, ils créent une base de métadonnées qui s’autoalimente et permet une analyse des images toujours plus fine. C’est d’ailleurs la base des outils biométriques et de reconnaissance faciale. Effrayant pour la protection des données personnelles ? Pas vraiment, car le cadre règlementaire en Europe protège de façon stricte les libertés individuelles (RGPD). En outre, dans une approche sécuritaire, l’objectif des métadonnées n’est pas de fliquer les citoyens (ce qui n’est de toute façon pas possible en Europe), mais bien d’optimiser l’utilisation de la vidéo protection, et de la rendre proactive et prédictive. Caméra embarquée dans les voitures connectées pour éviter les accidents, smart cities optimisant les flux et limitant les incidents, caméra qui repère les micro-expressions d’un individu faisant un AVC… les perspectives sont illimitées et certaines sont déjà une réalité. Dès leur conception, les systèmes de sécurité d’aujourd’hui sont pensés pour aller au-delà d’une logique protective. D’ici 2024, on estime que 30% des caméras vendues sur le marché auront capacité à embarquer du Deep learning. L’analyse d’images par Intelligence Artificielle est en plein essor. Ce n’est plus qu’une question de temps : celui nécessaire au déploiement des infrastructures.

Sur le marché de la vidéosurveillance, une révolution semble donc en amener une autre… Pour le meilleur ? On peut réellement le croire. Car il existe une intelligence artificielle éthique, largement soutenue par l’Europe qui se positionne comme un modèle précurseur en la matière. Il est également de notre devoir de citoyen de veiller à ce que le développement des technologies reste respectueux des libertés individuelles. Loin d’être un frein à l’innovation, l’intelligence artificielle raisonnable et responsable a de beaux jours devant elle, notamment dans le domaine de la sécurité et de la vidéosurveillance.

[1] Etude 2020 de la Gazette des Communes : https://www.lagazettedescommunes.com/660599/le-palmares-des-50-plus-gran...