Découvrez L'Art De L'Édition
L'ordinateur

Cet étudiant en troisième année d’ingénierie a créé un logiciel de vision par ordinateur pour prévenir le harcèlement via des caméras de surveillance.

Cet étudiant en troisième année d'ingénierie a créé un logiciel de vision par ordinateur pour prévenir le harcèlement via des caméras de surveillance.

Et si quelqu’un vous disait que Big Brother peut être un « bon » frère ? Malgré les problèmes de confidentialité et les débats entourant les caméras de surveillance, les villes métropolitaines d’aujourd’hui en sont couvertes. Cependant, la plupart du temps, il n’y a personne pour gouverner le mouvement à travers la caméra pour capturer les crimes qui se produisent en temps réel. C’est le cas de l’Inde, avec son grand nombre de cas d’abus sexuels, dont beaucoup se produisent dans des lieux publics en plein jour. Souvik Ghosh, étudiant en troisième année d’ingénierie, a créé un modèle, ‘Sathi’, un défenseur automatisé du harcèlement dans les lieux publics. Le prototype montre une femme montrant un poing ou un index à n’importe quelle caméra de surveillance dans la rue et la caméra alertant les passants avec une sirène forte et remarquant la police toute seule. Dans une interview avec le magazine Analytics India, Souvik a parlé de Sathi et de sa vie en tant qu’étudiant scientifique des données.

https://www.linkedin.com/embed/feed/update/urn:li:ugcPost:6909446808335257600

OBJECTIF : Quelle était l’idée derrière le modèle Sathi ?

Mes intérêts portent sur la science des données, la vision par ordinateur et l’apprentissage en profondeur. En plus d’être un passionné de technologie, je suis aussi un travailleur social. Je travaille dans la zone rouge de Kolkata et j’y enseigne aux étudiants. Cela m’a permis de voir les abus qui se produisent de première main. Plus tard, j’ai découvert qu’une femme sur trois avait été victime de harcèlement sexuel en Inde. Mes amis ont également parlé de telles expériences et j’ai réalisé que l’intimidation se produit souvent dans des endroits comme les autoroutes très fréquentées, les bus bondés, les trains locaux, les établissements d’enseignement, etc. Mais beaucoup de femmes hésitent à se faire remarquer ou à crier dans les lieux publics. Ils ne peuvent pas réagir. La recherche de solutions pour cela m’a fait réaliser que des villes métropolitaines comme Mumbai, Delhi ou Calcutta ont des caméras de surveillance dans toute la ville, y compris dans les transports, les rues et les universités. De plus, la plupart des gens transportent toujours des smartphones avec eux. Mais personne n’examine vraiment les images de la caméra pour identifier de tels crimes. J’ai réalisé qu’il fallait automatiser la caméra et cela m’a amené à créer satisfait.

AIM : Pouvez-vous nous faire passer par Sathi ?

Supposons que quelqu’un se trouve dans une situation où il se sent menacé. Ils doivent montrer leur poing pour protester contre la caméra, que ce soit la caméra de vidéosurveillance ou même la caméra de leur smartphone. L’appareil commencera à jouer une alarme forte ou un son de sirène lors de l’enregistrement du poing. Cela alerterait les citoyens environnants. Alternativement, si la personne montre son index ou pointe le numéro un, le système le signalera directement à la police. Il capturera et enverra également les images de cet endroit avec un graphique temporel à la police. Le système capturera chaque visage de cette scène sous forme de visages de la taille d’un passeport pour des preuves à utiliser plus tard. Pour l’application, la personne peut montrer un poing à la caméra du téléphone portable et le téléphone appellera directement la police.

OBJECTIF : Parlez-nous de votre stack technologique. De plus, en tant qu’étudiant en science des données, comment avez-vous accédé aux ressources nécessaires ?

Grâce à Internet, nous avons d’excellents cours gratuits sur YouTube et Coursera. Les ressources pédagogiques sont faciles. En ce qui concerne le système, nous n’avons pas besoin d’avoir accès à des systèmes parfaits. Nous avons Kaggle et Google Collab qui fournissent d’énormes mémoires RAM. Même si vous restez dans les régions les plus reculées du pays avec les ordinateurs portables les moins chers, vous pouvez contribuer à la création du système.

Ma pile technologique consistait principalement en apprentissage en profondeur, en vision par ordinateur et en science des données. Mon langage de base était Python. J’ai utilisé TensorFlow et MediaPipe pour la détection des visages pour la vision par ordinateur afin de garantir que le système puisse détecter les visages même dans les zones à faible luminosité.

OBJECTIF : Quelle est la portée du modèle ?

Le système est encore un prototype à ce jour. Le plan est de l’intégrer dans une caméra CCTV et une caméra mobile. Il y a des réponses sur lesquelles je travaille encore. Tout d’abord, la distance entre la personne et la caméra ne sera pas toujours de dix à quinze mètres. Parfois, ce sera cinquante mètres. Alors, dans quelle mesure l’appareil photo détectera-t-il les visages à longue distance ? Deuxièmement, dans quelle mesure cela fonctionnera-t-il pour plusieurs visages ? Par exemple, comment identifierez-vous le visage en question parmi des centaines de personnes ? Enfin, et si les gens l’utilisaient pour le plaisir ? Si j’étais un enfant, j’aimerais montrer du poing à la caméra et regarder la foule créer le chaos. Je prévois de me connecter avec des experts de l’industrie et des professeurs pour échanger des idées et le rendre infaillible.

OBJECTIF : Comment comptez-vous faire évoluer le modèle ?

Mes deux approches pour l’instant utilisent les MEM et les ordinateurs embarqués. Nous pouvons mettre l’ensemble du système sur des ordinateurs embarqués et des caméras de vidéosurveillance. Nous pouvons également mettre le code dans des applications mobiles qui fonctionnent dans les zones rurales sans caméras. L’application s’exécute en arrière-plan et identifiera le poing devant la caméra. Un défi ici est de connecter la caméra aux poteaux électriques de la région, car une sirène sur un téléphone portable est inutile. En voyant un poing, l’application mobile alertera le poteau électrique pour faire retentir une sirène. Nous devons encore réfléchir à l’endroit où la version finale fonctionnera ; Une caméra CCTV, une application ou les deux ? Nous pouvons avoir une couverture urbaine et rurale par les deux.

OBJECTIF : Quels sont vos conseils pour les étudiants entrant en science des données ?

Toute personne entrant dans la science des données devrait commencer par Python et ses bibliothèques. Il y a des marches à gravir; les gens ne devraient pas se lancer directement dans l’apprentissage en profondeur. La science des données est à la base de tout apprentissage, suivie de l’apprentissage automatique et de l’apprentissage en profondeur. C’est le chemin que j’ai suivi. J’ai également effectué des stages dans différents organismes dans des postes de stagiaire de recherche. Les stages m’obligent aussi à étudier et à apprendre davantage. Enfin, demander des cours gratuits sur des plateformes comme YouTube vous aidera à mieux étudier.