face-mask-dataset-ilc-2021

Le dataset des images du projet d'IA de 2021, Indiquez vos id git dans la issue pour les droits

TL;DR:

Choisir 200 images JPEG avec environ 1/3 sans masque, 1/3 avec masque, et 1/3 mal mis
Renommer les images avec le hash md5 du fichier
Annoter avec labelimg (ou autre pour fichier xml au format PASCAL-VOC)
commit sur votre branch "contrib_NOM1_NOM2"
Une fois toutes les images annotées, => Pull requests vers branche VALID
Le discord ILC est pratique pour échanger

1. Répartition

Les images sont repertoriées en 3 catégories :

"with_mask", un masque correctment porté et qui recouvre la bouche et le nez
"with_incorrect_mask", un masque porté sous le nez, ou de facon pas très covid-friendly
"without_mask, Un visage sans masque

Le dataset doit faire environ 2300 images qui répartit par 23 doit donner environ 100 images à annoter par personne

2. Gestion des images

Les images doivent être traitées de la sorte :

Le nom correspond au md5sum du fichier
Les masques rajoutés en mode photoshop sont à proscrire pour des raisons de performances
on recherche les images similaires par exemple à l’aide du script python compare_images
La répartition des images doivent être équilibrés (environ le même nombre d'image dans chaque catégorie à 100 images près)

3. Pour commit

L'idée va être d'avoir une branche "VALID" pour ajouter toutes les images en attentes de validation et de ne garder la branche "main" que pour le résultat final. Pensez à bien mettre renseigner vos avancés dans vos commits et pull request. -> Chaque binome ajoutera sur sa branche "contrib_NOM1_NOM2", et on effectuera un pull request vers la branche "VALID" une fois les 200 images ajoutées et annotées

4. Les outils qui vont bien

Pour annoter les images : labelimg
Pour trouver les doublons dans les images : Le script "compare_images.py" (run n'importe ou), et lui passer les deux dossier source(les images des autres) et to_add (les votres à ajouter)
Pour renommer toutes ses images en leur hash MD5 (A faire avant d'annoter) : le script "rename_dir_md5.py" (à déplacer dans le dossier JPEGImages pour run)

Le dataset des images du projet d'IA de 2021

Related tags

Overview

face-mask-dataset-ilc-2021

1. Répartition

2. Gestion des images

3. Pour commit

4. Les outils qui vont bien

Owner

Pre-Trained Image Processing Transformer (IPT)

Y. Zhang, Q. Yao, W. Dai, L. Chen. AutoSF: Searching Scoring Functions for Knowledge Graph Embedding. IEEE International Conference on Data Engineering (ICDE). 2020

The "breathing k-means" algorithm with datasets and example notebooks

Notes, programming assignments and quizzes from all courses within the Coursera Deep Learning specialization offered by deeplearning.ai

Tensorflow-Project-Template - A best practice for tensorflow project template architecture.

Repository for the paper "Exploring the Sensory Spaces of English Perceptual Verbs in Natural Language Data"

Repository for code and dataset for our EMNLP 2021 paper - “So You Think You’re Funny?”: Rating the Humour Quotient in Standup Comedy.

In the case of your data having only 1 channel while want to use timm models

Source code of the paper PatchGraph: In-hand tactile tracking with learned surface normals.

Offical implementation for "Trash or Treasure? An Interactive Dual-Stream Strategy for Single Image Reflection Separation".

Simple converter for deploying Stable-Baselines3 model to TFLite and/or Coral

Instance Semantic Segmentation List

A lossless neural compression framework built on top of JAX.

The source code for 'Noisy-Labeled NER with Confidence Estimation' accepted by NAACL 2021

A community run, 5-day PyTorch Deep Learning Bootcamp

LIVECell - A large-scale dataset for label-free live cell segmentation

Deep Compression for Dense Point Cloud Maps.

A Deep Learning based project for creating line art portraits.

Code release for ConvNeXt model

Implementation of popular bandit algorithms in batch environments.