Autres liens
Article de Wikipedia sur la ROC.

ROC musicale.

Reconnaissance optique de caractères

La Reconnaissance Optique de Caractères (ROC en français, OCR en anglais) est la lecture automatique par ordinateur, c'est à dire la transcription de caractères imprimés dans une image en texte traitable par l'ordinateur (fichier ASCII par exemple).

image de texte
Exemple de texte aparaissant sous forme d'image.

Il s'agit donc en fait d'une application d'analyse d'image qui a peu à voir avec l'optique, malgré le nom. La ROC est une application importante qui à pris son essort avec le développement du fax et du scanner. De nos jour un logiciel de ROC est généralement livré avec tout achat de scanner grand public. Les grands projets de numérisation de collections de livres et de documents tels le projet Gutenberg, Google print ou encore le projet Gallica de la BNF font appel à cette technologie.

Il existe de nombreux logiciels de ROC, par exemple:

ROC musicale

La ROC musicale est la même chose, mais cette fois concernant les partitions musicales. On se propose de faire lire la musique à un ordinateur ! La ROC musicale a fait l'objet de moins de développement que la ROC textuelle, mais cependant par certains cotés elle est plus simple car une partition musicale contient de nombreux éléments redondants, bien que d'autre part elle soit compliquée par la présence de nombreux éléments subtils, par exemple d'accentuations ou d'altérations.
image de musique
Exemple de partition musicale aparaissant sous forme d'image.
Le but final d'une telle application est de transcrire l'image d'une partition en un fichier MIDI, ou encore une description formelle de la partition, par exemple en MusicXLM ou encore ABC.

Il existe certains logiciels de ROC musicale, par exemple:

A ma connaissance il n'existe pas de logiciel libre de ROC musicale.

Le projet dans le cadre de PR302

Étant donné le temps imparti, il n'est pas réaliste d'imaginer développer une application complète, cependant on s'attachera à mettre en oeuvre une grande partie des outils nécessaires:
  • Rotation et alignement de la page
  • Segmentation des zones de l'image (clefs, notes, texte, etc)
  • Segmentation des lignes de portées et de mesures
  • Segmentation des notes
  • Detection de hauteur des notes
  • Etc.

Nombre d'étudiants: 3 ou 4

Environnement: Linux + librarie d'analyse d'image

Langage: C/C++

Renseignements complémentaires

Pour toute questions, contactez moi directement:

Hugues Talbot

Bureau ESIEE 5357 (épi 5)

Tel: 01 45 92 66 15

Email: talboth@esiee.fr