Diana Ortega
From Xebia France
Consultante chez Xebia France avec plusieurs années d'expérience dans l'écosystème JVM et le langage go. Vécu des nombreux projets cloud et data et passionnée par le développement logiciel et le craftsmanship.
Démonter et remonter un réseau de neurones pour l’OCR avec TensorFlow : leçons retenues
Les réseaux de neurones artificiels (RNA) ont levé de nombreux verrous technologiques en fournissant une solution à des problèmes jugés encore inaccessibles il y a dix ans.
Forts de leurs succès, les RNA suscitent d’autant plus d'intérêt que des frameworks tels TensorFlow ont étés open sourcés.
Fascinés par leur puissance, nous les avons expérimentés sur un problème de reconnaissance d’écriture manuscrite et nous vous invitons à revivre ensemble l’aventure de leur mise en place.
Le chemin n’a pas été sans embûches : cet assemblage d’éléments faisant passer de l’image au texte est une black box qui ne peut remplir sa fonction que lorsque tous ses composants sont assemblés. Dans ce cas, comment identifier celui qui pose problème ? Nous présentons les expériences qui nous ont permis d’aboutir à la réponse et qui ont résolument constitué la majeure partie de l'aspect "science" de ce projet de data science.
En parallèle, nous retraçons l’évolution de nos certitudes au fur et à mesure de l’avancement de ce projet, au cours duquel nous avons été amenés à plonger au coeur des algorithmes jusqu’à les prendre entièrement en main.