Parc national ou oiseau ?

. lecture : 2 minutes

Vous avez peut-être vu ce dessin de la bédé XKCD, qui montre qu'il est parfois difficile d'expliquer à un non-informaticien pourquoi certaines tâches sont triviales, tandis que d'autres sont presque impossibles :

Savoir où a été prise une photo ? Simple ! Savoir si la photo représente un oiseau ? Il va me falloir 5 ans et une équipe de chercheurs.
bédé XKCD numéro 1425

Les ingénieurs de Flickr ont essayé, voici donc "PARK or BIRD" : déposez une photo, et l'algorithme cherche à savoir si l'image a été prise dans un parc national américain (grâce aux coordonnées GPS incluses), et si elle représente un oiseau (en utilisant un réseau de neurones assez complexe).

+ d'infos sur petapixel.com/2014/10/21/flickr-responds-webcomic-challence… et sur code.flickr.com (les deux sont en anglais).

La reconnaissance d'image est depuis le début une tâche particulièrement ardue pour les machines, c'est d'ailleurs pour ça que beaucoup de sites internet vous demandent de taper une série de lettres déformées, afin de prouver que vous n'êtes pas un logiciel, on appelle cela un "CAPTCHA".

Mais des progrès considérables ont été réalisés ces dernières années dans cette branche de l’intelligence artificielle, <insérer musique de Terminator> notamment chez Google qui s'est retrouvé avec deux projets ayant des objectifs opposés : pour reCaptcha, il fallait rendre la lecture automatique d'une image le + difficile possible, tandis que dans l'équipe de Street View, ils développaient un programme capable de déchiffrer les numéros des maisons, parmi les milliards de photos prises par les voitures Google.

Un peu plus tôt cette année, les deux équipes ont publié conjointement leur travaux, et ont annoncé que l'algorithme de Street View pouvait "lire" les images de reCaptcha, dans 99,8% des cas smiley bravo (+ d'infos sur cet article de TechCrunch d'avril 2014, et dans l'article scientifique publié par Google).

Et ce n'est pas tout ! Google travaille aussi sur un algorithme capable de décrire une photo en quelques mots :

“Two pizzas sitting on top of a stove top oven”
Image utilisée pour tester l'algorithme de reconnaissance des images : des pizzas sur un four

Ici, le logiciel a dit "deux pizzas posées sur un four" , ce qui est évidement faux, il y a trois sortes de pizzas. Haahaa qu'il est bête, on n'a rien a craindre. Hum. <ajuste sa cravate nerveusement>

+ d'info sur ce projet ici : http://googleresearch.blogspot.com/2014/11/a-picture-is-worth-thousand-coherent.html