Vous avez peut-être vu ce dessin de la bédé XKCD, qui montre qu'il est parfois difficile d'expliquer à un non-informaticien pourquoi certaines tâches sont triviales, tandis que d'autres sont presque impossibles :
Les ingénieurs de Flickr ont essayé, voici donc "PARK or BIRD" : déposez une photo, et l'algorithme cherche à savoir si l'image a été prise dans un parc national américain (grâce aux coordonnées GPS incluses), et si elle représente un oiseau (en utilisant un réseau de neurones assez complexe).
+ d'infos sur petapixel.com/2014/10/21/flickr-responds-webcomic-challence… et sur code.flickr.com (les deux sont en anglais).
La reconnaissance d'image est depuis le début une tâche particulièrement ardue pour les machines, c'est d'ailleurs pour ça que beaucoup de sites internet vous demandent de taper une série de lettres déformées, afin de prouver que vous n'êtes pas un logiciel, on appelle cela un "CAPTCHA".
Mais des progrès considérables ont été réalisés ces dernières années dans cette branche de l’intelligence artificielle, <insérer musique de Terminator> notamment chez Google qui s'est retrouvé avec deux projets ayant des objectifs opposés : pour reCaptcha, il fallait rendre la lecture automatique d'une image le + difficile possible, tandis que dans l'équipe de Street View, ils développaient un programme capable de déchiffrer les numéros des maisons, parmi les milliards de photos prises par les voitures Google.
Un peu plus tôt cette année, les deux équipes ont publié conjointement leur travaux, et ont annoncé que l'algorithme de Street View pouvait "lire" les images de reCaptcha, dans 99,8% des cas (+ d'infos sur cet article de TechCrunch d'avril 2014, et dans l'article scientifique publié par Google).
Et ce n'est pas tout ! Google travaille aussi sur un algorithme capable de décrire une photo en quelques mots :
Ici, le logiciel a dit "deux pizzas posées sur un four" , ce qui est évidement faux, il y a trois sortes de pizzas. Haahaa qu'il est bête, on n'a rien a craindre. Hum. <ajuste sa cravate nerveusement>
+ d'info sur ce projet ici : http://googleresearch.blogspot.com/2014/11/a-picture-is-worth-thousand-coherent.html