
Bert arrive ! Mais c’est qui ce Bert?!?
La semaine dernière Google a annoncé le déploiement de BERT pour Bidirectional Encoder Représentations from Transformers. BERT, c’est plus simplement le nom du réseau de neurones artificiels présenté par Google en 2018. Il a pour pour mission de mieux comprendre le langage naturel. On parle de Natural Language processing ou NLP.
L’annonce de Google a fait grand bruit, et c’est normal : rares sont les fois où les mises à jour des algorithmes sont annoncées, et d’après les équipes de Google, il s’agit de la mise à jour la plus importante depuis 5 ans !
Grâce aux dernières avancées de notre équipe de recherche dans la science de la compréhension du langage – rendue possible grâce à l’apprentissage automatique – nous améliorons considérablement la façon dont nous comprenons les requêtes, ce qui représente le plus grand bond en avant des cinq dernières années et l’un des plus grands bonds en avant dans l’histoire du Search.
L’objectif de cette mise à jour est de permettre à l’algorithme de mieux comprendre les nuances et le contexte des mots employés dans les recherches et donc de fournir des résultats moins à côté de la plaque. Les mots ne sont plus traités l’un après l’autre dans l’ordre de lecture mais les un par rapport aux autres dans une phrase.
L’exemple fictif fournit par Google est celui-ci : 2019 brazil traveler to usa need a visa.
A l’heure actuelle, le premier résultat pourrait tout à fait mener à un site conseillant les voyageurs des USA souhaitant se rendre au Brésil sur les documents administratifs dont ils ont besoin.
Grâce à Bert, l’algorithme va interpréter le « to » et donc prendre en considération le fait que la requête concerne un Brésilien allant VERS les USA.
Vous trouverez d’autres exemples des changements que cela peut impliquer sur le billet de blog de Google, autant dans les sites présents dans les résultats des moteurs de recherche que dans les featured snippets.
Le traitement automatique du langage, NLP (natural language processing)
Le traitement automatique du langage est un domaine multi-disciplinaire mêlant informatique, intelligence artificielle et linguistique ayant pour objectif d’intégrer le langage humain à la machine et d’étudier la compréhension, la manipulation et la génération du langage naturel par les machines.
Depuis des décennies, l’homme essaye de communiquer avec la machine. Les langages artificiels (codes informatiques) le permettent, mais ce qui nous intéresse ici, c’est le langage naturel.
Pour communiquer avec cette dernière, il faut d’abord qu’elle soit en mesure de nous comprendre afin de créer un échange. Le deep learning (apprentissage profond) a favorisé la création de modèles d’apprentissage automatique qui ont permis aux programmes de traiter des quantités d’informations très importantes. Ils sont ainsi en mesure de répondre aux questions qui leur sont posées.
Pour info, en janvier 2018, plusieurs modèles d’intelligence artificielle ont réussi à battre les humains dans un test de lecture et de compréhension. La technologie est donc très très bien avancée. On l’utilise d’ailleurs déjà dans notre quotidien : traduction automatique via Google translate (entre autres), assistants personnels (Siri, Cortana, …), …
A quelle sauce l’algorithme va nous manger?
Notons d’abord que Google a annoncé que seulement 10% des requêtes allaient être impactées, c’est peu et beaucoup à la fois. En tout cas ce ne sera pas un gigantesque séisme dévastant des années d’optimisation acharnée. Et oui, si vous suivez déjà les conseils de Google et que votre objectif est de fournir un contenu de qualité et adapté aux attentes de vos lecteurs et non des robots, alors tout va bien.
Ensuite, BERT va d’abord être déployé sur les recherches anglophones. Nous avons donc le temps de voir venir et d’observer ce qu’il se passe chez nos voisins avant d’être concerné.e.s.
A la question « quelles sont les optimisations à mettre en place pour s’accorder les bonnes graces de Bert? », les spécialistes sont assez unanimes : pas grand chose, si ce n’est de continuer à étudier les intentions de recherche de votre cible et de produire du contenu de qualité adapté.
Je vous recommande l’article du site Abondance « Plus d’infos sur BERT, le nouvel algorithme de Google » pour creuser un peu plus le sujet.
A titre personnel, je suis ravie de cette nouvelle tant le système actuel était limité et finalement peu pertinent. Avec cette évolution, c’est le contenu qui va primer et ça me semble être l’essentiel. La logique de Google a toujours été de fournir des résultats les plus efficients possibles en fonction de la requête. Pour apparaître dans les premiers résultats, le moyen le plus sûr est donc de proposer le contenu le plus adapté à une recherche, le plus qualitatif et le plus efficace. Ce sont les règles que j’applique et que je recommande à mes clients, donc, même pas peur 😊. Enfin, ce n’est pas encore le moment de s’emballer, les mois à venir nous permettront de comprendre la réalité de cette nouvelle mise à jour.
Sources ou informations complémentaires :
Autour de BERT :
- https://www.journaldunet.com/web-tech/dictionnaire-du-webmastering/1203545-algorithme-google-la-google-bert-update/
- https://blog.google/products/search/search-language-understanding-bert
- https://searchengineland.com/welcome-bert-google-artificial-intelligence-for-understanding-search-queries-323976
- https://ai.googleblog.com/2018/11/open-sourcing-bert-state-of-art-pre.html
- https://www.abondance.com/20191025-41160-bert-en-cours-de-lancement-la-plus-grosse-update-depuis-5-ans-chez-google.html
- https://www.abondance.com/20191028-41166-plus-dinfos-sur-bert-le-nouvel-algorithme-de-google.html
Autour du traitement automatique du langage naturel :