Sur le site Web de l’un des plus grands détaillants en ligne d’électronique grand public, une recherche de “refroidisseur de bière” renvoie une prime de plus de 500 résultats pertinents, mais une recherche de “refroidisseur de bière” n’en fournit même pas un. Tapez “quelque chose pour refroidir la bière” et le seul résultat que vous obtenez est un ensemble Lego.
Faites le même exercice sur Google ou Bing et l’expérience est toute autre. Les deux moteurs les plus populaires semblent comprendre que “plus frais” et “plus froid” sont synonymes, et il fonctionne même assez bien sur le test “quelque chose à refroidir”.
Que savent les géants des moteurs de recherche que les sites e-commerce ne savent pas ? La différence est la “recherche vectorielle”, une technologie ancrée dans la recherche sur l’intelligence artificielle qui représente les informations sous forme de nombres plutôt que de texte.
Une fois le contenu converti en facteurs de recherche (qui sont essentiellement des chaînes de nombres), les algorithmes d’apprentissage automatique peuvent trouver un contenu similaire en comparant les distances entre les vecteurs pour comprendre comment différents mots sont liés les uns aux autres. Ils peuvent également analyser le contenu environnant pour comprendre le contexte des requêtes de recherche, de sorte que les “chansons de mauvaise compagnie” renvoient des résultats sur les airs du supergroupe des années 1980 et non sur les lamentations d’invités indésirables. Si vous souhaitez vous plonger dans la technologie de la recherche vectorielle, cet article sur le blog Google Cloud devrait satisfaire votre geek intérieur.
Quand la recherche a besoin d’une touche humaine
Cependant, ce n’est pas ainsi que fonctionnent la plupart des moteurs de recherche de commerce électronique aujourd’hui. “La grande recherche est en fait un jeu de données et d’apprentissage automatique, mais aucune des principales technologies de recherche disponibles aujourd’hui ne le fait directement”, a déclaré Hamish Ogilvy, PDG de Search.io, qui crée un moteur de recherche pour les vendeurs en ligne basé sur la technologie vectorielle. Le résultat est que “la qualité de la recherche est fondamentalement déterminée par la capacité des humains à configurer et à se connecter à d’autres systèmes”.
En d’autres termes, les moteurs de recherche sur la plupart des sites commerciaux ne sont aussi bons que les êtres humains derrière eux. Des géants comme Amazon.com ont été en mesure d’externaliser les hacks nécessaires pour fournir des résultats pertinents aux équipes de science des données sur une période de plusieurs années, mais la plupart des détaillants sont bloqués avec le moteur de recherche par défaut du fournisseur de services qu’ils utilisent.
La plupart ne sont pas bien servis par cela. Une enquête récente sur les performances de recherche des 50 sites de commerce électronique les plus rentables aux États-Unis par le Baymard Institute a déclaré que l’état de la recherche de commerce électronique était «cassé», notant que seulement 34% des sites pouvaient gérer les requêtes qui utilisent des thèmes, caractéristiques ou symptômes plutôt que des noms de produits spécifiques. “Un énorme 70 % des moteurs de recherche sont incapables de renvoyer des résultats pertinents pour les synonymes de type de produit, ce qui oblige les utilisateurs à rechercher en utilisant exactement le même jargon que le site”, a affirmé la société.
Cela coûte beaucoup d’argent aux vendeurs. Un récent rapport de Google a estimé que les entreprises de commerce électronique perdaient 300 milliards de dollars par an rien qu’aux États-Unis parce que les visiteurs ne trouvaient pas ce qu’ils cherchaient.
Ajustements et conséquences inattendues
La recherche traditionnelle repose sur la correspondance des chaînes de texte, a expliqué Ogilvy. Par conséquent, une recherche sur les “cols ronds” ne renverra pas de résultat lié aux T-shirts à moins que la relation ne soit définie par des règles codées en dur dans l’index. Pour gérer une recherche d’ordinateur portable, par exemple, le moteur doit être informé que les mots « portable », « ordinateur portable », « ordinateur portable » et « MacBook » sont fonctionnellement identiques. L’effort manuel de codage de ces relations multipliées par des milliers de produits auxquels chacun peut être référencé de multiples façons est d’une complexité presque inimaginable.
Et le codage manuel crée ses propres problèmes à mesure que le nombre de règles s’accumule. Ogilvy cite l’exemple d’une entreprise qui avait programmé une solution de contournement qui reformatait les recherches de “USB C” en “USB-C”, qui était la syntaxe qu’elle utilisait dans son catalogue. Le résultat inattendu était que lorsque les visiteurs recherchaient “câble USB”, le trait d’union était automatiquement ajouté à la chaîne de texte et la requête résultante – “câble USB” – était vide.
“Il est très difficile d’écrire des milliers de ces choses et de ne pas causer de problèmes”, a déclaré Ogilvy.
Ces limitations avaient incité la plupart des opérateurs de sites de commerce électronique à optimiser les requêtes les plus volumineuses et à abandonner de fait les 70 % de requêtes qui constituent la “longue traîne” des termes de recherche rarement utilisés.
La bonne nouvelle est que la situation s’améliorera dans un avenir pas trop lointain. Les fabricants de moteurs de recherche de commerce électronique “se bousculent tous vers le vecteur”, a déclaré Ogilvy. “C’est ainsi que la recherche sera effectuée à l’avenir.”
La question n’est pas de savoir si la recherche vectorielle se généralisera, mais quand. “Je m’attends à ce que presque tout le monde aille dans cette direction”, a-t-il déclaré. La transition ne se fera pas nécessairement en douceur. Au fur et à mesure que les opérateurs de sites Web remplacent leurs utilitaires de recherche fortement corrigés, de nombreuses règles devront être supprimées et certaines modifiées, car l’apprentissage automatique n’est pas magique et ne peut pas anticiper les nuances de chaque cas d’utilisation. Cependant, à long terme, tout le monde s’en sortira mieux. Je parie une caisse de bière froide dessus.
Ensuite, lisez ceci :
Copyright © 2022 IDG Communications, Inc.
Source link