Le problème du traitement du langage naturel expliqué par Google. (Quand on parle du loup…)

La semaine dernière, je vous parlais du problème du traitement du langage naturel (ou traitement automatique des langues) et de la raison pour laquelle j’espérais voir arriver une déclinaison de balises HTML dont la porte-parole serait la balise < sarcasm />. Mercredi dernier, je briefais un éventuel futur client aux importantes limitations des outils de veille et d’analyse d’audience pour les marques, tels que Radian6, Trackur, Nielsen ou buzzlogic…
Aujourd’hui, c’est Google qui vous parle et qui vous donne un excellent aperçu des limitations des machines pour comprendre ce que l’on dit sur l’internet en s’appuyant sur l’usage des synonymes. Comme d’habitude, c’est bien expliqué, clair et sans détour [I LIKE]. Pour parfaire leurs base d’exemples, ajoutons que l’essentiel des outils de gestion de réputation et d’analyse d’audience tendent à proposer des “features” telles que votre taux d’amour ou de haine etc… Et ce, en scannant les occurrences de mots-clés tels que “amour” dans les messages contenant le nom de votre marque. Dites-moi donc si les messages suivants ont un lien avec l’amour que quelqu’un porte à votre marque:
- Aujourd’hui j’ai été chez (votre marque) avec celle que j’aime.
- J’aime ça quand le préposé à la clientèle de chez (votre marque) ne parle pas français… :(
Message à tous les gestionnaires de communauté (community manager) faites attention aux datas que vous crachent vos outils, et surtout, assurez-vous de bien les interpréter ;)
