Description du livre
Cette monographie donne un aperçu complet des techniques et des méthodes de représentation sémantique du contenu et montre comment appliquer ces techniques dans divers cas d'utilisation, comme les systèmes de recommandation, le profilage des utilisateurs et l'analyse des médias sociaux.
Tout au long de l'ouvrage, les auteurs fournissent une analyse approfondie des techniques actuellement proposées dans la littérature et couvrent tous les outils et bibliothèques disponibles pour mettre en œuvre et exploiter ces méthodologies dans des scénarios du monde réel.
Le livre présente d'abord le problème de la surcharge d'information et les raisons pour lesquelles l'information basée sur le contenu doit être prise en compte. Ensuite, les bases du traitement du langage naturel sont fournies, en décrivant des opérations telles que la tokenisation, la suppression des mots vides, la lemmatisation, le stemming, le marquage partiel de la parole, ainsi que les principaux problèmes et enjeux. Enfin, l'ouvrage décrit les différentes approches de la représentation sémantique des contenus : ces approches sont divisées en approches " exogènes " et " endogènes ", selon que l'on utilise des sources de connaissances externes comme DBpedia ou des modèles géométriques et la sémantique distributionnelle, respectivement. En conclusion, plusieurs cas d'utilisation réussie et une longue liste d'outils et de ressources disponibles pour mettre en œuvre les approches sont présentés.
La
sémantique dans les systèmes adaptatifs et personnalisés comble définitivement l'écart entre la littérature abondante sur les systèmes de recommandation basés sur le contenu, le traitement du langage naturel et les différents types de représentations sensibles à la sémantique.