Description du livre
Ce livre en libre accès est une introduction étape par étape sur la façon dont les scripts shell peuvent aider à résoudre de nombreuses tâches de traitement de données auxquelles les spécialistes de la Santé et de la Vie sont confrontés quotidiennement avec un minimum de dépendances logicielles. Les exemples présentés dans le livre montrent comment des outils en ligne de commande simples peuvent être utilisés et combinés pour récupérer des données et du texte à partir de ressources Web, pour filtrer et extraire la littérature, et pour explorer la sémantique codée dans les ontologies biomédicales. pour stocker les données, ce livre s'appuie sur des formats de fichiers texte standard ouverts, tels que TSV, CSV, XML et OWL, qui peuvent être ouverts par tout éditeur ou application tableur.
Les deux premiers chapitres, Introduction et Ressources, fournissent une brève introduction au script shell et décrivent les ressources de données populaires dans les sciences de la santé et de la vie. Le troisième chapitre, Récupération de données, commence par l'introduction d'une tâche commune de traitement des données qui implique de multiples ressources de données. Ensuite, ce chapitre explique comment automatiser chaque étape de cette tâche en introduisant les outils de ligne de commande nécessaires un par un. Le quatrième chapitre, Traitement de texte, montre comment filtrer et analyser le texte en utilisant des techniques simples de comparaison de chaînes de caractères et d'expressions régulières. Le dernier chapitre, Traitement sémantique, montre comment les requêtes XPath et les scripts shell sont capables de traiter des données complexes, comme les graphiques utilisés pour spécifier les ontologies.
En plus d'être presque immuable depuis plus de quatre décennies et d'être disponible sur la plupart de nos ordinateurs personnels, le shell scripting est relativement facile à apprendre par les spécialistes de la Santé et de la Vie comme une séquence de commandes indépendantes. Les comprendre, c'est comme réaliser un nouveau protocole de laboratoire en testant et en comprenant ses étapes procédurales et ses variables, et en combinant leurs résultats intermédiaires. Ainsi, ce livre est particulièrement pertinent pour les spécialistes de la santé et de la vie ou les étudiants qui veulent apprendre facilement comment traiter les données et les textes, et qui, en retour, peuvent les aider et les inspirer à acquérir des compétences bioinformatiques plus profondes à l'avenir.