Comment annoter et faire des graphes avec Le Trameur…

On a voulu établir des relations entre les entités nommées extraites dans BaO 3... Malheureusement la BaO 4 utilise une méthode qui n'est pas appropriée à la nature de nos fichiers... C'est pour cela que nous avons décidé d'utiliser Le Trameur (!) Il existe plusieurs manières d'annoter un texte en utilisant Le Trameur... Tout d'abord, on … Lire la suite de Comment annoter et faire des graphes avec Le Trameur…

BaO 3 – Recherche des patrons…

A) Traitement des fichiers étiquetés avec Cordial : le script d’Axel On ouvre les fichiers motif.txt et 3210.cnr en lecture. On stocke les patrons contenus dans motif.txt dans une table de hachage (les patrons sont les valeurs). On lit le fichier 3210.cnr ligne à ligne. On ne s’occupe que des lignes qui respectent le modèle mot … Lire la suite de BaO 3 – Recherche des patrons…

BaO 2 – Etiquetage…

---------------- Programme principal ---------------- Déclaration des variables: $rep, le nom du répertoire dans lequel on va aller chercher les fichiers à traiter $type, le fichier particulier qu'on veut traiter $dico, une variable associée au tableau qu'on utilisera par la suite pour vérifier si les data qu'on a stockées étaient déjà récupérées my $rep = "$ARGV[0]"; … Lire la suite de BaO 2 – Etiquetage…

BaO 1 – Parcours de l’arborescence et extraction du texte…

---------------- Programme principal ---------------- Déclaration des variables: $rep, le nom du répertoire dans lequel on va aller chercher les fichiers à traiter $type, le fichier particulier qu'on veut traiter $dico, une variable associée au tableau qu'on utilisera par la suite pour vérifier si les data qu'on a stockées étaient déjà récupérées my $rep = "$ARGV[0]"; … Lire la suite de BaO 1 – Parcours de l’arborescence et extraction du texte…

Open … close

#!/usr/bin/perl #chemin absolu pour localiser perl # implicitement ouverture en lecture en spécifiant l'encodage open (FICHIER, "<:encoding(iso-8859-1)", "toto.txt"); # Auparavant, on faisait cela FICHIER: descripteur handler (peut être nommé n'importe comment), nom du fichier # pour le fermer: close FICHIER; $filename = "2008/Jan/1/19-00-00/0,2-3208,1-0,0.xml"; # il est conseillé d'utiliser ceci pour l'ouverture d'un fichier (syntaxe moderne) # … Lire la suite de Open … close