On a voulu établir des relations entre les entités nommées extraites dans BaO 3... Malheureusement la BaO 4 utilise une méthode qui n'est pas appropriée à la nature de nos fichiers... C'est pour cela que nous avons décidé d'utiliser Le Trameur (!) Il existe plusieurs manières d'annoter un texte en utilisant Le Trameur... Tout d'abord, on … Lire la suite de Comment annoter et faire des graphes avec Le Trameur…
BaO 3 – Recherche des patrons…
A) Traitement des fichiers étiquetés avec Cordial : le script d’Axel On ouvre les fichiers motif.txt et 3210.cnr en lecture. On stocke les patrons contenus dans motif.txt dans une table de hachage (les patrons sont les valeurs). On lit le fichier 3210.cnr ligne à ligne. On ne s’occupe que des lignes qui respectent le modèle mot … Lire la suite de BaO 3 – Recherche des patrons…
Problèmes d’encodage
Un petit aparté pour vous parler du monde merveilleux des encodages ! 😉 La Bao1 a produit un fichier texte au format utf-8 dont on devait se servir pour l'étiquetage avec Cordial. Or, la version de Cordial que nous avons (Cordial v6) ne supporte que des fichiers au format iso. On a donc essayé d'inclure … Lire la suite de Problèmes d’encodage
BaO 2 – Etiquetage…
---------------- Programme principal ---------------- Déclaration des variables: $rep, le nom du répertoire dans lequel on va aller chercher les fichiers à traiter $type, le fichier particulier qu'on veut traiter $dico, une variable associée au tableau qu'on utilisera par la suite pour vérifier si les data qu'on a stockées étaient déjà récupérées my $rep = "$ARGV[0]"; … Lire la suite de BaO 2 – Etiquetage…
Création du site final…
Bonjour à tous ! Ça fait longtemps qu'on n'a pas mis d'articles sur le weblog ! Veuillez nous excuser pour cela, c'est inadmissible on le sait bien ! Mais ... cela ne veut pas dire qu'on n'a pas avancé sur notre projet ! Morgane va bientôt vous mettre au point sur BaO 3, alors que … Lire la suite de Création du site final…
BaO 1 – Parcours de l’arborescence et extraction du texte…
---------------- Programme principal ---------------- Déclaration des variables: $rep, le nom du répertoire dans lequel on va aller chercher les fichiers à traiter $type, le fichier particulier qu'on veut traiter $dico, une variable associée au tableau qu'on utilisera par la suite pour vérifier si les data qu'on a stockées étaient déjà récupérées my $rep = "$ARGV[0]"; … Lire la suite de BaO 1 – Parcours de l’arborescence et extraction du texte…
Lecture d’un fichier
# pour lire en Perl on va encadrer le descripteur qu'on a choisi avec des chevrons < > (par défaut ligne par ligne) $ligne = <$fichier>; print "$ligne"; # il lit TOUS les caractères d'une ligne; y compris \n ! $ligne = <$fichier>; # booléen: renvoie soit true soit false (si ça s'est bien passé … Lire la suite de Lecture d’un fichier
Open … close
#!/usr/bin/perl #chemin absolu pour localiser perl # implicitement ouverture en lecture en spécifiant l'encodage open (FICHIER, "<:encoding(iso-8859-1)", "toto.txt"); # Auparavant, on faisait cela FICHIER: descripteur handler (peut être nommé n'importe comment), nom du fichier # pour le fermer: close FICHIER; $filename = "2008/Jan/1/19-00-00/0,2-3208,1-0,0.xml"; # il est conseillé d'utiliser ceci pour l'ouverture d'un fichier (syntaxe moderne) # … Lire la suite de Open … close
Un premier semestre de PERL…
...ça donne ça : La base : my ($a) = @_; la fonction dont on définit les arguments sous Perl my ($a, $b, $c) = @_ ; pour définir plusieurs arguments return $a + $b; $ pour bien montrer qu'il s'agit d'une variable ; un nombre, une chaîne de caractères chomp($a = <>); chomp = une … Lire la suite de Un premier semestre de PERL…
Introduction à PERL
#!/usr/bin/perl # chemin absolu pour localiser perl # Ceci est une ligne de commentaire print "\n *** Bonjour Perl! ***\n\n"; $a = 1; $b = "s"; print "Voici la première variable \$a: $a\n\nVoici la seconde variable \$b: $b\n"; # l'antislash empêche l'interpellation # listes de scalaires (tableaux) @A = (1, "un", $a); print @A, "\n"; … Lire la suite de Introduction à PERL