Dòng
|
Nội dung
|
1
|
|
2
|
|
3
|
|
4
|
Analyse contrastive des noms sous-spécifiés à l’oral et à l’écrit à partir d’une extraction automatique / Lydia-Mai Ho-Dac, Aleksandra Miletić
// Langages Nº 219 (3/2020) France : Armand Colin, 2020p.117-132 Cet article présente une analyse contrastive visant à décrire le comportement des noms sousspécifiés dans le Corpus d’Étude pour le Français Contemporain (CÉFC). S’appuyant sur les annotations morpho-syntaxiques et syntaxiques fournies par le corpus, notre méthode propose une extraction systématique de patrons lexico-syntaxiques et une évaluation de cette extraction fondée sur une annotation manuelle. Les résultats sont discutés en tenant compte des trois modalités présentes dans le corpus (communications orales, communications médiées par les réseaux et communications écrites) et offrent un regard nouveau sur le comportement des noms sous-spécifiés.
|
5
|
Annotation syntaxique automatique de la partie orale du CÉFC / Alexis Nasr, Franck Dary, Frédéric Béchet, Benoit Favre
// Langages Nº 219 (3/2020) France : Armand Colin, 2020p. 87-102 Cet article présente les outils informatiques, développés dans le cadre du projet ORFÉO, qui permettent de prédire de manière automatique les annotations linguistiques, en particulier les parties de discours, les lemmes, les dépendances syntaxiques et la segmentation des énoncés. Deux points importants sont mis en avant. Le premier est la segmentation en énoncés, qui est un problème difficile du traitement linguistique de l’oral. Nous montrons que la prise en compte de la syntaxe permet d’obtenir de bonnes performances de segmentation. Le second concerne la prise en compte de métadonnées dans les outils afin d’adapter ces derniers à la variété des données collectées. Les résultats obtenus sur le corpus de référence valident les approches proposées et permettent d’estimer la qualité des annotations produites automatiquement sur la portion du Corpus d’Étude pour le Français Contemporain (CÉFC) non validée manuellement.
|
|
|
|
|