Dòng Nội dung
1
Annotation syntaxique du français parlé : Les choix d’ORFÉO / Sylvain Kahane, Kim Gerdes // Langages Nº 219 (3/2020)
France : Armand Colin, 2020
p. 69-86

Cet article présente les choix d’annotation syntaxique dans le cadre du projet ORFÉO. Un corpus de français parlé de plus de 180 000 mots a été annoté en syntaxe de dépendance à la main, puis un corpus de 3 millions de mots a été analysé automatiquement. Les choix d’annotation sont comparés avec ceux du projet RHAPSODIE, qui a précédé ORFÉO, avec UNIVERSAL DEPENDENCIES (UD), qui a démarré un peu après ORFÉO, et avec SURFACE-SYNTACTIC UD (SUD), qui est une synthèse des choix d’ORFÉO et d’UD. ORFÉO se caractérise par une prise en compte de la macrosyntaxe et des phénomènes de listes, ainsi que par un ‹tag set› restreint qui a permis une annotation rapide et plus facilement reproductible.