Actes de TALN 2014
Éditeur : Brigitte Bigi
Assistantes d’édition : Joëlle Lavaud, Claudia Pichon-Starke
Diffusé par : Laboratoire Parole et Langage, 5 avenue Pasteur, 13100 Aix-en-Provence, France.
ISBN :
Organisée par le LPL (Laboratoire Parole et Langage) et le LIF (Laboratoire d’Informatique Fondamentale), la conférence TALN (Traitement Automatique des Langues Naturelles) a lieu pour son 20ème anniversaire à Marseille (Faculté Saint-Charles, Aix-Marseille Université) du 1er au 4 juillet 2014.
Table des matières
Articles longs
Fouille de données et TAL | |
[O-RI.1] Influence des marqueurs multi-polaires dépendant du domaine pour la fouille d’opinion au niveau du texte | 1 |
Morgane Marchand, Olivier Mesnard, Romaric Besançon, Anne Vilnat | |
[O-RI.3] Influence des domaines de spécialité dans l’extraction de termes-clés | 13 |
Adrien Bougouin, Florian Boudin, Béatrice Daille | |
[O-RI.4] Etiquetage en rôles événementiels fondé sur l’utilisation d’un modèle neuronal | 25 |
Emanuela Boros, Romaric Besançon, Olivier Ferret, Brigitte Grau | |
Sémantique | |
[O-S1.1] Utilisation de représentations de mots pour l’étiquetage de rôles sémantiques suivant FrameNet | 36 |
William Léchelle, Philippe Langlais | |
[O-S1.4] Cross-lingual Word Sense Disambiguation for Predicate Labelling of French | 46 |
Lonneke Van Der Plas, Marianna Apidianaki | |
Parsing 1 | |
[O-P1.1] Améliorer l’étiquetage de “que” par les descripteurs ciblés et les règles | 56 |
Assaf Urieli | |
[O-P1.2] Jouer avec des analyseurs syntaxiques | 67 |
Eric Villemonte De La Clergerie | |
Lexique 1 | |
[O-L1.1] Principes de modélisation systémique des réseaux lexicaux | 79 |
Alain Polguère | |
[O-L1.2] Un modèle pour prédire la complexité lexicale et graduer les mots | 91 |
Nuria Gala, Thomas François, Delphine Bernhard, Cédrick Fairon | |
[O-L1.3] Annotations et inférences de relations dans un réseau lexico-sémantique: Application à la radiologie | 103 |
Lionel Ramadier, Manel Zarrouk, Mathieu Lafourcade, Antoine Micheau | |
Gestion des erreurs en TAL | |
[O-E.1] Correction automatique par résolution d’anaphores pronominales | 113 |
Maud Pironneau, Éric Brunelle, Simon Charest | |
[O-E.2] Peut-on bien chunker avec de mauvaises étiquettes POS ? | 125 |
Iris Eshkol, Isabelle Tellier, Yoann Dupont, Ilaine Wang | |
[O-E.3] Normalisation de textes par analogie: le cas des mots inconnus | 137 |
Marion Baranes, Benoît Sagot | |
Modèles linguistiques | |
[O-F.1] Une évaluation approfondie de différentes méthodes de compositionalité sémantique | 149 |
Antoine Bride, Tim Van de Cruys, Nicholas Asher | |
[O-F.2] Génération de textes : G-TAG revisité avec les Grammaires Catégorielles Abstraites | 161 |
Laurence Danlos, Aleksandre Maskharashvili, Sylvain Pogodalla | |
Méthodes numériques pour le TAL | |
[O-N1.1] Apprentissage partiellement supervisé d’un étiqueteur morpho-syntaxique par transfert cross-lingue | 173 |
Guillaume Wisniewski, Nicolas Pécheux, Elena Knyazeva, Alexandre Allauzen, François Yvon | |
[O-N1.3] Construire un corpus monolingue annoté comparable | 184 |
Nicolas Hernandez | |
[O-N1.4] Vers une approche simplifiée pour introduire le caractère incrémental dans les systèmes de dialogue | 196 |
Hatim Khouzaimi, Romain Laroche, Fabrice Lefevre | |
Lexique 2 | |
[O-L2.1] La base lexicale Démonette : entre sémantique constructionnelle et morphologie dérivationnelle | 208 |
Nabil Hathout, Fiammetta Namer | |
[O-L2.2] Explorer le graphe de voisinage pour améliorer les thésaurus distributionnels |
220 |
Vincent Claveau, Ewa Kijak, Olivier Ferret | |
[O-L2.3] Réduction de la dispersion des données par généralisation des contextes distributionnels : application aux textes de spécialité |
232 |
Amandine Périnet, Thierry Hamon | |
[O-L2.4] Extraction non supervisée de relations sémantiques lexicales |
244 |
Juliette Conrath, Stergos Afantenos, Nicholas Asher, Philippe Muller | |
Traduction Automatique | |
[O-T.1] Modèles de langue neuronaux: une comparaison de plusieurs stratégies d’apprentissage |
256 |
Quoc-Khanh Do, Alexandre Allauzen, François Yvon | |
[O-T.2] Etude de l’impact de la translittération de noms propres sur la qualité de l’alignement de mots à partir de corpus parallèles français-arabe | 268 |
Nasredine Semmar, Houda Saadane | |
[O-T.3] Adaptation thématique pour la traduction automatique de dépêches de presse | 280 |
Souhir Gahbiche-Braham, Hélène Bonneau-Maynard, François Yvon | |
Traitement de corpus | |
[O-S2.1] Étude quantitative des disfluences dans le discours de schizophrènes : automatiser pour limiter les biais | 292 |
Maxime Amblard, Karën Fort | |
[O-S2.2] Repérage et analyse de la reformulation paraphrastique dans les corpus oraux | 304 |
Iris Eshkol-Taravella, Natalia Grabar | |
[O-S2.3] Evaluation d’une approche possibiliste pour la désambiguïsation des textes arabes | 316 |
Raja Ayed, Brahim Bounhas, Bilel Elayeb, Narjès Bellamine, Fabrice Evrard | |
Parsing 2 | |
[O-P2.1] Un analyseur discriminant de la famille LR pour l’analyse en constituants | 328 |
Benoit Crabbé | |
[O-P2.2] Détection automatique de la structure organisationnelle de documents à partir de marqueurs visuels et lexicaux | 340 |
Jean-Philippe Fauconnier, Laurent Sorin, Mouna Kamel, Mustapha Mojahid, Nathalie Aussenac-Gilles | |
[O-P2.3] Jugement exact de grammaticalité d’arbre syntaxique probable | 352 |
Jean-Philippe Prost | |
Lexique 3 | |
[O-L3.1] Annotation sémantique et validation terminologique en texte intégral en SHS | 363 |
Mokhtar-Boumeyden Billami, José Camacho-Collados, Evelyne Jacquey, Laurence Kister | |
[O-L3.2] Identification des noms sous-spécifiés, signaux de l’organisation discursive | 377 |
Charlotte Roze, Thierry Charnois, Dominique Legallois, Stéphane Ferrari, Mathilde Salles |
Articles courts
Traduction | |
[P-T.1] Traduction automatisée d’une oeuvre littéraire: une étude pilote | 389 |
Laurent Besacier | |
[P-T.2] Vers un développement plus efficace des systèmes de traduction statistique : un peu de vert dans un monde de BLEU | 395 |
Li Gong, Aurélien Max, François Yvon | |
[P-T.3] On-going Cooperative Research towards Developing Economy-Oriented Chinese-French SMT Systems with a New SMT Framework | 401 |
Yidong Chen, Lingxiao Wang, Christian Boitet, Xiaodong Shi | |
Lexique 1 | |
[P-L1.1] Extraction automatique de termes combinant différentes informations: linguistique, statistique et Web | 407 |
Juan Antonio Lossio Ventura, Clement Jonquet, Mathieu Roche, Maguelonne Teisseire | |
[P-L1.2] Analyse automatique d’espaces thématiques | 413 |
Gilles Boyé, Anna Kupsc | |
[P-L1.3] Extraction et représentation des constructions à verbe support en espagnol | 419 |
Sandra Castellanos | |
[P-L1.4] Sous-catégorisation en “pour” et syntaxe lexicale |
425 |
Benoît Sagot, Laurence Danlos, Margot Colinet | |
Étiquetage 1 | |
[P-Et1.1] Étiquetage morpho-syntaxique pour des mots nouveaux | 431 |
Ingrid Falk, Delphine Bernhard, Christophe Gérard, Romain Potier-Ferry | |
[P-Et1.2] Méthodes de lissage d’une approche morpho-statistique pour la voyellation automatique des textes arabes | 437 |
Amine Chennoufi, Azzeddine Mazroui | |
[P-Et1.3] De la quenelle culinaire à la quenelle politique : identification de changements sémantiques à l’aide des Topic Models. |
443 |
Ingrid Falk, Delphine Bernhard, Christophe Gérard | |
[P-Et1.4] Détection et correction automatique d’entités nommées dans des corpus OCRisés |
449 |
Benoît Sagot, Kata Gábor | |
Traitement de corpus 1 | |
[P-S1.1] Évaluation d’un système d’extraction de réponses multiples sur le Web par comparaison à des humains | 455 |
Mathieu-Henri Falco, Véronique Moriceau, Anne Vilnat | |
[P-S1.2] Centrality Measures for Non-Contextual Graph-Based Unsupervised Single Document Keyword Extraction | 461 |
Natalie Schluter | |
[P-S1.3] Détection de périodes musicales d’une collection de musique par apprentissage | 467 |
Rémy Kessler, Nicolas Béchet, Audrey Laplante, Dominic Forest | |
[P-S1.4] AMesure: une plateforme de lisibilité pour les textes administratifs | 473 |
Thomas Francois, Laetitia Brouwers, Hubert Naets, Cédrick Fairon | |
Sentiments | |
[P-Se.1] Décomposition des « hash tags » pour l’amélioration de la classification en polarité des « tweets » |
479 |
Caroline Brun, Claude Roux | |
[P-Se.2] Modélisation des questions de l’agent pour l’analyse des affects, jugements et appréciations de l’utilisateur dans les interactions humain-agent | 485 |
Caroline Langlet, Chloé Clavel | |
Outils | |
[P-Ou.1] KNG: un outil pour l’écriture facile de cascades de transducteurs | 491 |
Francois Barthelemy | |
[P-Ou.2] Comparaison de deux outils d’analyse de corpus japonais pour l’aide au linguiste, Sagace et Mecab | 497 |
Blin Raoul | |
[P-Ou.3] Un concordancier multi-niveaux et multimédia pour des corpus oraux | 505 |
Giulia Barreca, George Christodoulides | |
Étiquetage 2 | |
[P-Et2.1] Simulation de l’apprentissage des contextes nominaux/verbaux par n-grammes | 511 |
Perrine Brusini, Pascal Amsili, Emmanuel Chemla, Anne Christophe | |
[P-Et2.2] Impact de la nature et de la taille des corpus d’apprentissage sur les performances dans la détection automatique des entités nommées | 517 |
Anaïs Ollagnier, Sébastien Fournier, Patrice Bellot, Frédéric Béchet | |
[P-Et2.3] RENAM: Système de Reconnaissance des Entités Nommées Amazighes | 523 |
Meryem Talha, Siham Boulaknadel, Driss Aboutajdine | |
Langue des signes | |
[P-LS.1] Grammaire récursive non linéaire pour les langues des signes | 531 |
Michael Filhol | |
[P-LS.2] Vers un traitement automatique en soutien d’une linguistique exploratoire des LS |
537 |
Rémi Dubot, Arturo Curiel, Christophe Collet | |
Résumé automatique | |
[P-R.2] Résumé Automatique Multilingue Expérimentations sur l’Anglais, l’Arabe et le Français | 543 |
Houda Oufaida, Omar Nouali, Philippe Blache | |
[P-R.3] Porting a Summarizer to the French Language | 550 |
Rémi Bois, Johannes Leveling, Lorraine Goeuriot, Gareth Jones, Liadh Kelly | |
Corpus | |
[P-C.1] Extraction de données orales multi-annotées | 556 |
Brigitte Bigi, Tatsuya Watanabe | |
[P-C.2] Annotation de la temporalité en corpus : contribution à l’amélioration de la norme TimeML | 562 |
Anaïs Lefeuvre, Jean-Yves Antoine, Agata Savary, Emmanuel Schang, Lotfi Abouda, Denis Maurel, Iris Eshkol | |
[P-C.3] Identification automatique de zones dans des documents pour la constitution d’un corpus médical en français | 568 |
Louise Deleger, Aurélie Névéol | |
[P-C.4] Un schéma d’annotation en dépendances syntaxiques profondes pour le français | 574 |
Guy Perrier, Marie Candito, Bruno Guillaume, Corentin Ribeyre, Karën Fort, Djamé Seddah | |
Traitement de corpus 2 | |
[P-S2.1] Analyse argumentative du corpus de l’ACL (ACL Anthology) | 580 |
Elisa Omodei, Yufan Guo, Jean-Philippe Cointet, Thierry Poibeau | |
Lexique 2 | |
[P-L2.1] Intégration relationnelle des exemples lexicographiques dans un réseau lexical | 586 |
Veronika Lux-Pogodalla | |
[P-L2.2] Les couleurs des gens | 592 |
Mathieu Lafourcade, Nathalie Le Brun, Virginie Zampa | |
[P-L2.3] Induction de sens pour enrichir des ressources lexicales | 598 |
Mohammad Nasiruddin, Didier Schwab, Andon Tchechmedjiev, Gilles Serasset, Hervé Blanchon | |
[P-L2.4] Un dictionnaire et une grammaire de composés français | 604 |
François Trouilleux |