Actes de TALN 2014
Éditeur : Brigitte Bigi
              Assistantes d’édition : Joëlle Lavaud, Claudia Pichon-Starke
              Diffusé par : Laboratoire Parole et Langage, 5 avenue Pasteur, 13100 Aix-en-Provence, France.
              ISBN : 
Organisée par le LPL (Laboratoire Parole et Langage) et le LIF (Laboratoire d’Informatique Fondamentale), la conférence TALN (Traitement Automatique des Langues Naturelles) a lieu pour son 20ème anniversaire à Marseille (Faculté Saint-Charles, Aix-Marseille Université) du 1er au 4 juillet 2014.
Table des matières
Articles longs
| Fouille de données et TAL | |
| [O-RI.1] Influence des marqueurs multi-polaires dépendant du domaine pour la fouille d’opinion au niveau du texte | 1 | 
| Morgane Marchand, Olivier Mesnard, Romaric Besançon, Anne Vilnat | |
| [O-RI.3] Influence des domaines de spécialité dans l’extraction de termes-clés | 13 | 
| Adrien Bougouin, Florian Boudin, Béatrice Daille | |
| [O-RI.4] Etiquetage en rôles événementiels fondé sur l’utilisation d’un modèle neuronal | 25 | 
| Emanuela Boros, Romaric Besançon, Olivier Ferret, Brigitte Grau | |
| Sémantique | |
| [O-S1.1] Utilisation de représentations de mots pour l’étiquetage de rôles sémantiques suivant FrameNet | 36 | 
| William Léchelle, Philippe Langlais | |
| [O-S1.4] Cross-lingual Word Sense Disambiguation for Predicate Labelling of French | 46 | 
| Lonneke Van Der Plas, Marianna Apidianaki | |
| Parsing 1 | |
| [O-P1.1] Améliorer l’étiquetage de “que” par les descripteurs ciblés et les règles | 56 | 
| Assaf Urieli | |
| [O-P1.2] Jouer avec des analyseurs syntaxiques | 67 | 
| Eric Villemonte De La Clergerie | |
| Lexique 1 | |
| [O-L1.1] Principes de modélisation systémique des réseaux lexicaux | 79 | 
| Alain Polguère | |
| [O-L1.2] Un modèle pour prédire la complexité lexicale et graduer les mots | 91 | 
| Nuria Gala, Thomas François, Delphine Bernhard, Cédrick Fairon | |
| [O-L1.3] Annotations et inférences de relations dans un réseau lexico-sémantique: Application à la radiologie | 103 | 
| Lionel Ramadier, Manel Zarrouk, Mathieu Lafourcade, Antoine Micheau | |
| Gestion des erreurs en TAL | |
| [O-E.1] Correction automatique par résolution d’anaphores pronominales | 113 | 
| Maud Pironneau, Éric Brunelle, Simon Charest | |
| [O-E.2] Peut-on bien chunker avec de mauvaises étiquettes POS ? | 125 | 
| Iris Eshkol, Isabelle Tellier, Yoann Dupont, Ilaine Wang | |
| [O-E.3] Normalisation de textes par analogie: le cas des mots inconnus | 137 | 
| Marion Baranes, Benoît Sagot | |
| Modèles linguistiques | |
| [O-F.1] Une évaluation approfondie de différentes méthodes de compositionalité sémantique | 149 | 
| Antoine Bride, Tim Van de Cruys, Nicholas Asher | |
| [O-F.2] Génération de textes : G-TAG revisité avec les Grammaires Catégorielles Abstraites | 161 | 
| Laurence Danlos, Aleksandre Maskharashvili, Sylvain Pogodalla | |
| Méthodes numériques pour le TAL | |
| [O-N1.1] Apprentissage partiellement supervisé d’un étiqueteur morpho-syntaxique par transfert cross-lingue | 173 | 
| Guillaume Wisniewski, Nicolas Pécheux, Elena Knyazeva, Alexandre Allauzen, François Yvon | |
| [O-N1.3] Construire un corpus monolingue annoté comparable | 184 | 
| Nicolas Hernandez | |
| [O-N1.4] Vers une approche simplifiée pour introduire le caractère incrémental dans les systèmes de dialogue | 196 | 
| Hatim Khouzaimi, Romain Laroche, Fabrice Lefevre | |
| Lexique 2 | |
| [O-L2.1] La base lexicale Démonette : entre sémantique constructionnelle et morphologie dérivationnelle | 208 | 
| Nabil Hathout, Fiammetta Namer | |
| [O-L2.2] Explorer le graphe de voisinage pour améliorer les thésaurus distributionnels | 220 | 
| Vincent Claveau, Ewa Kijak, Olivier Ferret | |
| [O-L2.3] Réduction de la dispersion des données par généralisation des contextes distributionnels : application aux textes de spécialité | 232 | 
| Amandine Périnet, Thierry Hamon | |
| [O-L2.4] Extraction non supervisée de relations sémantiques lexicales | 244 | 
| Juliette Conrath, Stergos Afantenos, Nicholas Asher, Philippe Muller | |
| Traduction Automatique | |
| [O-T.1] Modèles de langue neuronaux: une comparaison de plusieurs stratégies d’apprentissage | 256 | 
| Quoc-Khanh Do, Alexandre Allauzen, François Yvon | |
| [O-T.2] Etude de l’impact de la translittération de noms propres sur la qualité de l’alignement de mots à partir de corpus parallèles français-arabe | 268 | 
| Nasredine Semmar, Houda Saadane | |
| [O-T.3] Adaptation thématique pour la traduction automatique de dépêches de presse | 280 | 
| Souhir Gahbiche-Braham, Hélène Bonneau-Maynard, François Yvon | |
| Traitement de corpus | |
| [O-S2.1] Étude quantitative des disfluences dans le discours de schizophrènes : automatiser pour limiter les biais | 292 | 
| Maxime Amblard, Karën Fort | |
| [O-S2.2] Repérage et analyse de la reformulation paraphrastique dans les corpus oraux | 304 | 
| Iris Eshkol-Taravella, Natalia Grabar | |
| [O-S2.3] Evaluation d’une approche possibiliste pour la désambiguïsation des textes arabes | 316 | 
| Raja Ayed, Brahim Bounhas, Bilel Elayeb, Narjès Bellamine, Fabrice Evrard | |
| Parsing 2 | |
| [O-P2.1] Un analyseur discriminant de la famille LR pour l’analyse en constituants | 328 | 
| Benoit Crabbé | |
| [O-P2.2] Détection automatique de la structure organisationnelle de documents à partir de marqueurs visuels et lexicaux | 340 | 
| Jean-Philippe Fauconnier, Laurent Sorin, Mouna Kamel, Mustapha Mojahid, Nathalie Aussenac-Gilles | |
| [O-P2.3] Jugement exact de grammaticalité d’arbre syntaxique probable | 352 | 
| Jean-Philippe Prost | |
| Lexique 3 | |
| [O-L3.1] Annotation sémantique et validation terminologique en texte intégral en SHS | 363 | 
| Mokhtar-Boumeyden Billami, José Camacho-Collados, Evelyne Jacquey, Laurence Kister | |
| [O-L3.2] Identification des noms sous-spécifiés, signaux de l’organisation discursive | 377 | 
| Charlotte Roze, Thierry Charnois, Dominique Legallois, Stéphane Ferrari, Mathilde Salles | 
Articles courts
| Traduction | |
| [P-T.1] Traduction automatisée d’une oeuvre littéraire: une étude pilote | 389 | 
| Laurent Besacier | |
| [P-T.2] Vers un développement plus efficace des systèmes de traduction statistique : un peu de vert dans un monde de BLEU | 395 | 
| Li Gong, Aurélien Max, François Yvon | |
| [P-T.3] On-going Cooperative Research towards Developing Economy-Oriented Chinese-French SMT Systems with a New SMT Framework | 401 | 
| Yidong Chen, Lingxiao Wang, Christian Boitet, Xiaodong Shi | |
| Lexique 1 | |
| [P-L1.1] Extraction automatique de termes combinant différentes informations: linguistique, statistique et Web | 407 | 
| Juan Antonio Lossio Ventura, Clement Jonquet, Mathieu Roche, Maguelonne Teisseire | |
| [P-L1.2] Analyse automatique d’espaces thématiques | 413 | 
| Gilles Boyé, Anna Kupsc | |
| [P-L1.3] Extraction et représentation des constructions à verbe support en espagnol | 419 | 
| Sandra Castellanos | |
| [P-L1.4] Sous-catégorisation en “pour” et syntaxe lexicale | 425 | 
| Benoît Sagot, Laurence Danlos, Margot Colinet | |
| Étiquetage 1 | |
| [P-Et1.1] Étiquetage morpho-syntaxique pour des mots nouveaux | 431 | 
| Ingrid Falk, Delphine Bernhard, Christophe Gérard, Romain Potier-Ferry | |
| [P-Et1.2] Méthodes de lissage d’une approche morpho-statistique pour la voyellation automatique des textes arabes | 437 | 
| Amine Chennoufi, Azzeddine Mazroui | |
| [P-Et1.3] De la quenelle culinaire à la quenelle politique : identification de changements sémantiques à l’aide des Topic Models. | 443 | 
| Ingrid Falk, Delphine Bernhard, Christophe Gérard | |
| [P-Et1.4] Détection et correction automatique d’entités nommées dans des corpus OCRisés | 449 | 
| Benoît Sagot, Kata Gábor | |
| Traitement de corpus 1 | |
| [P-S1.1] Évaluation d’un système d’extraction de réponses multiples sur le Web par comparaison à des humains | 455 | 
| Mathieu-Henri Falco, Véronique Moriceau, Anne Vilnat | |
| [P-S1.2] Centrality Measures for Non-Contextual Graph-Based Unsupervised Single Document Keyword Extraction | 461 | 
| Natalie Schluter | |
| [P-S1.3] Détection de périodes musicales d’une collection de musique par apprentissage | 467 | 
| Rémy Kessler, Nicolas Béchet, Audrey Laplante, Dominic Forest | |
| [P-S1.4] AMesure: une plateforme de lisibilité pour les textes administratifs | 473 | 
| Thomas Francois, Laetitia Brouwers, Hubert Naets, Cédrick Fairon | |
| Sentiments | |
| [P-Se.1] Décomposition des « hash tags » pour l’amélioration de la classification en polarité des « tweets » | 479 | 
| Caroline Brun, Claude Roux | |
| [P-Se.2] Modélisation des questions de l’agent pour l’analyse des affects, jugements et appréciations de l’utilisateur dans les interactions humain-agent | 485 | 
| Caroline Langlet, Chloé Clavel | |
| Outils | |
| [P-Ou.1] KNG: un outil pour l’écriture facile de cascades de transducteurs | 491 | 
| Francois Barthelemy | |
| [P-Ou.2] Comparaison de deux outils d’analyse de corpus japonais pour l’aide au linguiste, Sagace et Mecab | 497 | 
| Blin Raoul | |
| [P-Ou.3] Un concordancier multi-niveaux et multimédia pour des corpus oraux | 505 | 
| Giulia Barreca, George Christodoulides | |
| Étiquetage 2 | |
| [P-Et2.1] Simulation de l’apprentissage des contextes nominaux/verbaux par n-grammes | 511 | 
| Perrine Brusini, Pascal Amsili, Emmanuel Chemla, Anne Christophe | |
| [P-Et2.2] Impact de la nature et de la taille des corpus d’apprentissage sur les performances dans la détection automatique des entités nommées | 517 | 
| Anaïs Ollagnier, Sébastien Fournier, Patrice Bellot, Frédéric Béchet | |
| [P-Et2.3] RENAM: Système de Reconnaissance des Entités Nommées Amazighes | 523 | 
| Meryem Talha, Siham Boulaknadel, Driss Aboutajdine | |
| Langue des signes | |
| [P-LS.1] Grammaire récursive non linéaire pour les langues des signes | 531 | 
| Michael Filhol | |
| [P-LS.2] Vers un traitement automatique en soutien d’une linguistique exploratoire des LS | 537 | 
| Rémi Dubot, Arturo Curiel, Christophe Collet | |
| Résumé automatique | |
| [P-R.2] Résumé Automatique Multilingue Expérimentations sur l’Anglais, l’Arabe et le Français | 543 | 
| Houda Oufaida, Omar Nouali, Philippe Blache | |
| [P-R.3] Porting a Summarizer to the French Language | 550 | 
| Rémi Bois, Johannes Leveling, Lorraine Goeuriot, Gareth Jones, Liadh Kelly | |
| Corpus | |
| [P-C.1] Extraction de données orales multi-annotées | 556 | 
| Brigitte Bigi, Tatsuya Watanabe | |
| [P-C.2] Annotation de la temporalité en corpus : contribution à l’amélioration de la norme TimeML | 562 | 
| Anaïs Lefeuvre, Jean-Yves Antoine, Agata Savary, Emmanuel Schang, Lotfi Abouda, Denis Maurel, Iris Eshkol | |
| [P-C.3] Identification automatique de zones dans des documents pour la constitution d’un corpus médical en français | 568 | 
| Louise Deleger, Aurélie Névéol | |
| [P-C.4] Un schéma d’annotation en dépendances syntaxiques profondes pour le français | 574 | 
| Guy Perrier, Marie Candito, Bruno Guillaume, Corentin Ribeyre, Karën Fort, Djamé Seddah | |
| Traitement de corpus 2 | |
| [P-S2.1] Analyse argumentative du corpus de l’ACL (ACL Anthology) | 580 | 
| Elisa Omodei, Yufan Guo, Jean-Philippe Cointet, Thierry Poibeau | |
| Lexique 2 | |
| [P-L2.1] Intégration relationnelle des exemples lexicographiques dans un réseau lexical | 586 | 
| Veronika Lux-Pogodalla | |
| [P-L2.2] Les couleurs des gens | 592 | 
| Mathieu Lafourcade, Nathalie Le Brun, Virginie Zampa | |
| [P-L2.3] Induction de sens pour enrichir des ressources lexicales | 598 | 
| Mohammad Nasiruddin, Didier Schwab, Andon Tchechmedjiev, Gilles Serasset, Hervé Blanchon | |
| [P-L2.4] Un dictionnaire et une grammaire de composés français | 604 | 
| François Trouilleux |