[Corpora-List] workshop "TALN and pi-languages"

From: geoffrey.williams (geoffrey.williams@wanadoo.fr)
Date: Tue Jan 25 2005 - 16:02:30 MET

  • Next message: Stephen Wan: "[Corpora-List] Student Research Workshop at ACL-05 - FINAL CALL FOR PAPERS"

    I have been asked to post this by a colleague, Chantal Enguehard. All queries should be addressed to her at Chantal.Enguehard@univ-nantes.fr

    ===========================================
        CALL FOR PAPERS for the Workshop

        NLP for Under-Resourced Languages

              Friday, 10 June 2005

             in Dourdan, near Paris
    ============================================

    Held in conjunction with the conference
    TALN 2005 (6-10 June 2005)
    http://www.limsi.fr/TALN05

    Many languages have little or no information technology available: they have no substantial
    presence on the Internet, and existing software has not been adapted for their use.
    These are languages of countries in the developing world (e.g. Wolof in Senegal), or regional
    languages in countries where the first language is a global one (e.g. Breton in France).

    Linguistic work on these languages is often lacking, and must overcome a number of difficulties:
    - the presence of many lexical alternatives
    - multiple spellings for the same word,
    - the lack of exhaustive lexicons,
    - non-standardized transcription methods
    - etc.

    This is why we describe these languages as "under-resourced" or "pi-languages": for political and
    economic reasons they lack sufficient resources in terms of both linguistic study and information
    technology.

    The goal of this workshop is to provide a progress report on techniques being used for Natural
    Language Processing of under-resourced languages.

    THEMES

    Researchers are invited to present work related to any of the following topics:

    - Methods for measuring the level of technology available for a given language - Assessment of
    resources for basic computerization, and standardization of these
      resources (editors, virtual keyboards, printing, sorting, etc.)
    - Collection of corpora and other linguistic resources (lexicons, grammars); the
      role of the Internet, diasporas, unsupervised training algorithms
    - Methodologies for computerization of under-resourced languages (details of
      techniques)
    - Specific technologies (OCR, PDA)
    - Encoding of linguistic data (lexicons, morphology, syntax, and semantics) and
      genericity of formats.
    - Reports concerning the computerization of a particular language or group of
      pi-languages.
    - Architectures for NLP technologies : adaptation of existing technologies to
      pi-languages.
    - Surveys of major problems encountered in this area.

    SELECTION CRITERIA
    ------------------------------
    Authors are invited to submit papers concerning original research. All submissions will be
    examined by at least two specialists in the area. Particular attention will be paid to:

    - appropriateness for the themes of the workshop
    - importance and originality of the contribution
    - validity of the technical and scientific content
    - critical discussion of the results, in particular as they relate
      to other work in the field
    - organization and clarity of the presentation

    The selected articles will be published in the conference proceedings.

    METHODS OF SUBMISSION
    ------------------------------
    * Submitted articles may not exceed 10 pages in Times 12, single-spaced (about 3000 words),
    figures, examples, and references included.
    Articles are to be written in French for French speakers and in English for non-French speakers.

    * A LaTeX style file and Word template file will be available from the conference web site:
    http://www.limsi.fr/TALN05.

    * Articles must be submitted as an attachment to an email with the subject "atelier TALN
    soumission" and containing the title of the article, principal author's name, affiliation, postal
    address, email address, telephone number, and fax number. Send this email to chantal.enguehard@
    univ-nantes.fr.

    * It is IMPERATIVE that one of the following file formats be used, formatted for A4 paper: PS,
    PDF, RTF (Word).

    * In case an email submission is not possible, paper submissions may be accepted. Send 3 paper
    copies of the article to the following address:

    Chantal Enguehard - TALN 2005
    LINA
    2, rue de la Houssinière
    BP 92208
    44322 Nantes Cedex 03
    France

    CALENDAR

    Submission deadline: Thursday, 10 March 2005
    Notification to authors: Tuesday, 5 April 2005
    Final version: Friday, 15 April 2005
    Conference : Friday, 10 June 2005

    PROGRAM COMMITTEE

    . Denis Béchet - Laboratoire d'Informatique Nantes-Atlantique
    . Vincent Berment - Laboratoire Communication Langagière et Interaction
      Personne-Système
    . Christian Boitet - Laboratoire Communication Langagière et Interaction
      Personne-Système
    . Malek Boualem - France Telecom
    . Marcel Diki-Kidiri - Langage, Langues et Cultures d'Afrique Noire . Chantal Enguehard -
    Laboratoire d'Informatique Nantes-Atlantique (President) . Laura Monceaux - Laboratoire
    d'Informatique Nantes-Atlantique
    . Kevin Scannell - Saint Louis University
    . Monique Slodzian - Centre de Recherche en Ingénierie Multilingue

    ============================================
       APPEL A COMMUNICATIONS de l'atelier

            TAL et langues peu dotées

              vendredi 10 juin 2005

         à Dourdan en région parisienne
    ============================================

    Dans le cadre de TALN 2005 (6 au 10 juin 2005)
    http://www.limsi.fr/TALN05

    De nombreuses langues n'ont pas franchi l'étape de l'informatisation : elles sont peu présentes
    sur Internet, les logiciels existants ne sont pas adaptés. Il s'agit de langues de pays en voie de
    développement (comme le wolof au Sénégal par exemple), ou bien de langues régionales dans des pays
    où la langue officielle est une langue de dimension internationale (le breton en France).
    Ces langues souffrent souvent de lacunes dans les travaux linguistiques qui leur sont consacrés et
    doivent faire face à diverses difficultés :
    - présence de nombreuses variantes lexicales,
    - graphies concurrentes pour un même mot,
    - inexistence de lexiques exhaustifs,
    - transcription non complètement standardisée
    - etc.

    C'est pourquoi nous qualifions ces langues de « peu dotées » ou « langues-pi » : elles sont à la
    fois peu informatisées et peu étudiées, que ce soit pour des raisons politiques ou économiques.

    Cet atelier vise à faire le point sur les méthodes à adopter pour développer le Traitement
    Automatique des Langues pour des langues peu dotées.

    THEMES
    Les chercheurs seront invités à présenter des communications autour des thèmes suivants :
    - Méthodes de mesure du niveau d'informatisation d'une langue.
    - Bilan des solutions apportées en informatisation de base, standardisation de ces
      solutions (éditeurs, claviers virtuels, impression , tri lexicographique etc.).
    - Recueil de corpus et de ressources langagières (lexiques, grammaires) : rôle
      d'Internet et des diasporas, apport des algorithmes d'apprentissage.
    - Méthodologie d'informatisation pour les langues-pi (spécificité des techniques
      d'informatisation).
    - Technologies d'actualité (ROC ou PDA).
    - Modélisation des données linguistiques (lexiques, morphologie, syntaxe et
      sémantique) et généricité des formats adoptés.
    - Rapports d'expériences sur l'informatisation d'une langue ou d'un groupe de
      langues-pi.
    - Architectures des technologies de TALN : adaptation des technologies existantes
      aux langues-pi.
    - Panorama des grands types de problèmes linguistiques rencontrés lors du traitement
      automatique de langues-pi.

    CRITERES DE SÉLECTION
    ------------------------------
    Les auteurs sont invités à soumettre des travaux de recherche originaux. Les soumissions seront
    examinées par au moins deux spécialistes du domaine. Seront considérées en particulier:

    - l'adéquation à la thématique de l'atelier.
    - l'importance et l'originalité de la contribution,
    - la correction du contenu scientifique et technique,
    - la discussion critique des résultats, en particulier par rapport aux autres
      travaux du domaine,
    - l'organisation et la clarté de la présentation,

    Les articles sélectionnés seront publiés dans les actes de la conférence.

    MODALITÉS DE SOUMISSION
    -----------------------------------

    * Les articles soumis ne devront pas dépasser 10 pages en Times 12, espacement simple, soit
    environ 3000 mots, figures, exemples et références compris. Les articles seront rédigés en
    français pour les francophones, en anglais pour les non-francophones.

    * Une feuille de style LaTeX et un modèle Word seront disponibles sur le site web de la conférence
    http://www.limsi.fr/TALN05.

    * Les auteurs devront envoyer leur soumission sous la forme d'un document attaché à un courrier
    électronique ayant pour titre "atelier TALN soumission" et contenant le titre de la communication,
    le nom, l'affiliation, l'adresse postale, l'adresse électronique, le numéro de téléphone et le fax
    de l'auteur principal. Adresser ce courrier à chantal.enguehard@univ-nantes.fr

    * L'un des formats suivants devra IMPÉRATIVEMENT être employé : PS, PDF, RTF (Word). Les versions
    devront être au format A4.

    * En cas d'impossibilité d'envoi par courrier électronique, une soumission "papier" pourra être
    admise. 3 exemplaires papier de la contribution devront être envoyés à l'adresse suivante:

         Chantal Enguehard - TALN 2005
         LINA
         2, rue de la Houssinière
         BP 92208
         44322 Nantes Cedex 03
         France

    CALENDRIER

    Date limite de soumission : jeudi 10 mars 2005
    Notification aux auteurs : mardi 5 avril 2005
    Version finale : vendredi 15 avril 2005
    Conférence : vendredi 10 juin 2005

    COMITE DE PROGRAMME

    . Denis Béchet - Laboratoire d'Informatique Nantes-Atlantique
    . Vincent Berment - Laboratoire Communication Langagière et Interaction
      Personne-Système
    . Christian Boitet - Laboratoire Communication Langagière et Interaction
      Personne-Système
    . Malek Boualem - France Telecom
    . Marcel Diki-Kidiri - Langage, Langues et Cultures d'Afrique Noire . Chantal Enguehard -
    Laboratoire d'Informatique Nantes-Atlantique (Présidente) . Laura Monceaux - Laboratoire
    d'Informatique Nantes-Atlantique
    . Kevin Scannell - Saint Louis University
    . Monique Slodzian - Centre de Recherche en Ingénierie Multilingue

    Chantal ENGUEHARD
    LINA
    2, rue de la Houssinière
    BP 92208
    44322 Nantes Cedex 03
    France



    This archive was generated by hypermail 2b29 : Thu Jan 27 2005 - 11:32:47 MET