[Corpora-List] Product Announcement: Canoo's Morphology Software now available for Italian

From: Sandra Wendland (sandra.wendland@canoo.com)
Date: Wed May 21 2003 - 18:00:16 MET DST

  • Next message: Gerhard van Huyssteen: "[Corpora-List] POS tagging without training data?"

    *Deutsche Version siehe unten

    Canoo’s Morphology Software now available for Italian

    Canoo has released the first WMTrans products for Italian. The language technology company recently extended its product range to
    cover further languages. Canoo now offers morphology software for German, English and Italian.

    An Italian version of the
            WMTrans Lemmatizer
            WMTrans Inflection Analyzer
            WMTrans Inflection Analyzer / Generator
    is now available at the product site:
    http://www.canoo.com/wmtrans

    Like their German and English counterparts, the Word Manager Transducers (WMTrans) for Italian provide functionality to analyze and
    generate inflected Italian word forms.

    WMTrans is based on the Canoo morphological dictionaries, containing:
    - more than 250'000 lexemes, generating 3 million fully categorized word forms for German,
    - 50'000 lexemes, generating 115'000 word forms for English,
    - and 50’000 lexemes, generating 456'000 word forms for Italian.

    The dictionaries include information on word formation dependencies, all types of morphological irregularities and spelling
    variants.

    An added benefit for Italian: WMTrans products process verb and pronoun contractions such as "dimmi", "pensandoci", "vattene", and
    "credermelo". This is a powerful advantage and increases the number of recognized Italian word forms to 2'425'000.

    The smart text processing software is used in retrieval and language processing applications. Typical use cases include word
    stemming, intelligent search, text indexing, text mining, language learning, hyperlink generation, spell checking, grammar checking,
    and machine translation.

    The WMTrans Lemmatizer determines the base form of a word and its category. Consider the word form "vattene": The Lemmatizer
    analyses the word, retrieves its base form, andare, and determines the word category, V (verb), plus details about any contractions.

                    query -> vattene
                    result -> andare (Cat V)(Contraction ti/Pron+ne/Pron+V)

    The WMTrans Inflection Analyzer processes any word form, and delivers as a result a rich set of useful information on inflection.

    For example, for the word "spiegatemela", the Inflection Analyzer returns the base form "spiegare" and the word category V (verb),
    plus further morphosyntactic details such as number or verb tense:

                    query -> spiegatemela
                    result -> spiegare
                                    (Cat V)(Aux avere)(Mod Imp)(Pers 2nd)
                                    (Num PL)(Contraction mi/Pron+la/Pron+V)

    WMTrans Inflection Analyzer / Generator offers two function calls. The Analyzer returns morphosyntactic information for an input
    word such as its base form, word category, gender, case, tense, auxiliary verbs. The Generator delivers a list of all word forms
    related to a base form. The word forms are followed by a list of morphosyntactic features related to each single form. See the
    Inflection Analyzer / Generator output for the base form "andare", showing only verb forms in the first person, indicative as set by
    the filter:

                    query -> andare Filter: (Mod Ind)(Pers 1st)
                    result ->
                    andai
                    (Cat V)(Aux essere)(Mod Ind)
                    (Temp Pass-Rem)(Pers 1st)(Num SG)(ID 0-1)
                    andammo
                    (Cat V)(Aux essere)(Mod Ind)
                    (Temp Pass-Rem)(Pers 1st)(Num PL)(ID 0-1)
                    andavo
                    (Cat V)(Aux essere)(Mod Ind)(Temp Impf)
                    (Pers 1st)(Num SG)(ID 0-1)
                    andavamo
                    (Cat V)(Aux essere)(Mod Ind)(Temp Impf)
                    (Pers 1st)(Num PL)(ID 0-1)
                    vado
                    (Cat V)(Aux essere)(Mod Ind)(Temp Pres)
                    (Pers 1st)(Num SG)(ID 0-1)
                    andiamo
                    (Cat V)(Aux essere)(Mod Ind)(Temp Pres)
                    (Pers 1st)(Num PL)(ID 0-1)
                    andrò
                    (Cat V)(Aux essere)(Mod Ind)(Temp Fut)
                    (Pers 1st)(Num SG)(ID 0-1)
                    andremo
                    (Cat V)(Aux essere)(Mod Ind)(Temp Fut)
                    (Pers 1st)(Num PL)(ID 0-1)

    The WMTrans products for Italian are available in Java and run on any platform with Java Runtime Environment (JRE) 1.3 or higher.

    WMTrans product range allows developers to integrate functions such as word stemming, spell checking, and paradigm generation in
    their applications.

    For more information, see
    http://www.canoo.com/wmtrans/
    or contact:
    Elisabeth Maier
    Canoo Engineering AG
    Kirschgartenstr. 7
    CH-4051 Basel
    Tel.: +41 61 228 94 44
    mailto:wmtrans-info@canoo.com

    =====================================================

    Deutsche Version

    =====================================================

    Produktankündigung

    Canoo’s Morphologiesoftware jetzt auch für Italienisch erhältlich

    Canoo hat die WMTrans Produktreihe erweitert und bietet jetzt Morphologiesoftware für Italienisch an. Zusätzlich zu den
    Softwarekomponenten für Deutsch und Englisch ist neu auch Italienisch verfügbar.

    Eine italienische Version des
            WMTrans Lemmatizer
            WMTrans Inflection Analyzer
            WMTrans Inflection Analyzer / Generator
    ist ab sofort erhältlich auf der WMTrans Produkt-Site unter:
    http://www.canoo.com/wmtrans

    Wie die entsprechenden deutschen und englischen Versionen bieten diese Word Manager Transducer (WMTrans) verschiedene Funktionen,
    die flektierte italienische Wortformen analysieren bzw. generieren.

    Basis bilden die Morphologie-Wörterbücher:
    - mit 250'000 Einträgen für Deutsch und der Möglichkeit drei Millionen deutsche Wortformen zu generieren,
    - 50'000 Einträgen für Englisch und der Möglichkeit 115'000 englische Wortformen zu generieren,
    - und 50'000 Einträgen für Italienisch und der Möglichkeit 456'000 italienische Wortformen zu generieren.

    Die Wörterbücher enthalten Details zur Wortbildung, Flexion und Rechtschreibung. Zusätzlich werden Zusammenziehungen von Verb und
    Pronomen wie "dimmi", "pensandoci", "vattene" und "credermelo" erfolgreich analysiert. Dies ist ein wesentlicher Vorteil für
    Italienisch: Die Zahl der möglichen erkannten italienischen Wortformen erhöht sich so auf 2'425'000.

    WMTrans besteht aus einer Reihe von Softwareprodukten zur Aufbereitung und Recherche von Texten bespielsweise in Suchmaschinen und
    Sprachanwendungen.
    Typische Anwendungsbereiche sind Informationsextraktion, intelligente Suche, automatische Indexierung, Text Mining, Spracherwerb,
    Hyperlink-Generierung, Rechtschreibprüfer, Grammatikprogramme und maschinelle Übersetzung.

    Der WMTrans Lemmatizer ermittelt die Grundform eines italienischen Wortes und dessen Wortkategorie. Zum Beispiel: Für die Wortform
    "vattene" findet der Lemmatizer die Grundform "andare" und die Kategorie V (Verb) sowie Details zur Zusammenziehung .

                    query -> vattene
                    result -> andare
                                    (Cat V)(Contraction ti/Pron+ne/Pron+V)

    Der Inflection Analyzer ermittelt neben der Grundform und der Wortklasse eines Wortes zusätzliche grammatikalische und
    orthografische Information.

    Zum Beispiel für das Wort "spiegatemela" liefert der Inflection Analyzer die Grundform "spiegare", die Wortkategorie V (Verb) sowie
    weitere morphosyntaktische Details wie zum Beispiel Numerus und Person:
                    query -> spiegatemela
                    result -> spiegare
                                    (Cat V)(Aux avere)(Mod Imp)(Pers 2nd)
                                    (Num PL)(Contraction mi/Pron+la/Pron+V)

    Der WMTrans Inflection Analyzer / Generator bietet zwei Funktionsaufrufe. Der Analyzer ermittelt die Grundform und Kategorie eines
    Wortes sowie zusätzliche morphosyntaktische Information. Der Generator liefert alle flektierten Wortformen und
    Rechtschreibvarianten für die gegebene Grundform mit einer Liste der jeweiligen morphosyntaktischen Eigenschaften. Das Beispiel
    zeigt für die Grundform "andare" alle Verbformen die mit den Filterangaben 1. Person Indikativ übereinstimmen:

                    query -> andare Filter: (Mod Ind)(Pers 1st)
                    result ->
                    andai
                    (Cat V)(Aux essere)(Mod Ind)
                    (Temp Pass-Rem)(Pers 1st)(Num SG)(ID 0-1)
                    andammo
                    (Cat V)(Aux essere)(Mod Ind)
                    (Temp Pass-Rem)(Pers 1st)(Num PL)(ID 0-1)
                    andavo
                    (Cat V)(Aux essere)(Mod Ind)(Temp Impf)
                    (Pers 1st)(Num SG)(ID 0-1)
                    andavamo
                    (Cat V)(Aux essere)(Mod Ind)(Temp Impf)
                    (Pers 1st)(Num PL)(ID 0-1)
                    vado
                    (Cat V)(Aux essere)(Mod Ind)(Temp Pres)
                    (Pers 1st)(Num SG)(ID 0-1)
                    andiamo
                    (Cat V)(Aux essere)(Mod Ind)(Temp Pres)
                    (Pers 1st)(Num PL)(ID 0-1)
                    andrò
                    (Cat V)(Aux essere)(Mod Ind)(Temp Fut)
                    (Pers 1st)(Num SG)(ID 0-1)
                    andremo
                    (Cat V)(Aux essere)(Mod Ind)(Temp Fut)
                    (Pers 1st)(Num PL)(ID 0-1)

    Die WMTrans Produkte für Italienisch sind in Java erhältlich und laufen auf jeder Plattform mit dem Plug-In Java Runtime Environment
    (JRE) 1.3 oder höher.

    WMTrans bietet Entwicklern die Möglichkeit, Funktionen wie Stemming und Rechtschreibprüfung in ihre Anwendungen zu integrieren.

    Weitere Information unter
    http://www.canoo.com/wmtrans/

    Kontakt:
    Elisabeth Maier
    Canoo Engineering AG
    Kirschgartenstr. 7
    CH-4051 Basel
    Tel.: +41 61 228 94 44
    mailto:wmtrans-info@canoo.com

    --
    Sandra Wendland
    Canoo Engineering AG
    Kirschgartenstrasse 7
    CH-4051 Basel
    Tel. +41 61 228 94 66
    Fax +41 61 228 94 49
    mailto:sandra.wendland@canoo.com
    Web: http://www.canoo.com
    



    This archive was generated by hypermail 2b29 : Wed May 21 2003 - 18:04:26 MET DST