Corpora: Base de Datos Sintácticos, versión 3.5.1/Syntactic Database, release 3.5.1

From: Paula Santalla del Rio (fempsr@usc.es)
Date: Thu Apr 19 2001 - 11:21:23 MET DST

  • Next message: Jolanta Midor: "Corpora: corpora in french"

    ________________________________________________________________

    Base de Datos Sintácticos del Español Actual (BDS, versión 3.5.1)
    _________________________________________________________________

    El Grupo de investigación en Sintaxis del Español de la Universidad de
    Santiago de Compostela (http://www.sintx.usc.es) acaba de poner a
    disposición de todos los investigadores interesados la "Base de datos
    sintácticos del español" (BDS), resultado del trabajo realizado en los
    últimos diez años. Los datos pueden ser consultados en la dirección

            http://www.bds.usc.es/consultas

    Elaborada gracias a la ayuda financiaciera de la Dirección Xeral de
    Educación y Ordenación Universitaria de la Xunta de Galicia y de la
    Dirección General de Investigación Científica y Técnica del Ministerio de
    Educación, la BDS es el resultado del análisis manual, desde principios
    constitutivos y funcionalistas, de las características sintácticas de las
    casi 160.000 cláusulas contenidas en la parte contemporánea del Archivo de
    Textos Hispánicos de la Universidad de Santiago, constituido por cerca de
    millón y medio de palabras tomadas de textos hispánicos (españoles y
    americanos) de narrativa, ensayo, prensa y teatro, publicados entre 1980 y
    1990, así como transcripciones de lengua oral de la misma época.

    En la construcción de la BDS se ha tomado la cláusula como unidad de
    descripción y el análisis se ha configurado en torno a la forma verbal que
    funciona como predicado. Para cada cláusula se incluyen las
    características sintácticas que hemos considerado relevantes en esta
    primera fase. En primer lugar, hemos registrado información general acerca
    de cada una de las cláusulas: tipo al que pertenece, función que
    desempeña, voz, modalidad, flexión del verbo, argumentos sintácticos
    presentes y orden en que aparecen. A continuación, hemos registrado
    información detallada de cada uno de los argumentos encontrados: tipo de
    unidad estructural, determinación, animación, carácter contable o no
    contable, preposición introductoria, etc. Las posibilidades de consulta
    actualmente abiertas (y las que prevemos desarrollar de modo inmediato)
    están orientadas desde un punto de vista interno, es decir, tienen que ver
    con la estructura interna de las cláusulas organizadas en torno a los
    verbos: esquemas y subesquemas sintácticos en los que los verbos se
    documentan en el corpus, verbos que entran en un esquema o subesquema
    determinado, verbos que se construyen con una determinada preposición,
    etc.

    Se trata, de cualquier modo, de una página y un sistema de consulta en
    desarrollo, por lo que, aparte de pedir disculpas por el hecho de que
    algunas de las opciones de menú no estén todavía activas, agradeceremos
    cualquier sugerencia respecto a posibilidades de consulta que se puedan
    considerar deseables y no hayamos previsto o no hayamos considerado
    prioritarias en esta primera fase de difusión de resultados.

    En la actualidad, con la ayuda financiera de la Secretaría Xeral de
    Investigación e Desenvolvemento de la Xunta de Galicia, la BDS ha entrado
    en su segunda fase, en la que se profundizará en el análisis de los rasgos
    sintácticos y semánticos de las aproximadamente 160.000 cláusulas que
    componen el corpus estudiado.

    _________________________________________________________

    Syntactic Database of Current Spanish (SDB, release 3.5.1)
    __________________________________________________________

    The research group on Spanish Syntax of the University of Santiago de
    Compostela (http://www.sintx.usc.es) makes available for the interested
    researchers the Syntactic Spanish Database (SDB), the result of the work
    carried out by the group throughout the last ten years. The data can be
    looked up in

            http://www.bds.usc.es/consultas

    Developed with the financial support of the Dirección Xeral de Educación y
    Ordenación Universitaria of the Xunta de Galicia and of the Dirección
    General de Investigación Científica y Técnica of the Ministerio de
    Educación, SDB is the result of the manual analysis, having in mind
    constitutional and functional analysis principles, of the syntactic
    characteristics of the almost 160.000 clauses contained in the
    contemporary part of the Hispanic Texts Archive of the University of
    Santiago, constituted by approximately million and a half words of texts
    taken from all the Hispanic countries and including oral samples as well
    as novels, press and theater, all of them published between 1980 and 1990.

    In SDB the primary unit of description has been the clause and the
    analysis has been encoded so as to make obvious the organization of the
    syntactic functions around the verb form functioning as the predicate of
    the clause. For every clause in the database, the syntactic
    characteristics considered relevant in this first stage of development
    have been included. In first place, we have recorded general information
    about the clauses: clause type, clause function, voice, modality, verb
    inflection, syntactic functions found in the clause and order of them.
    Next, we have recorded detailed information about each of the syntactic
    functions found in the clause: type of structural unit, determination,
    animation, countability, preposition introducing the syntactic function,
    etc. Current search possibilities (as well as other not yet fully
    available but already on schedule) are conceived from an internal point of
    view, that is, they are devised so as to show the internal structure of
    clauses organized around verb forms in the corpus: syntactic schemes and
    subschemes of each verb documented in it, verbs documented with one scheme
    or subscheme, verbs requiring one preposition, etc.

    These are, however, a web page and a search interface still under
    development. For this reason, on the one hand, we apologize for the fact
    that certain search options on the menu are not yet ready, and on the
    other, we will be very grateful for any suggestion about search
    possibilities that you miss in the system and to which we have not given
    priority in this first phase of distribution of results.

    Currently, with the financial support of the Secretaría Xeral de
    Investigación e Desenvolvemento of the Xunta de Galicia, SDB has started a
    second phase of development in which we will analyse in depth the
    syntactic and semantic characteristics of the approximately 160.000
    clauses constituting the corpus under study.

    ------------------------------------------------------------------------
    ------------------------------------------------------------------------
    ------------------------------------------------------------------------
     María Paula Santalla del Río

      Dpto. de Lingua Española
      Facultade de Filoloxía, Universidade de Santiago de Compostela
      Avda. Burgo das Nacións, s/n,
      Santiago de Compostela 15782

          Tfno: (+34) 981 575340/563100, ext. 11908
          Fax: (+34) 981 574646
    -----------------------------------------------------------------------
    -----------------------------------------------------------------------
    -----------------------------------------------------------------------



    This archive was generated by hypermail 2b29 : Thu Apr 19 2001 - 11:17:57 MET DST