El etiquetado terminológico del diccionario italiano de palabras compuestas de NooJ
DOI:
https://doi.org/10.35305/an.vi3.20Palabras clave:
NooJ, Léxico-Gramática, diccionarios electrónicos NooJ, palabras compuestas, terminologíaResumen
En este artículo, y en relación con la construcción de diccionarios electrónicos para NooJ, trataremos el etiquetado de palabras compuestas en italiano y cómo se diferencia del de palabras simples en cuanto a métodos, funciones y propósitos. Centraremos especialmente nuestra atención en el etiquetado de palabras compuestas técnico-científicas, demostrando cómo esta operación, en NooJ, representa una herramienta crucial tanto para la extracción de información como para la gestión y representación automática del conocimiento. Además, con la intención de producir un análisis completo, daremos las definiciones de palabra simple y palabra compuesta, tanto desde el punto de vista formal como lingüístico. En cuanto al examen lingüístico, adoptaremos dos enfoques diferentes. Para el primero, utilizaremos los métodos analíticos de Zellig S. Harris, quien por primera vez planteó, en términos estructuralistas y en relación con el inglés, el estudio de la composición de diferentes morfemas en unidades lingüísticas más complejas, por lo tanto, también de grupos de palabras. o frases. Para el segundo, se hará amplia referencia al marco metodológico de formalización de la lengua descrito por el Léxico-Gramática de Maurice Gross, así como a sus posteriores adaptaciones a la lengua italiana. Finalmente, como veremos, será de fundamental importancia para nosotros diferenciar las definiciones que daremos aquí de palabras compuestas de la más genérica y menos precisa de expresiones multipalabras (MWE). Para justificar esta diferenciación aportaremos no sólo indicaciones formales, sino también léxicas, morfosintácticas y semánticas.
Descargas
Citas
Gross G. et alii (1986), Typologie des noms composés, Rapport A.T.P. du C.N.R.S., Paris.
Gross G., Jung, R., Mathieu-Colas, M. (1987). Noms composés, rapport n° 5 du Programme de recherches coordonnées « informatique linguistique », CNRS, Paris.
Gross, M. (1975). Méthodes en syntaxe, Paris, Cantilène.
Gross, M. (1990). Grammaire transformationnelle du français : syntaxe de l'adverbe. Cantilène, Paris.
Harris, Z. S. (1946). “From Morpheme to Utterance”, Language 22, pp. 161-83.
Harris, Z. S. (1970). Papers in Structural and Transformational Linguistics, D. Reidel Publishing Company, Dordrecht, Holland.
Mathieu-Colas, M. (1987). Variations graphiques de mots composés, rapport n° 4 du Programme de recherches coordonnées « informatique linguistique », CNRS, Paris.
Monteleone M., Elia A., De Bueriis G., Di Maio F. (2005). “Le polirematiche dell'italiano”. In De Bueriis, G. (a cura di) Lessici elettronici e descrizioni semantiche, sintattiche e morfologiche. Risultati del Progetto PRIN 2005. Atlanti Tematici Informatici - ALTI, Collana “Lessici & Combinatorie”, n. 2. Dipartimento di Scienze della Comunicazione dell'Università degli Studi di Salerno. Salerno, Plectica.
Piot, M. (1988). Conjonctions de subordination et fixement, Langages n 90, Les expressions figées, Larousse, Paris.
Silberztein, M. (1989). Dictionnaires électroniques et reconnaissance lexicale automatique, thèse de doctorat, LADL, Université Paris VII
Silberztein, M. (2003 - ). The NooJ Manual. Available for download at: http://www.nooj-association.org.
Silberztein, M. (2007). An Alternative Approach to Tagging. Proceedings of NLDB 2007. LNCS Series, Springer-Verlag Eds, 1-11.
Silberztein, M. (2007). Les unités linguistiques et leur annotation automatique. Modèles Linguistiques n. 55.
Silberztein, M. (2016). Formalizing Natural Languages: The NooJ Approach. ISTE Ltd and John Wiley & Sons Inc, London.
Wikipedia Encyclopedia, entry Lexicon-Grammar, available at the page https://en.wikipedia.org/wiki/Lexicon-grammar.
Z. S. Harris Web Site Homepage www.zelligharris.org.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.