# Lingüista computacional

## Qué hace una lingüista computacional

En una frase: son profesionales con formación o sensibilidad lingüística (Filología, Traducción e Interpretación, Lingüística...) que son capaces de trabajar en un entorno técnico. Esto en la práctica y dependiendo del puesto quiere decir que utilizan archivos de texto plano, scripts, bases de datos, corpus, etc. parar aportar al proyecto sus conocimientos de lingüística.

Competencias que se suelen buscar en una lingüista computacional:

* Buen nivel de inglés
* Programación, siendo las más importantes:
  * Expresiones regulares
  * Operadores booleanos
  * Scraping
  * Manejo de bases de datos
  * Manejo de ontologías

Tareas que una lingüista computacional suele realizar:

* Anotación de todo tipo de fenómenos lingüísticos
* Formalización de fenómenos lingüísticos en reglas
* Evaluación de modelos lingüísticos

## Recursos motivacionales 💡

Para saber en detalle qué es el procesamiento del lenguaje natural (PLN), el campo en que trabajan las lingüistas computacionales, y si esto es lo que te gusta.

* [Todo lo que un filólogo no sabe que sabe hacer](https://www.youtube.com/watch?v=v994qTtZvrk). Charla de Elena Álvarez Mellado en la Universidad de La Rioja, 2013.
* [How To Think Like A Programmer](https://www.youtube.com/watch?v=azcrPFhaY9k). Charla de Andy Harris en IndyPy, 2016. En inglés.
* [Cómo hacerse una carrera en #NLProc](http://vitojph.github.io/misc/lingwars/index.html). Diapositivas de la charla de Víctor Peinado en Lingwars, 2017.
* [Learning to Code with a Humanities Background: Is it Possible?](https://www.coursereport.com/blog/oh-the-humanities-reflections-on-learning-to-code-with-a-humanities-background) Entrevistas a 5 programadoras con perfil humanístico, 2018. En inglés.
* [Linguists are scientists too](https://www.youtube.com/watch?v=LqyGtuKyjps). Charla de Ona de Gibert Bonet en el BSC Annual Meeting, 2020. En inglés.
* [¿Por qué programas, si tú eras de letras?](https://www.youtube.com/watch?v=BtgXR5y3uM0) Charla de Carmen Torrijos en TEDxMálaga, 2021.

## Recursos técnicos 📚

### Libros

* [NLTK book](https://www.nltk.org/book/). NLTK es una librería de Python para facilitar ciertas tareas del PLN y tiene un libro muy didáctico orientado a quien no sabe programar. En inglés.

### Tutoriales

* [RegexOne](https://regexone.com/). Tutorial interactivo para aprender expresiones regulares. En inglés.
* [Canal de Carlota de Benito Moreno](https://www.youtube.com/channel/UCB1GcWpIhIV6JZmGNlX72Mw/videos). Tutoriales para usar R para tratar datos lingüísticos.

### Cursos gratuitos

*
* [Curso de iniciación a Python para lingüistas](https://www.youtube.com/watch?v=lbkUdVb47-A\&list=PL660tlxaW8vML3baj0UJ-a3aKnFvD0Nq3) de Mario Casado. En vídeo.
* [Curso de introducción a la programación para humanistas](https://github.com/nimbusaeta/lingufriendly) de Leticia Martín-Fuertes. Repositorio de cuadernos Jupyter.

### Másteres

* [Máster universitario en las Tecnologías de la Información y la Comunicación en la Enseñanza y el Tratamiento de Lenguas (UNED)](http://portal.uned.es/portal/page?_pageid=93,69881636&_dad=portal&_schema=PORTAL\&idTitulacion=240901)
* [Máster universitario en Tecnologías del Lenguaje (UNED)](http://portal.uned.es/portal/page?_pageid=93,69878398&_dad=portal&_schema=PORTAL\&idMaster=310701)
* [Máster en Análisis y Procesamiento del Lenguaje (UPV)](https://www.ehu.eus/es/web/master/master-analisis-procesamiento-lenguaje)
* [Máster Universitario en Letras Digitales: Estudios Avanzados en Textualidades Electrónicas (UCM)](https://www.ucm.es/master-letrasdigitales/presentacion)
* [Máster en Data Science (UAH)](https://www.uah.es/es/estudios/estudios-propios/posgrados-propios/Master-en-Data-Science/)
* [Posgrado en Tecnologías de la Información para la Sociedad Digital: Humanidades y Ciencia (UNED)](https://formacionpermanente.uned.es/tp_actividad/idactividad/10576)
* [Máster de Ciencia Cognitiva y Lenguaje (UB)](http://www.ub.edu/estudis/es/mastersuniversitaris/ccil/presentacion)

## A quién seguir ⏩

* [Elena Álvarez Mellado](https://twitter.com/lirondos/)
* [Víctor Peinado](http://vitojph.github.io/)
* [Irati Hurtado](https://www.linkedin.com/in/iratihurtado/recent-activity/)
* [Riva Quiroga](https://twitter.com/rivaquiroga)
* [Carmen Torrijos](https://www.linkedin.com/in/carmen-torrijos-b447a632/recent-activity/)
* [Elena González-Blanco](https://twitter.com/elenagbg)
* [Cristina Aranda](https://twitter.com/cris_aranda_)

## Comunidades

Gente que organiza charlas, cursos, grupos de trabajo... en torno al PLN en español.

* [NLP Spain](https://www.meetup.com/es-ES/nlp-spain/)
* [Somos NLP](https://somosnlp.org/)

## Otras recopilaciones 📝

* [Awesome NLP](https://github.com/keon/awesome-nlp). Repositorio de recursos sobre NLP. En inglés.
* [Lenguaraces](https://docs.google.com/spreadsheets/d/1M8Bdggspa6cnswfbxSExtCEPUFwuhwrGcuT14D9qXvk/edit#gid=0). Hoja de cálculo con recursos sobre lingüística.
* [Catálogo de Tecnologías del Lenguaje](https://plantl.mineco.gob.es/tecnologias-lenguaje/catalogo-TL/Paginas/catalogo-TL.aspx). Listado de empresas, centros de investigación, productos y servicios que hacen PLN en España, mantenido por la Secretaría de Estado de Digitalización e Inteligencia Artificial (SEDIA).

## Sobre mí 👩

¡Hola! Soy Leticia Martín-Fuertes (aka @nimbusaeta) y trabajo como lingüista computacional desde 2014. Como es un perfil relativamente nuevo me he ido fijando y he ido recopilando todo lo que creo que puede ser útil para quien se dedique o se quiera dedicar a esto. [Twitter](https://twitter.com/nimbusaeta) es donde más activa soy.
