Hackathon 2022 de PLN en Español

Construye al lado de mentores, expertas y hackers la siguiente generación de modelos de Procesamiento del Lenguaje Natural


¡Únete al mayor hackathon de Procesamiento del Lenguaje Natural en español!

La democratización del PLN en español es el objetivo principal de nuestra comunidad y una de las mejores maneras de avanzar hacia este objetivo es creando más recursos de PLN en nuestro idioma.

Con este hackathon te animamos a unirte a nuestro esfuerzo. Te invitamos a entrenar y poner en producción un modelo de PLN en español.



🚀 Evento

Al unirte a este evento tendrás la oportunidad de:

  • Ayudar al avance y la democratización del PLN en español
  • Asistir a charlas y talleres impartidas por profesionales trabajando e investigando en el mundo del PLN
  • Consultar tus dudas sobre PLN con mentores y expertas
  • Conseguir acceso gratis a GPUs patrocinadas por Paperspace
  • Participar en un sorteo de copias del libro "Natural Language Processing with Transformers" de Lewis Tunstall, Leandro von Werra y Thomas Wolf
  • Conseguir acceso gratis a las plataformas de e-learning de Platzi y O'Reilly
  • Canjear bonos por swag de Hugging Face especialmente diseñado para el evento
¡Regístrate ya!

💻 Bases del Hackathon

Participar en nuestro hackathon y aplicar tus conocimientos a una buena causa es muy sencillo, ¡anímate!

  1. Crea una cuenta enHugging Facesi todavía no tienes una y regístrateaquí.
  2. Únete a nuestra comunidad deDiscordy haz click en "request to join this org" en la organizaciónhackathon-pln-esde Hugging Face.
  3. Echa un vistazo a los diferentes canales de Discord, sobre todo a los de la sección "HACKATHON", ya que iremos anunciando talleres y material con el que preparar el hackathon y también resolveremos las dudas que te puedan surgir durante el evento.
  4. Reúne tu equipo (de 1 a 5 personas). Si todavía no tienes equipo puedes utilizar el canal #encuentra-equipo para crear uno nuevo o unirte a uno existente. Apunta tu proyecto y los handles de HF de los miembros del equipo en la hoja de cálculo que está en la descripción del canal #encuentra-equipo, os mandaremos por correo el código de vuestra GPU de Paperspace.
  5. Busca una base de datos para entrenar tu modelo. Puede estar endatasets, en otra plataforma online o la puedes crear desde cero y subirla ahackathon-pln-es.
  6. Junto con tu equipo, entrena y sube ahackathon-pln-esuno o varios modelos. Desde la comunidad queremos animar a todos los equipos a entrenar modelos que sirvan para abordar alguno de losObjetivos de Desarrollo Sostenible de la ONU.
  7. Asegúrate de incluir una "Model Card" explicando, entre otras cosas, el origen de los datos utilizados y el proceso de entrenamiento del modelo.
  8. Crea una demo de el/los modelo/s utilizando la tecnología que prefieras (e.g. Gradio, Streamlit, Flask, FastAPI). Puedes utilizar Spaces de Hugging Face para crear tu demo enhackathon-pln-es.
  9. Por último, rellena esteformulariopara presentar el proyecto.

Un jurado formado por especialistas en PLN (por anunciar) elegirá los tres equipos ganadores. Además, se concederá una mención de honor al mejor proyecto enfocado a un Objetivo de Desarrollo Sostenible y otra al que consiga más ❤️ en el Hub de Hugging Face.

¡Buena suerte!

🏆 Evaluación y Premios

A la hora de evaluar los proyectos, dado que cada equipo utilizará un dataset diferente y entrenará su modelo para resolver una tarea diferente, además de tener en cuanta el valor de las métricas, los criterios de evaluación incluirán el impacto social del proyecto, la originalidad de la idea y la dificultad técnica.

Gracias al patrocinio de Platzi, todas las personas que presenten un proyecto ganarán una beca en su plataforma de e-learning:

  • Participación: Beca de 3 meses
  • Segundo y tercer puesto: Beca de 6 meses
  • Equipo ganador: Beca Expert de 1 año

El resto de premios incluirán:

  • Certificado de participación/equipo ganador del Hackathon 2022 de PLN en Español
  • Rol honorífico en el servidor de Discord, e.g.: "Hackathon 🥇"
  • Swag de Hugging Face diseñado especialmente para el hackathon
  • Tiempo de computación en GPUs patrocinadas por Paperspace
  • Copias del libro "NLP with Transformers"

Nota: Seguimos hablando con nuestros patrocinadores, mantendremos esta sección actualizada.

Además de estos premios, podrás conseguir un mes de acceso gratis a la plataforma de e-learning de O'Reilly y participar en el sorteo de copias del libro"Natural Language Processing with Transformers" de Lewis Tunstall, Leandro von Werra y Thomas Wolfal asistir a uno de nuestros eventos 🎁

📖 Recursos

Desde el equipo de Somos NLP queremos animarte a participar independientemente de tus conocimientos actuales.

  • Hemos creando una nueva sección "Recursos"(somosnlp.org/recursos)con listas dedatasets y modelos open-sourceque puedes utilizar para hacer fine-tuning como te explicamos en nuestrostutoriales.
  • También daremos untaller prácticoel primer día del hackathon en el cual crearemos una base de datos, entrenaremos un modelo y desarrollaremos una demo para que tengas un ejemplo de proyecto de referencia.
  • Organizaremos dosAMAs(del inglés, Ask Me Anything) con dos expertos en NLP para que puedan solucionar tus dudas.
  • Hemos creado vídeo tutoriales explicando cómo utilizar las GPUs patrocinadas por Paperspace y cómo crear demos en Spaces: echa un vistazo a la lista de YouTube"Tutoriales".
  • Además, durante las dos semanas que dura el hackathon estaremos a tu disposición enDiscordpara guiarte y ayudarte a desarrollar tu proyecto.

💡 Charlas y Talleres

Durante el hackathon tendrán lugar diversas charlas y talleres impartidas por profesionales del mundo del Procesamiento del Lenguaje Natural. Estos eventos están abiertos a todas las personas, independientemente de si participan en el hackathon,¡apúntate!

Iremos anunciando los eventos uno a uno así que atención aTwitteryLinkedIn🔥

➡️ Subimos las grabaciones de todas las charlas y talleres a la lista de YouTubeHackathon de PLN en Españolpara que las puedas ver cuando te venga bien.

Manuel Romero
Taller Práctico: Recorrido por el ecosistema de Hugging Face
lunes, 14 de marzo de 2022· 18h CET
Manuel Romero
Ingeniero de NLP/NLG @Narrativa.AI | Head Collaborator @HuggingFace
Omar Sanseviero
Análisis de Error en Modelos de PLN
miércoles, 16 de marzo de 2022· 19h CET
Omar Sanseviero
Ingeniero de ML @HuggingFace
Manuel Romero
Ask Me Anything
jueves, 17 de marzo de 2022· 19h CET
Manuel Romero
Ingeniero de NLP/NLG @Narrativa.AI | Head Collaborator @HuggingFace
Nuria Aldama, Álvaro Barbero, Helena Montoro y Alejandro Vaca
Entrenando un modelo de lenguaje del español del estado del arte
lunes, 21 de marzo de 2022· 18h CET
Nuria Aldama, Álvaro Barbero, Helena Montoro y Alejandro Vaca
Data Scientists & Lingüistas Computacionales @IIC
Jose Camacho Collados y Luis Espinosa-Anke
Modelos del lenguaje para redes sociales
martes, 22 de marzo de 2022· 18h CET
Jose Camacho Collados y Luis Espinosa-Anke
Investigadores en PLN @Universidad de Cardiff
Cristina Aranda Gutiérrez
Inteligencia Artificial y Procesamiento del Lenguaje Natural, una apasionante encrucijada
miércoles, 23 de marzo de 2022· 13h CET
Cristina Aranda Gutiérrez
Co-Fundadora @Big Onion | Dra. en Lingüística Teórica y Aplicada
Paulo Villegas
Muestreo de datos para entrenamiento de modelos NLP
miércoles, 23 de marzo de 2022· 19h CET
Paulo Villegas
Experto Tecnológico Senior
Lewis Tunstall
Ask Me Anything
jueves, 24 de marzo de 2022· 19h CET
Lewis Tunstall
Ingeniero de ML @HuggingFace | Co-Autor de "NLP with Transformers"
Eva Martínez Garcia
Traducción Automática: breve introducción y retos actuales
lunes, 28 de marzo de 2022· 19h CET
Eva Martínez Garcia
Senior Research Scientist @NielsenIQ | Profesora en el Máster de IA @UNIR
Daniel Vila Suero
Etiquetado de datos para PLN con Rubrix
martes, 29 de marzo de 2022· 13h CET
Daniel Vila Suero
Co-Fundador y CEO @Recognai
Ximena Gutierrez-Vasques
Consideraciones de NLP para lenguas minorizadas. El caso de México
miércoles, 30 de marzo de 2022· 13h CET
Ximena Gutierrez-Vasques
Investigadora de Post-doctorado @Universidad de Zurich | Lingüista Computacional
Victoriano Izquierdo
Infiriendo Topics con clustering no-supervisado usando Graphext
jueves, 31 de marzo de 2022· 13h CET
Victoriano Izquierdo
Co-Fundador y CEO @Graphext

👏 Patrocinadores

Muchísimas gracias por vuestro tiempo y por apoyarnos para que nuestra iniciativa llegue más lejos. ¡Vamos a democratizar el PLN en español!

🥇 Platrocinadores de oro

PaperspacePlatziHugging Face

🥈 Patrocinadores de plata

BSCDiverTLesIBiDatNarrativaPlan TLPLNnetSaturdays AISpain AIUNAMUNL