#HackathonSomosNLP 2025

Vamos a impulsar la creación de modelos de lenguaje alineados con la cultura de los países de LATAM y la Península Ibérica.


Somos 600M de hispanohablantes y 265M de lusófonos en el mundo. El español y el portugués son los idiomas principales en 29 países, cada uno de ellos con una gran riqueza cultural. Aunque los modelos de lenguaje muestran cada vez mayores capacidades multilingües, ¿son realmente multiculturales? Únete ya al #HackathonSomosNLP, el mayor hackathon open-source de Procesamiento del Lenguaje Natural en español y portugués 🚀

En las ediciones anteriores contamos en total con más de 1500 participantes de 30 países distintos, superamos las 20.000 visualizaciones de nuestros eventos, aprendimos de 20 ponentes, y desarrollamos 50 proyectos relacionados con los Objetivos de Desarrollo Sostenibles de la ONU, demostrando el potencial del PLN para abordar desafíos sociales. ¡Volvemos a por eso y mucho más! 💪

En esta cuarta edición nos vamos a centrar en la creación de recursos que nos permitanevaluar y mejorar la adecuación cultural de los grandes modelos de lenguaje respecto a cada uno de los países de LATAM y la Península Ibérica.

¿Lo mejor? ¡TODO EL MUNDO puede colaborar! 🎉

Aquí tienes los enlaces a todos los formularios, sigue leyendo para más información.

GIF Hackathon #Somos600M

(English version)

🚀 Cómo puedes colaborar

Haz click en cada uno de las opciones siguientes para obtener más información:

💻 Crea un modelo de lenguaje alineado con tu cultura

Al unirte a este hackathon tendrás la oportunidad de desarrollar y aplicar tus conocimientos de entrenamiento de LLMs para la creación de modelos de calidad e inclusivos en tu lengua. Tendrás acceso a APIs de modelos del estado del arte, la posibilidad de ganar premios, participar en sorteos, asistir a charlas, talleres y mentorías, publicar un paper… ¡Apúntate ya!

Cada equipo participante (1-5 personas) generará un dataset, alineará un LLM y creará una demo para compartir su gran trabajo con la comunidad.También es posible contribuir únicamente al dataset.

Desde SomosNLP queremos animarte a participar independientemente de tus conocimientos actuales. Organizaremos talleres prácticos y sesiones de mentoría para que puedan participar tanto grupos de institutos de investigación como grupos de estudiantes de grado, ¡todos los proyectos suman!

Para que todo el mundo comience con las mismas condiciones, haremos las bases públicas el día 1 de abril.

💡 Asiste a las charlas de especialistas

En SomosNLP creemos que formarte también es una manera de colaborar con el futuro del PLN en español. Durante los martes del mes de abril tendrán lugar diversas keynotes impartidas por profesionales del mundo del Procesamiento del Lenguaje Natural. Estos eventos son gratuitos y están abiertos a todas las personas.

¿Y hasta que llegue abril?¡Están disponibles las grabaciones de las charlas anteriores!

🔊 Propón una ponencia

Invitamos a personas del ámbito académico o industrial, expertas y apasionadas del campo de la IA y en particular del PLN, a compartir sus conocimientos y avances. ¡Lee los temas sugeridos y mándanos tu propuesta!

🧑‍🏫 Ofrece una mentoría

Comparte tu experiencia y conocimiento apoyando a los equipos participantes a crear bases de datos de calidad y entrenar un buen LLM. Puedes impartir una mentoría puntual o continua. ¡Piensa en tus puntos fuertes y ofrece una mentoría!

🙌 Patrocina este maravilloso evento

SomosNLP es una comunidad sin ánimo de lucro, buscamos donaciones, premios y visibilidad para conseguir nuestros ambiciosos objetivos y acercar los modelos de lenguaje al mundo hispanohablante. Toda la ayuda es bienvenida, descubre cómo puedes apoyar nuestra misión ofreciendovisibilidad, vales y donaciones. ¡Contamos contigo!

📣 Ayúdanos a difundir el evento

Ayúdanos a difundir el evento en tu red para que esta iniciativa llegue a más personas, ¡todo el apoyo es bienvenido! Además, a partir de 4 publicaciones añadiremos vuestro logo a la página web en la sección de “Patrocinios de Comunidad”.

🤗 Únete al equipo

Puedes colaborar creando contenido, recursos de apoyo (e.g., tutoriales), escribiendo artículos o investigando sobreCultural NLP.

👏 Agradecimientos

Muchísimas gracias por vuestro tiempo y por apoyarnos para que nuestra iniciativa llegue más lejos. ¡Vamos a hacer los modelos de lenguaje más inclusivos!

🚀 Organizado por

SomosNLP

CENIA

Universidad Politécnica de Madrid

💎 Platino

Cohere For AI

🥇 Oro

Hugging Face

🥈 Plata

UPM - Eunomia

🌟 Comunidad

Sociedad Española para el Procesamiento del Lenguaje Natural

Instituto de Ingeniería del Conocimiento

LatinX in AI

Proyecto ILENIA

Saturdays AI

AI TINKERERS - Quito

Women Tech Global Conference


🤗 ¡Conecta!

Para estar al día de todos los eventos y avances: