Argilla es una plataforma open-source de gestión y etiquetado de datos para proyectos NLP.
Colaboración
- Co-organización del esfuerzo colaborativo de validación de las traducciones de loscorpus de evaluación MMLU, RAC-C y HellaSwag al español
- Co-organización del esfuerzo colaborativo de validación de la traducción delconjunto de prompts “Data Is Better Together” (DIBT) al español
- Empresa patrocinadora de oro delHackathon SomosNLP 2024
- Co-organización del esfuerzo colaborativo de limpieza y validación de la traducción delconjunto de instrucciones Alpaca al español
- Empresa patrocinadora de oro delHackathon SomosNLP 2023
- Empresa patrocinadora de bronce delHackathon SomosNLP 2022
Eventos con el equipo de Argilla
- Argilla y distilabel, herramientas para crear modelos como Notus |Hackathon SomosNLP 2024
En esta charla hablaré sobre Notus, una LLM entrenada por Argilla a finales de año de 2023 que obtuvo muy buenos resultados en los benchmarks a través de la mejora de los datos de entrenamiento. Además, mostraré como crear un dataset similar al utilizado en el fine-tune de Notus utilizando Argilla y distilabel, dos herramientas que nos permiten anotar y crear datos de entrenamiento de manera sencilla.
- Introducción a Argilla |Hackathon SomosNLP 2023
En este taller, usaremos Argilla para sacar el máximo provecho a todas las innovaciones recientes en el mundo del PLN. En particular, intentaremos responder a la siguiente pregunta : ¿cómo evaluar, adaptar y crear modelos incorporando feedback humano en tus proyectos de PLN?