#HackathonSomosNLP 2026

Vamos a impulsar la creación de modelos de lenguaje alineados con la cultura de los países de LATAM y la Península Ibérica.


Somos 600M de hispanohablantes y 265M de personas lusófonas en el mundo. El español y el portugués son los idiomas principales en 29 países, cada uno de ellos con una gran riqueza cultural. Aunque los modelos de lenguaje muestran cada vez mayores capacidades multilingües, ¿son realmente multiculturales? Únete ya al #HackathonSomosNLP, el mayor hackathon open-source de Procesamiento del Lenguaje Natural en español y portugués 🚀

(In Portuguese, in English)


📊 ¡Lanzamos la quinta edición!

Desde 2022, sumamos…

4
Ediciones
1500+
Participantes
30
Países
100+
Proyectos
60
Eventos

En esta quinta edición nos vamos a centrar en la creación de recursos que nos permitan evaluar y mejorar la adecuación cultural de los grandes modelos de lenguaje respecto a cada uno de los países de LATAM y la Península Ibérica.

¿Lo mejor? ¡TODO EL MUNDO puede colaborar! 🎉

GIF Hackathon #Somos600M


🚀 Cómo participar

📚

Manda preguntas sobre tu cultura a LLMs

Haz preguntas a LLMs y elige cuáles están más alineados con tu cultura. ¡Apto para todos los públicos!

💻

Crea un modelo de lenguaje

Desarrolla un LLM alineado con tu cultura. Equipos de 1-5 personas: genera un dataset, alinea un modelo y crea una demo.

Al participar tendrás la oportunidad de:

  • ✨ Aprender con talleres y charlas en directo
  • ✨ Acceder a cientos de USD en créditos GPU y API para desarrollar tu proyecto
  • ✨ Ganar premios valorados 1500, 1000 o 500 USD (1er, 2o y 3er premio)
  • ✨ Ganar entradas a conferencias y nominaciones a la red de talento Nova
  • ✨ Ganar mentorías con personas muy relevantes del campo del PLN
  • ✨ Co-publicar papers en conferencias de PLN internacionales
  • ✨ Conseguir un certificado de participación (o equipo ganador) del hackathon

¡A por ello!

¿Tienes dudas? Revisa las preguntas frecuentes e información de contacto al final.


🚀 Cómo apoyar más

¡Apoya la organización de este evento gratuito y sin ánimo de lucro!

📣

Difunde el evento

Ayúdanos a que esta iniciativa llegue a más personas. Con 4 publicaciones añadimos vuestro logo a la web.

Difunde
🤗

Únete al equipo

Colabora creando contenido, recursos de apoyo, tutoriales, artículos o investigando sobre Cultural NLP.

Únete
🧑‍🏫

Ofrece una mentoría

Comparte tu experiencia apoyando a los equipos a crear datasets de calidad y entrenar buenos LLMs. Mentorías puntuales o continuas.

Ofrece mentoría
🙌

Patrocina el evento

Apoya nuestra misión ofreciendo visibilidad, vales o donaciones. SomosNLP es una comunidad sin ánimo de lucro.

Ver opciones

🏆 Casos de éxito

Los proyectos del hackathon generan impacto real:

20221er Premio

🏅 BiomedIA

Sistema voz-a-voz de Q&A biomédico. Dio lugar a un paper en NAACL 2022 con el Premio a la Mejor Presentación de Póster.

20222do Premio

⚖️ Modelo Jurídico Mexicano

Modelo de conocimiento jurídico utilizado por la Suprema Corte de Justicia de la Nación de México.

20241er Premio

📰 NoticIA

Corpus de 850 artículos de noticias clickbait en español con resúmenes de alta calidad, abordando la desinformación digital. Publicado en SEPLN 2024.

20242do Premio

🤝 AsistenciaRefugiados

Asistente legal para personas en situación de refugio, facilitando el acceso a información sobre legislación en España.

20241er Premio

🤝 BERT Sostenible

Identificación de textos relacionados al cambio climático y sustentabilidad utilizando modelos de lenguaje preentrenados en español. LatinX in AI (LXAI) Research Workshop @NAACL 2024. Best paper en KHIPU 2025.

20241er Premio

🤝 Cocina saludable

Aprendiendo a cocinar de manera saludable con Large Language Models, Supervised Fine Tuning y Retrieval Augmented Generation. LatinX in AI (LXAI) Research Workshop @NAACL 2024.

2024Logro colectivo

📚 Dataset de instrucciones

Se generaron más de 1M instrucciones, creando el mayor dataset de entrenamiento supervisado en español. Paper #Somos600M publicado en el workshop LatinX in NLP @NAACL 2024. Entrevista en el periódico El País.

2025Logro colectivo

📚 INCLUDE: Benchmark de conocimiento cultural

Se recolectaron más de 38.000 preguntas de exámenes de 23 países, creando el mayor benchmark de evaluación de conocimiento cultural para LLMs en español y portugués.

Más ejemplos

💡 Ponencias y mentorías

Tendrás la oportunidad de aprender de líderes de la academia y la industria, ¡iremos anunciando nuevas ponencias y mentorías!


👏 Agradecimientos

Muchísimas gracias por vuestro tiempo y por apoyarnos para que nuestra iniciativa llegue más lejos. ¡Vamos a hacer los modelos de lenguaje más inclusivos!

🚀 Organizado por

SomosNLPUNED

🥇 Patrocinios Oro

NextGenerationEUSEDIAredesPERTEUNED
Hugging Face

🥈 Patrocinios Plata

Universidad Politécnica de MadridCENIA

❓ Preguntas frecuentes

¿Por qué debería participar?

Al unirte a este hackathon tendrás la oportunidad de:

  • ✅ Comprender cómo funcionan los grandes modelos del lenguaje, tanto textuales (LLMs) como multimodales (VLLMs) y descubrir los retos de cada etapa de su desarrollo: creación del corpus, entrenamiento, alineamiento y evaluación
  • ✅ Participar en la creación del primer corpus de preferencias de calidad y diverso para alinear LLMs con la cultura de los países de LATAM y la Península Ibérica (top como experiencia y top para el CV)
  • ✅ Ser parte del equipo que cree algunas de las bases de datos de la primera leaderboard abierta de LLMs en español: La Leaderboard
  • ✅ Resolver todas tus dudas sobre PLN durante sesiones de mentoría “Ask My Anything”
  • ✅ Recibir apoyo para presentar tu trabajo en un paper
  • ✅ Ganar premios para seguir creciendo como profesional y conseguir un certificado que poder compartir en LinkedIn
  • ✅ Unirte a la mayor comunidad de hispanohablantes que estudian, trabajan e investigan en PLN
¿Cuál es el nivel necesario?

Desde el equipo de SomosNLP queremos animarte a participar independientemente de tus conocimientos actuales. En ediciones anteriores hemos contado con grupos de institutos de investigación y grupos de estudiantes de grado, ¡todos los proyectos suman!

  • 📖 Impartiremos una serie de talleres prácticos mostrándote cómo desarrollar un proyecto para que tengas un ejemplo de referencia.
  • ❓ Organizaremos AMAs (del inglés, Ask Me Anything) con expertas y mentores para que puedan solucionar tus dudas.
¿De qué depende la complejidad de los proyectos?

Proporcionaremos un ejemplo de cómo crear un dataset, entrenar un modelo y crear una demo. Depende de ti y tu equipo elegir cuánto investigar y trabajar para mejorar la versión base. La dificultad también depende del caso de uso, el origen de los datos, el tiempo que dediquéis a su curación, la técnica de entrenamiento, las iteraciones que hagáis y lo elaborada que queráis que sea vuestra demo. ¡Sois libres de elegir todo!

¿De verdad se necesitan 4 semanas?

No, depende de tu disponibilidad, puedes desarrollar un buen proyecto en una semana. Tenemos en cuenta que las personas estudian y trabajan, por lo que dejamos más tiempo del necesario para que todo el mundo pueda participar. También queremos daros tiempo extra para que disfrutéis la oportunidad de asistir en directo a las ponencias y mentorías celebradas durante el hackathon.

¿Hasta cuándo puedo crear un equipo?

EDITADO: Damos la bienvenida a nuevos equipos hasta el 23 de mayo. El día final para entregar proyectos es el 31 de mayo.

¿Cómo me uno a un equipo?

Lee la sección “Para crear un equipo:” al comienzo de esta página y el README en el canal #encuentra-equipo de nuestro servidor de Discord :)

¿Puede haber equipos de 1 persona?

Sí, aceptamos equipos de 1 a 5 personas.

¿Cómo nos recomendáis organizarnos?
  • Utilizar el canal de vuestro proyecto en Discord para comunicaros y organizaros.
  • Dado que es un hackathon internacional recomendamos una comunicación asíncrona o que os repartáis el trabajo y hagáis reuniones de menos personas
  • Fijar reuniones o hablar espontáneamente utilizando los nuevos canales de voz de la categoría “SALAS DE REUNIÓN” de Discord
  • Fijar en el canal del proyecto los mensajes importantes, e.g.: repartición de tareas, día de la próxima reunión, … Para fijar un mensaje haz click en los tres puntitos y selecciona “Fijar mensaje”
  • Para mayor claridad también podéis crear un documento compartido con las personas del equipo en el que escribir el objetivo del proyecto, repartir tareas y demás (y fijar el enlace en el chat)
No entiendo Discord, ¿cuáles son los canales más importantes?
  • Revisa el canal #anuncios, recomendamos activar las notificaciones del canal, publicamos 2/3 veces a la semana
  • Pregunta tus dudas en el canal #pide-ayuda de Discord para que todo el mundo pueda beneficiarse de la respuesta
  • Los eventos los anunciamos en el canal #eventos y los añadimos al calendario de Google
¿Cómo me puedo enterar de los eventos?
¿Cómo puedo dar feedback del evento?
  • Nos puedes dar feedback para mejorar las guías de los retos con este formulario (anónimo)
  • Compartiremos también un formulario de feedback general al final del evento

Si te hemos dicho que en esta página hay info que no encuentras, borra las cookies y recarga la página.


🤗 ¡Conecta!

Para estar al día de todos los eventos y avances: