Preguntas frecuentes sobre YvyrAI
Todo lo que necesitás saber sobre la primera arquitectura de modelo de lenguaje diseñada desde cero en Paraguay: qué es, cómo funciona, qué dice el paper técnico y qué puede hacer por tu empresa.
Lo esencial
Sobre YvyrAI
Qué es YvyrAI, por qué existe y quién está detrás.
YvyrAI es la primera arquitectura de modelo de lenguaje (LLM) diseñada desde cero en Paraguay. Es un modelo decoder-only «español-first» construido alrededor de un módulo recurrente propio, el DeliberationBlock, que permite al modelo planificar, deliberar y verificar internamente antes de responder. Además de la investigación, YvyrAI automatiza negocios e integra IA avanzada para empresas e instituciones.
YvyrAI es la primera arquitectura de modelo de lenguaje desarrollada desde primeros principios por un equipo de investigación latinoamericano en el mundo hispanohablante. En la carrera global por la IA, Paraguay prácticamente no figuraba: no había modelos propios ni un ecosistema local. YvyrAI cambia eso construyendo tecnología fundacional —no un wrapper ni un fine-tune de un modelo extranjero.
YvyrAI es desarrollado por el YvyrAI Research Project en Paraguay, por Juan Manuel Acosta Ramírez y Mauricio José Irrazábal Ruiz Díaz. Para consultas de investigación o negocio, el contacto es admin@yvyrai.lat.
Significa desarrollar IA propia en lugar de solo consumir o alojar la de otros: arquitectura diseñada localmente, modelos entrenados con datos de Paraguay y control total sobre dónde viven esos datos, sin dependencia obligatoria de infraestructura extranjera. La idea es que Paraguay sea productor de inteligencia artificial, no únicamente proveedor de energía y cómputo para los modelos de terceros.
El nombre evoca «yvyrá», que en guaraní significa árbol —reflejado en el logo, un árbol de circuitos. Combina raíces e identidad paraguaya con la «AI» (inteligencia artificial): tecnología de frontera que crece desde el contexto local.
Arquitectura
Tecnología y modelo
Cómo funciona el DeliberationBlock y qué lo hace distinto.
El DeliberationBlock es el centro de la arquitectura de YvyrAI: un bloque Transformer compartido que se itera varias veces dentro de un único forward pass. Mantiene un estado de planificación con compuertas, lee y escribe un scratchpad latente comprimido, estima una señal interna de confiabilidad y decide cuántas rondas de refinamiento usar antes de emitir la respuesta. Así el modelo «piensa» en el espacio latente en vez de solo generar más texto.
La mayoría de los LLM escalan agregando parámetros, datos y cómputo de entrenamiento. YvyrAI suma un segundo eje: más cómputo en el momento de la inferencia mediante refinamiento recurrente en estado latente. A eso añade un verificador interno con reparación condicional, un diseño «español-first» y una estrategia de datos consciente de Paraguay. No es un wrapper sobre otra API ni un ajuste fino de un modelo ajeno: es una arquitectura original.
Dentro del bucle recurrente, un «verificador» emite una señal acotada que estima qué tan confiable es el estado oculto actual. Una vía de «reparación» aplica entonces una corrección cuya fuerza es proporcional a esa baja confiabilidad: actúa con más intensidad justo cuando el modelo cree que su estado interno es menos confiable. El objetivo es hacer que la recurrencia sea autocrítica en lugar de iterar a ciegas.
YvyrAI se especifica como una familia de modelos, desde configuraciones de ~1M de parámetros para validación hasta un modelo insignia de ~1.01B (vocabulario de 24.576 tokens, 22 capas, hasta 10 iteraciones recurrentes y contexto de 2K–4K). El Founders Edition es el primer modelo público; cada cliente puede tener además su propio modelo a medida.
Sí: ese es un objetivo central. Usa un tokenizador BPE «español-first» construido desde cero (con pre-tokenización estilo Metaspace) para minimizar la fragmentación del español rioplatense y regional, y una porción dedicada de datos paraguayos —fuentes oficiales, cívicas, históricas y factuales— con una evaluación específica usando un conjunto de prueba paraguayo separado.
El backbone decoder-only usa Grouped-Query Attention (GQA), embeddings posicionales RoPE, activaciones SwiGLU y RMSNorm, con despacho compatible con FlashAttention. De forma opcional incorpora atención de ventana deslizante y enrutamiento Mixture-of-Depths, además de compresión de KV-cache en inferencia y soporte de entrenamiento en baja precisión.
Investigación
El paper y la evidencia
Qué afirma el trabajo técnico —y qué deja honestamente como hipótesis.
El paper completo está disponible en yvyrai.lat/paper, donde se puede leer en línea y descargar en PDF. Incluye la especificación matemática del bucle de deliberación, la familia de modelos diseñada, el pipeline de datos, el protocolo de evaluación y el plan de entrenamiento.
No, y el paper es deliberadamente honesto al respecto. La contribución es arquitectónica y metodológica: no se reporta un modelo entrenado de alta capacidad ni se afirma superioridad sobre sistemas existentes. Esa transparencia («límite de evidencia») es intencional: las comparaciones de benchmark se publicarán solo cuando exista un modelo entrenado a una escala donde los números sean interpretables, frente a una línea base controlada.
Es una corrida pequeña y temporal usada como verificación de ingeniería: confirma que el tokenizador, el bucle recurrente, las cabezas auxiliares y el harness de evaluación se ejecutan de extremo a extremo y de forma estable. Es una prueba del mecanismo, no una prueba de inteligencia: un modelo de 15M es demasiado pequeño para sostener afirmaciones de capacidad.
El plan es escalonado para no malgastar cómputo: (1) tokenizador y prueba de mecanismo, (2) validación de ingeniería de 15M, (3) una ablación de mediana escala con y sin el DeliberationBlock, (4) la corrida insignia de 1B con corpus español-first, y (5) el lanzamiento técnico público con benchmarks y model card. El principal cuello de botella es el cómputo; el hardware reciente con precisión NVFP4 hace que la configuración de 1B sea entrenable fuera de los grandes centros de datos.
El paper incluye la cita en formato BibTeX (clave «acosta2026yvyrai», 2026, YvyrAI Research Project, Paraguay). Está disponible para copiar directamente en yvyrai.lat/paper, en la sección de Citación.
Para empresas
Servicios y negocio
Qué puede hacer YvyrAI por tu empresa o institución hoy.
Tres pilares activos y uno en camino: Automatización de procesos empresariales con IA; Integración de IA (APIs y soluciones híbridas conectadas a tu stack); Modelos Custom entrenados para tu industria; y Enterprise (transformación integral), próximamente. Cada proyecto se evalúa de forma individual.
Ambas cosas. Además de construir su propia arquitectura, YvyrAI integra inteligencia artificial en procesos reales —ventas, atención, operaciones, análisis— conectándose a los sistemas que la empresa ya usa, sin rehacer la infraestructura. El foco está en soluciones en producción, no en demos.
Sí. A través del servicio de Modelos Custom, YvyrAI entrena modelos especializados con datos de tu organización y tu dominio, con personalización profunda y rendimiento adaptado al contexto local que los modelos genéricos no logran.
La soberanía de datos es un principio central: según el plan contratado, tus datos pueden permanecer bajo tu control, sin intermediarios ni dependencia obligatoria de infraestructura extranjera. La meta es darte personalización y seguridad con autonomía real sobre tu información.
El contacto directo es admin@yvyrai.lat. La plataforma de contacto y solicitud de demos está terminándose y estará disponible próximamente.
¿No encontraste tu respuesta?
Hablemos.
Si tenés otra pregunta sobre la tecnología, la investigación o cómo YvyrAI puede trabajar con tu empresa o institución, escribinos.