Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
TradFi
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
Launchpad
Anticípate a los demás en el próximo gran proyecto de tokens
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
Acuñación de GUSD
Acuña GUSD y gana rentabilidad de RWA
Tether amplía los datos de entrenamiento de Open AI con el lanzamiento del conjunto de datos QVAC Genesis II
¡Descubre las principales noticias y eventos de fintech!
Suscríbete al boletín de FinTech Weekly
Leído por ejecutivos en JP Morgan, Coinbase, Blackrock, Klarna y más
Una gran expansión en los datos de entrenamiento de Open AI
Tether Data ha lanzado una nueva versión de su conjunto de datos educativo sintético para inteligencia artificial, aumentando de manera significativa el volumen y el alcance del material de entrenamiento abierto disponible para investigadores de todo el mundo. La división de investigación de IA de la compañía, QVAC, anunció que el nuevo lanzamiento, denominado QVAC Genesis II, agrega 107 mil millones de tokens a su conjunto de datos anterior, elevando el tamaño total a 148 mil millones de tokens.
El conjunto de datos ampliado ahora es el recurso educativo sintético público más grande diseñado específicamente para el preentrenamiento de IA. Abarca 19 dominios académicos y pretende mejorar la forma en que los modelos aprenden razonamiento, explicación y toma de decisiones, en lugar del reconocimiento de patrones a nivel superficial.
El anuncio sitúa el lanzamiento como un paso hacia un desarrollo de IA más transparente y accesible, en un momento en que muchos conjuntos de datos avanzados de entrenamiento permanecen bloqueados dentro de sistemas propietarios.
Basándose en el primer lanzamiento de Genesis
QVAC Genesis II se basa en el trabajo presentado por primera vez con Genesis I, que se enfocaba en crear un conjunto de datos sintético validado, centrado en la educación, que cubre materias fundamentales de ciencias, tecnología, ingeniería y matemáticas. Ese lanzamiento anterior estableció un marco para generar preguntas de entrenamiento estructuradas destinadas a mejorar la precisión del razonamiento.
El nuevo lanzamiento amplía la cobertura en diez campos adicionales, incluidos química, informática, estadística, aprendizaje automático, astronomía, geografía, econometría e ingeniería eléctrica. También revisita contenido de física a nivel universitario, regenerándolo mediante una metodología actualizada diseñada para mejorar la claridad conceptual.
Juntos, los dos lanzamientos constituyen, según describe QVAC, el conjunto de datos educativo sintético más extenso puesto a disposición del público hasta el momento. El conjunto de datos está destinado a usarse en el preentrenamiento de modelos de lenguaje grandes y otros sistemas de IA que requieren material académico estructurado.
Un cambio en cómo se generan los datos de entrenamiento
En el núcleo de Genesis II hay un nuevo método de generación de datos al que se le denomina Option-Level Reasoning. Este enfoque difiere de muchas técnicas existentes de datos sintéticos al centrarse no solo en las respuestas incorrectas, sino también en las correctas.
En lugar de tratar una respuesta correcta como el final del proceso, el método analiza cada opción de respuesta en una pregunta de opción múltiple. Las opciones correctas se desglosan para reforzar por qué son correctas, mientras que las opciones incorrectas se examinan para abordar ideas erróneas comunes. Esta estructura permite que los modelos aprendan razonamiento causal y lógica de decisión, en lugar de simplemente asociar preguntas con resultados.
El enfoque complementa el método de Failure Analysis introducido en Genesis I, que se enfocaba en extraer valor de los errores del modelo. Juntos, ambos métodos forman un pipeline en el que cada pregunta generada está diseñada para aportar valor instructivo.
Evaluaciones independientes citadas por QVAC indican que los modelos entrenados con datos de Genesis II muestran mayor precisión en el razonamiento y producen respuestas más claras que los entrenados con conjuntos de datos sintéticos anteriores.
Énfasis en comprender por encima de la fluidez
Gran parte del ecosistema actual de entrenamiento de IA depende de ensamblar volúmenes muy grandes de texto, a menudo extraído de fuentes públicas, para mejorar la fluidez del lenguaje. El objetivo declarado de QVAC difiere en el énfasis. Los conjuntos de datos de Genesis están estructurados para enseñar a los modelos a razonar a través de los problemas y explicar conclusiones de manera clara.
Los líderes de la empresa han indicado que la intención es ir más allá de los sistemas de entrenamiento que predicen secuencias de texto probables, hacia modelos que demuestren comprensión de los conceptos subyacentes. El diseño del conjunto de datos prioriza la claridad, la causalidad y la lógica, con el objetivo de reducir la ambigüedad en las salidas del modelo.
Este enfoque se alinea con debates más amplios en investigación de IA sobre confiabilidad y explicabilidad, especialmente cuando los sistemas de IA se usan en educación, ciencia y contextos de apoyo a la toma de decisiones.
Acceso abierto para investigadores y desarrolladores
Al igual que con el conjunto de datos original de Genesis, QVAC Genesis II se está lanzando de forma abierta. El conjunto de datos está disponible bajo una licencia Creative Commons Attribution–NonCommercial 4.0, lo que permite a investigadores, instituciones académicas y desarrolladores independientes usar y estudiar los datos fuera de entornos comerciales.
El conjunto de datos y los modelos asociados se alojan en Hugging Face, junto con un detallado documento técnico que describe la metodología de generación y los resultados de la evaluación. Esta distribución abierta se pretende para reducir barreras para investigadores que no tienen acceso a grandes conjuntos de datos propietarios.
Al mantener licenciamiento no comercial, QVAC busca respaldar la investigación académica y la impulsada por la comunidad, limitando a la vez la explotación comercial directa.
Impulsando el desarrollo descentralizado de IA
El lanzamiento también encaja dentro de una estrategia más amplia que persigue Tether Data para fomentar el desarrollo descentralizado de IA. La compañía ha afirmado que los datos de entrenamiento de alta calidad no deben restringirse a organizaciones con acceso a infraestructura cloud centralizada.
Al poner a disposición conjuntos de datos estructurados a gran escala de forma pública, QVAC busca habilitar el entrenamiento local, la experimentación y el despliegue de modelos de IA. Este enfoque pretende apoyar entornos de investigación en los que los recursos de cómputo pueden ser limitados, pero las contribuciones intelectuales siguen siendo significativas.
El énfasis en la descentralización refleja el creciente interés en reducir la dependencia de un número reducido de plataformas de IA dominantes y fomentar un ecosistema de investigación más distribuido.
El papel de Tether en la investigación de IA
QVAC opera como la división de investigación de IA de Tether Data. Aunque Tether es ampliamente conocido por su papel en activos digitales y stablecoins, la compañía ha expandido sus actividades hacia datos e investigación de IA en los últimos años.
A través de QVAC, Tether Data se ha enfocado en construir infraestructura y recursos que respalden la investigación abierta. Los conjuntos de datos de Genesis representan una de las salidas más visibles de ese esfuerzo, posicionando a la compañía dentro de conversaciones sobre el desarrollo abierto de IA y datos de entrenamiento centrados en la educación.
Este trabajo también refleja la creciente superposición entre compañías de fintech e investigación avanzada en IA, ya que las empresas de tecnología financiera invierten cada vez más en capacidades de ciencia de datos y aprendizaje automático.
Perspectiva de la dirección sobre el lanzamiento
La dirección de la compañía ha enmarcado el lanzamiento de Genesis II como un movimiento para alejarse de enfoques de entrenamiento que priorizan solo el volumen. El enfoque, según declaraciones del equipo ejecutivo de Tether, consiste en enseñar a los sistemas de IA a razonar y explicar, en lugar de simplemente generar respuestas fluidas.
Paolo Ardoino, director ejecutivo de Tether, ha enfatizado que la IA confiable debe estar fundamentada en comprender por qué las respuestas son correctas. Ha indicado que poner el conjunto de datos a disposición de forma abierta refleja una creencia de que una IA más sólida y explicable beneficia a la sociedad en su conjunto.
Estas visiones hacen eco de preocupaciones planteadas por investigadores sobre las limitaciones de los modelos entrenados principalmente con texto no estructurado.
Alcance educativo y cobertura de dominios
Los conjuntos de datos combinados de Genesis I y II cubren 19 dominios, con contenido diseñado para niveles de educación secundaria y terciaria. Las materias van desde matemáticas y física fundamentales hasta campos aplicados como econometría y aprendizaje automático.
Cada dominio incluye preguntas estructuradas, explicaciones y rutas de razonamiento destinadas a reflejar cómo se enseñan y evalúan los conceptos en entornos de educación formal. Este diseño está pensado para respaldar tareas de preentrenamiento que requieren consistencia lógica y profundidad conceptual.
Al regenerar y ampliar el contenido usando métodos mejorados, QVAC busca refinar cómo el material educativo se representa en conjuntos de datos sintéticos.
Evaluación y desempeño del modelo
De acuerdo con evaluaciones internas e independientes a las que hace referencia QVAC, los modelos entrenados con datos de Genesis II muestran un rendimiento mejorado en tareas con fuerte carga de razonamiento. Esto incluye responder preguntas estructuradas, explicar conclusiones y evitar respuestas ambiguas o contradictorias.
Los resultados de la evaluación sugieren que la combinación de Failure Analysis y Option-Level Reasoning conduce a salidas más consistentes. Aunque la compañía no ha presentado el conjunto de datos como una solución independiente, lo ha presentado como una base sólida para entrenamiento adicional y ajuste fino.
Se espera que los investigadores realicen evaluaciones adicionales a medida que el conjunto de datos se use más ampliamente en la comunidad.
Implicaciones para la investigación abierta de IA
El lanzamiento de un conjunto de datos tan grande y abierto podría influir en cómo los investigadores académicos e independientes abordan el entrenamiento de modelos. El acceso a datos educativos estructurados a esta escala tradicionalmente se ha limitado a organizaciones bien financiadas.
Al proporcionar una alternativa, QVAC Genesis II podría respaldar la experimentación con modelos más pequeños, esfuerzos de entrenamiento localizados e investigación sobre métodos de IA explicable.
El conjunto de datos también podría servir como punto de referencia para futuros proyectos de datos sintéticos que prioricen la calidad del razonamiento por encima de la mera magnitud.
Posición dentro del ecosistema amplio de IA
QVAC Genesis II entra en un ecosistema de IA marcado por un desarrollo rápido y una creciente concentración de recursos. Muchos de los modelos más capaces se entrenan con conjuntos de datos propietarios que no están disponibles para su escrutinio o replicación.
Los conjuntos de datos abiertos como Genesis II ofrecen un contrapunto, habilitando transparencia y progreso compartido. También plantean preguntas sobre cómo los recursos abiertos pueden coexistir con el desarrollo de IA comercial.
La participación de una empresa arraigada en fintech y activos digitales resalta cómo la investigación en IA está atrayendo interés de una amplia gama de industrias más allá de las firmas tecnológicas tradicionales.
Disponibilidad y próximos pasos
La documentación técnica completa para el conjunto de datos, titulada “QVAC Genesis II: Expanding the Largest and Highest-Quality Multi-domain Educational Synthetic Dataset for Pre-training,” ha sido publicada en el blog de investigación de QVAC. El acceso al conjunto de datos y a los modelos relacionados está disponible a través de Hugging Face.
QVAC ha indicado que planea continuar refinando sus métodos y ampliando la cobertura educativa en lanzamientos futuros. Se espera que las opiniones de la comunidad de investigación desempeñen un papel en la conformación de iteraciones posteriores.
Un impulso continuo hacia bases abiertas
Con Genesis II, QVAC refuerza su postura de que los datos de entrenamiento abiertos y estructurados son esenciales para construir sistemas de IA confiables. El lanzamiento refleja la visión de que la inteligencia debe fundamentarse en el razonamiento y la explicación, no solo en la asociación estadística.
A medida que los sistemas de IA se integran más en la educación, la ciencia y los servicios financieros, incluidas las aplicaciones de fintech, la calidad de sus datos de entrenamiento seguirá siendo una preocupación central.
Por ahora, el conjunto de datos de Genesis ampliado se mantiene como una contribución destacable a la investigación abierta de IA, ofreciendo escala, estructura y accesibilidad a un nivel raramente visto fuera de entornos propietarios.