GLM-5.2 ofrece a los modelos de codificación de peso abierto una ventana de contexto real de 1M-token. La parte difícil es servir esa ventana completa en el hardware que muchos equipos ya utilizan en producción: Hopper.
Cuantizamos GLM-5.2-FP8 en W4AFP8 y lo validamos en un solo nodo 8×H200 con SGLang. El punto de control reduce la memoria de peso de 755 GB a 368 GB, liberando 387 GB de HBM para el caché KV de 1M-token y margen de tiempo de ejecución.
Por qué esto es importante
GLM-5.2 ya resolvió el lado del modelo de contexto largo: atención dispersa, IndexShare, decodificación especulativa MTP, uso de herramientas, razonamiento y una ventana de 1,048,576-token. El despliegue aún tiene un segundo problema. Una ventana de 1M-token necesita espacio para los pesos del modelo, caché KV, gráficos CUDA, búferes de tiempo de ejecución y sobrecarga de servicio.
El punto de control FP8 oficial es la línea base de servicio general correcta. En Hopper, esa línea base deja mucho menos margen de memoria una vez que empujas hacia la ventana de contexto completa. W4AFP8 cambia el presupuesto de memoria sin cambiar la familia del modelo, tokenizador, forma de API o comportamiento de GLM-5.2.
$PHA Gracias por mencionar OpenRouter, el modelo de privacidad actualmente está en alta demanda, y la cantidad total de suministro es de aproximadamente 1T token/día.
$PHA Phala es la primera cadena L2 op-zk del mundo, que proporciona computación TEE para todo el ecosistema de Ethereum, más información llegará pronto.
Necesita ayuda para que los intercambios conecten los activos de la cadena Khala con la red principal de Ethereum
苏格
·
--
🔔Notificación de la comunidad: Actualización financiera
Se propone transferir 50 millones de $PHA del tesoro para facilitar la transición de $PHA de Khala a ERC20.
1 ⃣Estos fondos asegurarán un proceso de conversión de tokens seguro y eficiente. 2 ⃣Se utilizarán únicamente para mover tokens entre redes/exchanges, y no para el comercio. 3 ⃣Todas las transacciones se registrarán en la cadena para garantizar total transparencia. 4 ⃣Una vez que se complete este proceso, los fondos no utilizados se devolverán al tesoro.
📜Para más detalles, consulte aquí khala.subsquare.io
La gestión de este proceso tendrá como prioridad la seguridad y la transparencia.
¡Asegurémonos juntos de una transición sin problemas! 🙏
🔔Notificación de la comunidad: Actualización financiera
Se propone transferir 50 millones de $PHA del tesoro para facilitar la transición de $PHA de Khala a ERC20.
1 ⃣Estos fondos asegurarán un proceso de conversión de tokens seguro y eficiente. 2 ⃣Se utilizarán únicamente para mover tokens entre redes/exchanges, y no para el comercio. 3 ⃣Todas las transacciones se registrarán en la cadena para garantizar total transparencia. 4 ⃣Una vez que se complete este proceso, los fondos no utilizados se devolverán al tesoro.
📜Para más detalles, consulte aquí khala.subsquare.io
La gestión de este proceso tendrá como prioridad la seguridad y la transparencia.
¡Asegurémonos juntos de una transición sin problemas! 🙏
$PHA Phala TEE Cloud está siendo adoptado a gran escala por proyectos de IA y la cooperación avanza rápidamente. Phala pronto lanzará #以太坊 L2 y se expandirá a una gama más amplia de canales de cooperación.
Hace 12 días publiqué mi post sobre Phala Network y por qué probablemente estás pasando por alto esta joya. Desde entonces, $PHA ha aumentado más del 300%.
Pero esto es solo el comienzo. Hoy, $NEAR cofundador anunció una asociación con Phala Network. Near tiene una capitalización de mercado de 6B USD. Phala tiene una capitalización de 350M.
$PHA se lanzará próximamente en la cadena de Ethereum Phala L2, el servicio TEE se expandirá de Solana a Ethereum, además, Nethermind está trabajando estrechamente con Phala, esperando más actuaciones emocionantes de los servicios en la nube de Phala 2.0. #AI agente #TEE
$PHA Kira ha sido desplegada con éxito en el TEE de @PhalaNetwork. Esta integración representa un paso importante para nosotros, ya que transforma a Kira en un agente de IA autónomo verificable. ¿Qué significa esto? Kira ahora opera de manera completamente transparente, sin necesidad de intervención humana, asegurando que sus acciones sean tanto confiables como seguras. El despliegue dentro del marco TEE proporciona pruebas criptográficas para la operación independiente de Kira, estableciendo un nuevo estándar para la autonomía de la IA.
$PHA Hoy el aumento explosivo de PHA, creo que se debe al último producto experimental lanzado, Spore.fun, que es el primer experimento de reproducción y evolución autónoma de IA. Combina el marco Eliza, Solana pump.fun y la computación verificable TEE, creando un ecosistema donde los agentes de IA no solo pueden sobrevivir, sino también reproducirse y adaptarse, completamente independientes de la intervención humana. Actualmente, la tercera generación de IA autónoma está en incubación, el valor de mercado de $SPORE ya ha superado los 13 millones, y el valor de mercado de $ADAM $EVE también ha superado los 1 millón, cosas interesantes siguen sucediendo, ¿crees que esto puede convertirse en la próxima narrativa de tendencia?
$PHA PHALA El resumen de fin de año 2024 ya ha sido publicado, este año el equipo ha hecho muchas cosas innovadoras y significativas https://phala.network/posts/phala-network-2024-year-in-review
$PHA A las 00:00 UTC del 3 de diciembre de 2024, Phala Network entrará oficialmente en su 6to Período de Halving.
Este hito es un gran paso hacia la construcción de un futuro sostenible y descentralizado para la comunidad de Phala. Agradecemos a nuestra comunidad por su apoyo inquebrantable.
$PHA reducirá su producción en un 25% el 3 de diciembre, actualmente la circulación total en la red es de 760 millones, la proporción de estacas es del 25.11%, el APY promedio es del 16.88%, ¿cuánto creen que alcanzará el precio de PHA en diciembre?
$PHA 10 🏆 finalistas en #EthGlobal, ¡3 aprovecharon el TEE de Phala! Este hackathon no fue ninguna broma: se seleccionó a los participantes entre más de 2750 asistentes.
Exploremos cómo#TEEestá transformando la Web3 a través de estos proyectos pioneros.