Binance Square

RIO_X

Markets by morning, life by afternoon. ... I trade to fund my freedom, not to lose my mind. Let’s make some money and actually enjoy it.
Abrir operación
Trader de alta frecuencia
4.6 años
1.7K+ Siguiendo
8.8K+ Seguidores
2.9K+ Me gusta
445 Compartido
Publicaciones
Cartera
·
--
la parte de Genius que subestimé más fue la integración de perp y, honestamente, solo lo entendí después de que realmente moví tamaño aquí está la fricción que nadie admite. el spot vive en un lugar. los perps viven en otro lado. haces trading de spot en tu terminal, luego haces un bridge, luego firmas, luego esperas, y tal vez termines en un venue de perp con una interfaz diferente y un saldo diferente. para cuando estás listo para tomar la posición de perp, la configuración que querías ya se fue. Genius colapsa eso. conviertes tu saldo de spot directamente en Hyperliquid USDC. sin gas. sin firma. de uno a treinta segundos. y luego estás comerciando perps en el libro de órdenes real de Hyperliquid - la verdadera profundidad, la verdadera liquidez - desde dentro de la misma terminal en la que recién comerciabas spot. sin una segunda plataforma sin una segunda interfaz sin un segundo saldo que gestionar. y no se detiene en Hyperliquid. puedes enrutar perps desde la interfaz de Genius a Aster también. una terminal, múltiples venues de perp, un saldo detrás de todo esto. noté esta semana - Aster listó el primer contrato perpetuo de GENIUS en abril, el token subió un 850% alrededor del lanzamiento, y había un fondo de premios de $200k ASTER por comerciar el nuevo contrato. y Hyperliquid en sí no es pequeño. tiene más del 70% del mercado de DEX de perp en interés abierto. $21.8 mil millones en volumen diario. ese es el libro de órdenes al que Genius te está conectando directamente. lo que sigo reflexionando es si colapsar spot y perp en un flujo sin fricción realmente hace que la gente comercie mejor, o simplemente facilita tomar apalancamiento que no te hubieras molestado en configurar en una segunda plataforma. honestamente no sé si un flujo sin fricción de spot a perp es una ventaja genuina para traders serios o si eliminar la fricción simplemente quita la pausa que estaba protegiendo silenciosamente a la gente de sobreapalancarse?? 🤔 #genius @GeniusOfficial $GENIUS {future}(GENIUSUSDT)
la parte de Genius que subestimé más fue la integración de perp y, honestamente, solo lo entendí después de que realmente moví tamaño
aquí está la fricción que nadie admite.
el spot vive en un lugar.
los perps viven en otro lado.
haces trading de spot en tu terminal, luego haces un bridge, luego firmas, luego esperas, y tal vez termines en un venue de perp con una interfaz diferente y un saldo diferente.
para cuando estás listo para tomar la posición de perp, la configuración que querías ya se fue.
Genius colapsa eso.
conviertes tu saldo de spot directamente en Hyperliquid USDC. sin gas. sin firma. de uno a treinta segundos. y luego estás comerciando perps en el libro de órdenes real de Hyperliquid - la verdadera profundidad, la verdadera liquidez - desde dentro de la misma terminal en la que recién comerciabas spot.
sin una segunda plataforma
sin una segunda interfaz
sin un segundo saldo que gestionar.
y no se detiene en Hyperliquid. puedes enrutar perps desde la interfaz de Genius a Aster también. una terminal, múltiples venues de perp, un saldo detrás de todo esto.
noté esta semana - Aster listó el primer contrato perpetuo de GENIUS en abril, el token subió un 850% alrededor del lanzamiento, y había un fondo de premios de $200k ASTER por comerciar el nuevo contrato.
y Hyperliquid en sí no es pequeño. tiene más del 70% del mercado de DEX de perp en interés abierto. $21.8 mil millones en volumen diario. ese es el libro de órdenes al que Genius te está conectando directamente.
lo que sigo reflexionando es si colapsar spot y perp en un flujo sin fricción realmente hace que la gente comercie mejor, o simplemente facilita tomar apalancamiento que no te hubieras molestado en configurar en una segunda plataforma.
honestamente no sé si un flujo sin fricción de spot a perp es una ventaja genuina para traders serios o si eliminar la fricción simplemente quita la pausa que estaba protegiendo silenciosamente a la gente de sobreapalancarse?? 🤔

#genius @GeniusOfficial $GENIUS
·
--
lo que nadie explica sobre la atribución es lo que pasa entre las puntuaciones y el pago 😂 las atribuciones se ejecutan. miles de puntuaciones de influencia a nivel de muestra salen. y luego, ¿qué?? la mayoría de las explicaciones se detienen ahí. como si el dinero encontrara mágicamente la billetera correcta. aquí está el paso real. cada muestra lleva un hash de registro que la vincula a su DataNet. el sistema suma toda la influencia de las muestras de un DataNet en I(Di, zt) - la influencia total de ese DataNet en esa salida. luego divide por el total de todos los DataNets para obtener W(Di, zt) - el peso proporcional. multiplica la piscina de contribuyentes por ese peso. ese es el pago. inguna persona en el proceso. los hashes deciden. las matemáticas deciden. el contrato se ejecuta. lo que me sorprende es que esto se vuelve a ejecutar en cada inferencia. tu DataNet gana más en las consultas que realmente influyó, menos en las que no. no es una recompensa plana. se mide por salida. noté que la mainnet ha estado ejecutando esto a nivel de protocolo desde noviembre, y el motor de atribución se parcheó a finales de enero para que los enlaces sobrevivan a las actualizaciones del modelo. la parte que sigo pensando -todo el pago depende de que esos hashes de registro sean correctos. un mapeo incorrecto y la división hereda el error de forma invisible. honestamente, no sé si la integridad del registro se mantiene lo suficientemente bien a gran escala para mantener los errores de agregación raros, o si el mapeo silencioso es un problema sistemático que nadie ha probado a gran volumen todavía?? 🤔 #OpenLedger @Openledger $OPEN {future}(OPENUSDT)
lo que nadie explica sobre la atribución es lo que pasa entre las puntuaciones y el pago 😂
las atribuciones se ejecutan.
miles de puntuaciones de influencia a nivel de muestra salen.
y luego, ¿qué??
la mayoría de las explicaciones se detienen ahí. como si el dinero encontrara mágicamente la billetera correcta.
aquí está el paso real.
cada muestra lleva un hash de registro que la vincula a su DataNet. el sistema suma toda la influencia de las muestras de un DataNet en I(Di, zt) - la influencia total de ese DataNet en esa salida. luego divide por el total de todos los DataNets para obtener W(Di, zt) - el peso proporcional.
multiplica la piscina de contribuyentes por ese peso.
ese es el pago.
inguna persona en el proceso. los hashes deciden. las matemáticas deciden. el contrato se ejecuta.
lo que me sorprende es que esto se vuelve a ejecutar en cada inferencia. tu DataNet gana más en las consultas que realmente influyó, menos en las que no. no es una recompensa plana. se mide por salida.
noté que la mainnet ha estado ejecutando esto a nivel de protocolo desde noviembre, y el motor de atribución se parcheó a finales de enero para que los enlaces sobrevivan a las actualizaciones del modelo.
la parte que sigo pensando -todo el pago depende de que esos hashes de registro sean correctos. un mapeo incorrecto y la división hereda el error de forma invisible.
honestamente, no sé si la integridad del registro se mantiene lo suficientemente bien a gran escala para mantener los errores de agregación raros, o si el mapeo silencioso es un problema sistemático que nadie ha probado a gran volumen todavía?? 🤔

#OpenLedger @OpenLedger $OPEN
·
--
Artículo
Miles de Puntuaciones de Influencia Salen. Nadie Explica Cómo Se Convierten en Pagos Reales.he estado revisando la matemática de atribución en la documentación de OpenLedger desde esta mañana y, honestamente, el paso que todos omiten es el que más importa 😅 aquí está la brecha. el motor de atribución está en funcionamiento. produce puntuaciones de influencia a nivel de muestra. miles de ellas. una por cada ejemplo de entrenamiento que tocó la salida. vale. pero esas son muestras individuales. potencialmente hay cientos de DataNets detrás de un solo modelo. y un contribuyente no posee una muestra. ellos poseen un DataNet. entonces, ¿cómo es que miles de pequeñas puntuaciones de muestra se convierten en un solo pago que cae en la billetera de un contribuyente?

Miles de Puntuaciones de Influencia Salen. Nadie Explica Cómo Se Convierten en Pagos Reales.

he estado revisando la matemática de atribución en la documentación de OpenLedger desde esta mañana y, honestamente, el paso que todos omiten es el que más importa 😅
aquí está la brecha.
el motor de atribución está en funcionamiento.
produce puntuaciones de influencia a nivel de muestra. miles de ellas. una por cada ejemplo de entrenamiento que tocó la salida.
vale.
pero esas son muestras individuales.
potencialmente hay cientos de DataNets detrás de un solo modelo. y un contribuyente no posee una muestra. ellos poseen un DataNet. entonces, ¿cómo es que miles de pequeñas puntuaciones de muestra se convierten en un solo pago que cae en la billetera de un contribuyente?
·
--
La semana pasada me encontré haciendo algo en Genius que no aprecié del todo hasta después y, honestamente, reformuló lo que realmente es el terminal. Estaba mirando un token antes de que se listara en cualquier lado. No en una lista de seguimiento. No en una página de "próximamente". Realmente comerciándolo. Pre-lanzamiento. La mayoría de la gente se entera de un token cuando llega a un intercambio mayor. Para entonces, el movimiento inicial ya ha ocurrido. Estás comprando de las personas que entraron antes que tú. Genius trae tokens pre-lanzamiento directamente al terminal. Four.Meme para tokens pre-lanzamiento en la cadena BNB. Arena para AvalAnche. Zora para nuevas listados de la cadena Base. y el feed se actualiza en tiempo real... detalles del token, liquidez, acciones de comercio, todo obtenido en vivo desde la fuente del launchpad. No estás esperando la lista. Estás comerciando con la cosa a medida que se vuelve disponible. La parte que me queda es lo que esto hace a la brecha de información. Normalmente, la ventaja de comerciar nuevos tokens pertenece a quienes tienen las conexiones del launchpad. Los insiders. Las personas que están observando cinco plataformas de lanzamiento diferentes a la vez. Genius colapsa todo eso en un solo feed. Revisé esta semana... las integraciones de launchpad cubren BNB, Avalanche y Base a través de Four.Meme, Arena y Zora. Listados en tiempo real directamente de cada fuente. Honestamente, no sé si traer acceso pre-lanzamiento a un solo terminal realmente nivela el campo para los traders regulares o solo significa que todos son recortados a la misma velocidad en lugar de que unos pocos sean recortados más lento?? #genius @GeniusOfficial $GENIUS {future}(GENIUSUSDT)
La semana pasada me encontré haciendo algo en Genius que no aprecié del todo hasta después y, honestamente, reformuló lo que realmente es el terminal.
Estaba mirando un token antes de que se listara en cualquier lado.
No en una lista de seguimiento.
No en una página de "próximamente".
Realmente comerciándolo.
Pre-lanzamiento.
La mayoría de la gente se entera de un token cuando llega a un intercambio mayor.
Para entonces, el movimiento inicial ya ha ocurrido.
Estás comprando de las personas que entraron antes que tú.
Genius trae tokens pre-lanzamiento directamente al terminal.
Four.Meme para tokens pre-lanzamiento en la cadena BNB.
Arena para AvalAnche.
Zora para nuevas listados de la cadena Base.
y el feed se actualiza en tiempo real... detalles del token, liquidez, acciones de comercio, todo obtenido en vivo desde la fuente del launchpad.
No estás esperando la lista.
Estás comerciando con la cosa a medida que se vuelve disponible.
La parte que me queda es lo que esto hace a la brecha de información.
Normalmente, la ventaja de comerciar nuevos tokens pertenece a quienes tienen las conexiones del launchpad.
Los insiders.
Las personas que están observando cinco plataformas de lanzamiento diferentes a la vez.
Genius colapsa todo eso en un solo feed.
Revisé esta semana... las integraciones de launchpad cubren BNB, Avalanche y Base a través de Four.Meme, Arena y Zora.
Listados en tiempo real directamente de cada fuente.
Honestamente, no sé si traer acceso pre-lanzamiento a un solo terminal realmente nivela el campo para los traders regulares o solo significa que todos son recortados a la misma velocidad en lugar de que unos pocos sean recortados más lento??
#genius @GeniusOfficial $GENIUS
·
--
hice unos cálculos rápidos sobre el hosting de modelos de IA esta mañana y, honestamente, el número de OpenLoRA me dejó helado. el viejo modelo. un modelo ajustado. una GPU. una factura que corre para siempre. quiero desplegar diez modelos. pagar por diez GPUs. los costos de infraestructura devoran los ingresos por inferencia antes de que empieces. la mayoría de los modelos ajustados nunca se despliegan por exactamente esta razón. OpenLoRA ejecuta miles de ellos en una sola GPU. no es magia. es a través de la carga dinámica de adaptadores. el modelo base permanece residente. pesos de adaptador pequeños se cargan justo a tiempo cuando llega una solicitud. luego se liberan. hay un núcleo CUDA llamado SGMV que agrupa solicitudes para diferentes adaptadores en una sola operación concurrente. diez modelos. una llamada de GPU agrupada. OpenLedger dice que esto reduce el costo de despliegue hasta un 90%. una vez que entiendes el mecanismo de carga, ese número deja de sonar como marketing. verifiqué esta semana, OpenLoRA v2.0 está en vivo. 61.71% del suministro total de OPEN está destinado a subvencionar a los primeros creadores. el objetivo es claro: hacer que el despliegue sea tan barato que los modelos especializados realmente se construyan. honestamente, no sé si un despliegue barato es la clave que finalmente hace viables miles de modelos de nicho o si la penalización por inicio en adaptadores poco utilizados acaba matando la larga cola de todos modos?? #OpenLedger @Openledger $OPEN {future}(OPENUSDT)
hice unos cálculos rápidos sobre el hosting de modelos de IA esta mañana y, honestamente, el número de OpenLoRA me dejó helado.
el viejo modelo.
un modelo ajustado.
una GPU.
una factura que corre para siempre.
quiero desplegar diez modelos.
pagar por diez GPUs.
los costos de infraestructura devoran los ingresos por inferencia antes de que empieces.
la mayoría de los modelos ajustados nunca se despliegan por exactamente esta razón.
OpenLoRA ejecuta miles de ellos en una sola GPU.
no es magia.
es a través de la carga dinámica de adaptadores.
el modelo base permanece residente.
pesos de adaptador pequeños se cargan justo a tiempo cuando llega una solicitud.
luego se liberan.
hay un núcleo CUDA llamado SGMV que agrupa solicitudes para diferentes adaptadores en una sola operación concurrente.
diez modelos. una llamada de GPU agrupada.
OpenLedger dice que esto reduce el costo de despliegue hasta un 90%.
una vez que entiendes el mecanismo de carga, ese número deja de sonar como marketing.
verifiqué esta semana, OpenLoRA v2.0 está en vivo.
61.71% del suministro total de OPEN está destinado a subvencionar a los primeros creadores.
el objetivo es claro: hacer que el despliegue sea tan barato que los modelos especializados realmente se construyan.
honestamente, no sé si un despliegue barato es la clave que finalmente hace viables miles de modelos de nicho o si la penalización por inicio en adaptadores poco utilizados acaba matando la larga cola de todos modos??
#OpenLedger @OpenLedger $OPEN
·
--
Artículo
Cada Modelo que Desplegué Necesitaba Su Propia GPU. Esa Matemática Nunca Tuvo Sentido Para Mí.hice los cálculos sobre alojar unos pocos modelos ajustados el año pasado y honestamente el costo rompió toda la idea antes de que siquiera comenzara. aquí está el problema del que nadie habla. el ajuste fino se volvió barato. desplegar no lo hizo. ahora puedes ajustar un modelo pequeño por unos pocos dólares. QLoRA, una GPU de consumo, una tarde. hecho pero luego realmente quieres servir ese modelo. y de repente cada uno necesita su propia instancia de GPU funcionando 24/7. un modelo. una GPU. una factura que nunca para. tenía cuatro modelos que quería ejecutar. las matemáticas de alojamiento significaban cuatro instancias separadas.

Cada Modelo que Desplegué Necesitaba Su Propia GPU. Esa Matemática Nunca Tuvo Sentido Para Mí.

hice los cálculos sobre alojar unos pocos modelos ajustados el año pasado y honestamente el costo rompió toda la idea antes de que siquiera comenzara.
aquí está el problema del que nadie habla.
el ajuste fino se volvió barato.
desplegar no lo hizo.
ahora puedes ajustar un modelo pequeño por unos pocos dólares.
QLoRA, una GPU de consumo, una tarde.
hecho
pero luego realmente quieres servir ese modelo.
y de repente cada uno necesita su propia instancia de GPU funcionando 24/7.
un modelo. una GPU. una factura que nunca para.
tenía cuatro modelos que quería ejecutar.
las matemáticas de alojamiento significaban cuatro instancias separadas.
·
--
algo que noté mientras releía los docs de Genius esta semana que honestamente había pasado por alto la primera vez usdGG. la mayoría de las terminales de trading tratan el capital inactivo como un problema de espera. estás en una operación. o no lo estás. si no lo estás, tu dinero se queda parado. Genius construyó yiEld directamente en la capa del portafolio. mantén usdGG en tu dashboard. obtén rendimiento. no hay necesidad de cambiar a un protocolo de rendimiento separado. ninguna configuración RPC n0. sin ventanas emergentes. sin transacciones de aprobación. el rendimiento es una propiedad de mantener el activo dentro de la terminal. no es una acción separada que tengas que recordar realizar. realmente creo que esto es más significativo de lo que parece. la razón por la que la mayoría de los trAders no hacen yield-farming con capital inactivo no es que no quieran el rendimiento. es que la fricción de mover capital a un protocolo de rendimiento y volver a sacarlo devora el retorno. especialmente para períodos inactivos a corto plazo entre posiciones. usdGG elimina esa fricción por completo. el capital gana mientras espera. sin que tú hagas nada. esta semana revisé —Ghost Orders divide operaciones en hasta 500 wallets a través de MPC auditorías de seguridad completadas por Halborn, Cantina, HackenProof y BOrg Research. las características de rendimiento de usdGG actualmente están en expansión activa. plataforma con más de $15B en volumen total. honestamente no sé si el rendimiento nativo del portafolio cambia la forma en que los traders profesionales piensan sobre la eficiencia del capital o si el rendimiento sobre capital inactivo entre posiciones es simplemente demasiado pequeño para realmente importar en los tamaños con los que la mayoría de los usuarios operan?? #genius @GeniusOfficial $GENIUS {future}(GENIUSUSDT)
algo que noté mientras releía los docs de Genius esta semana que honestamente había pasado por alto la primera vez
usdGG.
la mayoría de las terminales de trading tratan el capital inactivo como un problema de espera.
estás en una operación.
o no lo estás.
si no lo estás, tu dinero se queda parado.
Genius construyó yiEld directamente en la capa del portafolio.
mantén usdGG en tu dashboard.
obtén rendimiento.
no hay necesidad de cambiar a un protocolo de rendimiento separado.
ninguna configuración RPC n0.
sin ventanas emergentes.
sin transacciones de aprobación.
el rendimiento es una propiedad de mantener el activo dentro de la terminal.
no es una acción separada que tengas que recordar realizar.
realmente creo que esto es más significativo de lo que parece.
la razón por la que la mayoría de los trAders no hacen yield-farming con capital inactivo no es que no quieran el rendimiento.
es que la fricción de mover capital a un protocolo de rendimiento y volver a sacarlo devora el retorno.
especialmente para períodos inactivos a corto plazo entre posiciones.
usdGG elimina esa fricción por completo.
el capital gana mientras espera.
sin que tú hagas nada.
esta semana revisé —Ghost Orders divide operaciones en hasta 500 wallets a través de MPC
auditorías de seguridad completadas por Halborn, Cantina, HackenProof y BOrg Research.
las características de rendimiento de usdGG actualmente están en expansión activa.
plataforma con más de $15B en volumen total.
honestamente no sé si el rendimiento nativo del portafolio cambia la forma en que los traders profesionales piensan sobre la eficiencia del capital o si el rendimiento sobre capital inactivo entre posiciones es simplemente demasiado pequeño para realmente importar en los tamaños con los que la mayoría de los usuarios operan??
#genius @GeniusOfficial $GENIUS
·
--
Revisé la salida de benchmarking de ModelFactory esta mañana después de una sesión de entrenamiento y, honestamente, lo que me impactó no fue el puntaje de perplexidad, sino el panel de atribución de RAG. Le hice una pregunta al modelo. Respondió. Y luego pude ver exactamente qué contribución de DataNet influyó en esa respuesta específica. No fue "se utilizó este conjunto de datos". ¿Qué punto de datos exacto? ¿Qué contribuyente? ¿Con qué metadatos lo etiquetaron? La pista de citación llega hasta el registro en cadena. He usado sistemas RAG durante dos años. Nunca he visto uno que te muestre la pista de atribución a ese nivel de detalle. La mayoría de las herramientas de explicabilidad te dicen qué capa del modelo se activó. Esto te dice qué humano subió los datos de entrenamiento que dieron forma a la respuesta. Esa es una transparencia fundamentalmente diferente. QLoRA también está haciendo un trabajo real aquí, modelo de 7B en 5 a 6GB de VRAM en lugar de 14GB. Lo que significa que el ajuste fino que solía requerir un A100 ahora funciona en hardware que un desarrollador solitario puede costear. Se espera que el gasto global en IA alcance los $375 mil millones este año; la mayor parte de eso fluye hacia modelos que nadie puede rastrear. ModelFactory está construyendo el rastro en el panel desde el primer día. Honestamente, no sé si la atribución RAG cambia cómo las organizaciones realmente piensan sobre la responsabilidad de la IA o si la explicabilidad sigue siendo una característica que se ve genial en las demostraciones y se ignora en producción?? #OpenLedger @Openledger $OPEN {future}(OPENUSDT)
Revisé la salida de benchmarking de ModelFactory esta mañana después de una sesión de entrenamiento y, honestamente, lo que me impactó no fue el puntaje de perplexidad, sino el panel de atribución de RAG. Le hice una pregunta al modelo. Respondió. Y luego pude ver exactamente qué contribución de DataNet influyó en esa respuesta específica. No fue "se utilizó este conjunto de datos". ¿Qué punto de datos exacto? ¿Qué contribuyente? ¿Con qué metadatos lo etiquetaron? La pista de citación llega hasta el registro en cadena. He usado sistemas RAG durante dos años. Nunca he visto uno que te muestre la pista de atribución a ese nivel de detalle. La mayoría de las herramientas de explicabilidad te dicen qué capa del modelo se activó. Esto te dice qué humano subió los datos de entrenamiento que dieron forma a la respuesta. Esa es una transparencia fundamentalmente diferente. QLoRA también está haciendo un trabajo real aquí, modelo de 7B en 5 a 6GB de VRAM en lugar de 14GB. Lo que significa que el ajuste fino que solía requerir un A100 ahora funciona en hardware que un desarrollador solitario puede costear. Se espera que el gasto global en IA alcance los $375 mil millones este año; la mayor parte de eso fluye hacia modelos que nadie puede rastrear. ModelFactory está construyendo el rastro en el panel desde el primer día. Honestamente, no sé si la atribución RAG cambia cómo las organizaciones realmente piensan sobre la responsabilidad de la IA o si la explicabilidad sigue siendo una característica que se ve genial en las demostraciones y se ignora en producción?? #OpenLedger @OpenLedger $OPEN
·
--
Artículo
He Ajustado Modelos Antes. Nunca Sin Escribir Una Sola Línea de Configuración.pasé la mayor parte de la tarde del jueves pasado en ModelFactory y, honestamente, no estaba seguro de qué esperar al entrar. he hecho ajustes finos antes. la forma tradicional. eliges un modelo base. configuras tu entorno. escribes tu configuración de entrenamiento. luchas con las versiones de dependencias durante una hora. ejecutas el trabajo. te concentras en las curvas de pérdida y tratas de decidir si lo que ves es sobreajuste o solo ruido. y luego, si quieres entender POR QUÉ el modelo está produciendo ciertas salidas, buena suerte. la mayoría de los pipelines de ajuste fino no tienen un mecanismo para eso.

He Ajustado Modelos Antes. Nunca Sin Escribir Una Sola Línea de Configuración.

pasé la mayor parte de la tarde del jueves pasado en ModelFactory y, honestamente, no estaba seguro de qué esperar al entrar.
he hecho ajustes finos antes.
la forma tradicional.
eliges un modelo base.
configuras tu entorno.
escribes tu configuración de entrenamiento.
luchas con las versiones de dependencias durante una hora.
ejecutas el trabajo.
te concentras en las curvas de pérdida y tratas de decidir si lo que ves es sobreajuste o solo ruido.
y luego, si quieres entender POR QUÉ el modelo está produciendo ciertas salidas, buena suerte.
la mayoría de los pipelines de ajuste fino no tienen un mecanismo para eso.
·
--
anoche pasé por el mecanismo de airdrop de Genius correctamente por primera vez y, honestamente, cuanto más lo pensaba, más me daba cuenta de que esto no era una decisión de distribución 😂 sino un mecanismo de filtrado. 7 días después del TGE. dos opciones. reclamar ahora y perder el 70% para siempre. 100 GENIUS se convierten en 30 GENIUS. los 70 se van para siempre. borrados. o no hacer nada dejar que la ventana se cierre tu asignación completa se bloquea en un contrato inteligente por un año. 100 GENIUS se queda en 100 GENIUS. el diseño está haciendo una pregunta. ¿crees en esto o no? las personas que necesitaban liquidez de inmediato — tomaron el 30%. tomaron una decisión racional dada su situación. las personas que mantuvieron — señalaron convicción. no con palabras. con un bloqueo de 12 meses. realmente respeto el mecanismo. la mayoría de los diseños de airdrop intentan prevenir el dumping a través de vesting. Genius hizo que el dumping fuera opcional pero catastróficamente caro. same resultado. marco psicológico completamente diferente. y el equipo comprometido a los mismos términos. todos los miembros de Shuttle Labs e inversores bloqueados por al menos un año. ninguna salida antes de que la comunidad obtenga lo suyo. noté esta semana— GENIUS ha subido un 338% desde su mínimo histórico. suministro circulante en 335.4 millones de un total de mil millones. muchos tokens aún por venir. honestamente no sé si el mecanismo de quemar-o-ganar realmente filtró a los creyentes a largo plazo o simplemente filtró a las personas que podían permitirse esperar y castigó a todos los que no pudieron?? #genius @GeniusOfficial $GENIUS {future}(GENIUSUSDT)
anoche pasé por el mecanismo de airdrop de Genius correctamente por primera vez y, honestamente, cuanto más lo pensaba, más me daba cuenta de que esto no era una decisión de distribución 😂
sino un mecanismo de filtrado.
7 días después del TGE.
dos opciones.
reclamar ahora y perder el 70% para siempre.
100 GENIUS se convierten en 30 GENIUS.
los 70 se van para siempre.
borrados.
o no hacer nada
dejar que la ventana se cierre
tu asignación completa se bloquea en un contrato inteligente por un año.
100 GENIUS se queda en 100 GENIUS.
el diseño está haciendo una pregunta.
¿crees en esto o no?
las personas que necesitaban liquidez de inmediato — tomaron el 30%.
tomaron una decisión racional dada su situación.
las personas que mantuvieron — señalaron convicción.
no con palabras.
con un bloqueo de 12 meses.
realmente respeto el mecanismo.
la mayoría de los diseños de airdrop intentan prevenir el dumping a través de vesting.
Genius hizo que el dumping fuera opcional pero catastróficamente caro.
same resultado.
marco psicológico completamente diferente.
y el equipo comprometido a los mismos términos.
todos los miembros de Shuttle Labs e inversores bloqueados por al menos un año.
ninguna salida antes de que la comunidad obtenga lo suyo.
noté esta semana— GENIUS ha subido un 338% desde su mínimo histórico.
suministro circulante en 335.4 millones de un total de mil millones.
muchos tokens aún por venir.
honestamente no sé si el mecanismo de quemar-o-ganar realmente filtró a los creyentes a largo plazo o simplemente filtró a las personas que podían permitirse esperar y castigó a todos los que no pudieron??

#genius @GeniusOfficial $GENIUS
·
--
releyendo los documentos de staking de OPEN esta mañana y honestamente el detalle que me sigue molestando no es el rendimiento 😂 es el slashing. la mayoría de los sistemas de staking apuestan tokens. OpenLedger también apuesta agentes de IA. lo que significa que un agente que envía datos de baja calidad, o intenta manipular el sistema de atribución, o se comporta de manera adversarial —pierde su stake. consecuencias económicas. para una máquina. no solo para la persona que la opera. me parece genuinamente interesante. pues el problema habitual con los sistemas de IA que operan de forma autónoma es que el costo de un mal comportamiento recae en todos excepto en el sistema mismo. aquí el sistema tiene algo en juego. El staking flexible te permite retirar cuando quieras. El staking bloqueado ofrece mayores rendimientos a cambio de comprometerse por un período fijo. interés compuesto calculado continuamente en ambos. verifiqué esta mañana — Open Staking está activo en Ethereum y BSC en este momento. TGE lanzó 215.5 millones de OPEN líquidos. programa de recompra en marcha: los fondos del tesoro queman tokens permanentemente, divulgados en la cadena. Polychain Capital, HashKey, Balaji Srinivasan todos dentro. honestamente no sé si el slashing de agentes realmente cambia cómo se comportan los sistemas de IA a gran escala o simplemente crea un mecanismo de castigo que se evita en el momento en que los agentes son lo suficientemente astutos como para ocultar sus errores?? #OpenLedger @Openledger $OPEN {future}(OPENUSDT)
releyendo los documentos de staking de OPEN esta mañana y honestamente el detalle que me sigue molestando no es el rendimiento 😂
es el slashing.
la mayoría de los sistemas de staking apuestan tokens.
OpenLedger también apuesta agentes de IA.
lo que significa que un agente que envía datos de baja calidad, o intenta manipular el sistema de atribución, o se comporta de manera adversarial —pierde su stake.
consecuencias económicas.
para una máquina.
no solo para la persona que la opera.
me parece genuinamente interesante.
pues el problema habitual con los sistemas de IA que operan de forma autónoma es que el costo de un mal comportamiento recae en todos excepto en el sistema mismo.
aquí el sistema tiene algo en juego.
El staking flexible te permite retirar cuando quieras.
El staking bloqueado ofrece mayores rendimientos a cambio de comprometerse por un período fijo.
interés compuesto calculado continuamente en ambos.
verifiqué esta mañana — Open Staking está activo en Ethereum y BSC en este momento.
TGE lanzó 215.5 millones de OPEN líquidos.
programa de recompra en marcha: los fondos del tesoro queman tokens permanentemente, divulgados en la cadena.
Polychain Capital, HashKey, Balaji Srinivasan todos dentro.
honestamente no sé si el slashing de agentes realmente cambia cómo se comportan los sistemas de IA a gran escala o simplemente crea un mecanismo de castigo que se evita en el momento en que los agentes son lo suficientemente astutos como para ocultar sus errores??
#OpenLedger @OpenLedger $OPEN
·
--
Artículo
Cuatro trabajos diferentes. Un token. No entendí lo que tenía hasta que leí los documentos correctamentecompré OPEN temprano y, honestamente, durante las primeras semanas lo traté como cualquier otro token L2 😂 gas para transacciones. eso es todo. sabía que hacía más que eso, pero no me había sentado realmente a desglosar lo que "más" significaba. hice eso esta semana. y la imagen que se fue formando fue mucho más interesante de lo que esperaba. OPEN hace cuatro cosas genuinamente diferentes dentro del mismo ecosistema. y cada uno crea un tipo diferente de demanda. primero. gas. cada transacción en OpenLedger L2 — implementación de modelo, contribución de datos, llamada de inferencia, ejecución de contrato inteligente — cuesta OPEN.

Cuatro trabajos diferentes. Un token. No entendí lo que tenía hasta que leí los documentos correctamente

compré OPEN temprano y, honestamente, durante las primeras semanas lo traté como cualquier otro token L2 😂
gas para transacciones.
eso es todo.
sabía que hacía más que eso, pero no me había sentado realmente a desglosar lo que "más" significaba.
hice eso esta semana.
y la imagen que se fue formando fue mucho más interesante de lo que esperaba.
OPEN hace cuatro cosas genuinamente diferentes dentro del mismo ecosistema.
y cada uno crea un tipo diferente de demanda.
primero.
gas.
cada transacción en OpenLedger L2 — implementación de modelo, contribución de datos, llamada de inferencia, ejecución de contrato inteligente — cuesta OPEN.
·
--
algo que leí esta semana realmente me detuvo a mitad de desplazamiento y, honestamente, tuve que dejar mi teléfono y pensar en ello por un segundo 😂 OpenLedger lanzó algo llamado x402 en febrero de 2026. la idea es sencilla de la manera en que las ideas realmente importantes siempre lo son. un máquina hace una solicitud API. el servidor responde con un 402. la máquina lee el precio codificado en el encabezado. negocia. broadcasts una transacción en OPEN. paga. obtiene el contenido. todo eso. dentro de un solo ciclo de solicitud-respuesta HTTP. ningún humano lo aprobó. no se generó ninguna factura. no se involucró ningún procesador de pagos. la IA tomó la decisión. la IA pagó. y aquí está la parte que sigue resonando en mí. en OpenLedger, cuando un adaptador bien ajustado se llama en inferencia, se ejecuta la atribución. la contribución del adaptador se mide.\nlas tarifas regresan al creador a través de OPEN. combina eso con x402. hora tienes un modelo que valora su propia inferencia. recoge pagos de manera autónoma. y paga regalías a cada DataNet que contribuyó a su entrenamiento. dentro de un ciclo de solicitud. ningún humano en el bucle en ningún momento. continúo pensando en lo que eso realmente significa a gran escala. no solo técnicamente. económicamente. honestamente no sé si x402 más la atribución del adaptador es la primera visión real de una economía de máquinas o solo una demostración elegante que se rompe en el momento en que intentas escalarla más allá de un entorno controlado?? 🤔 #OpenLedger @Openledger $OPEN {future}(OPENUSDT)
algo que leí esta semana realmente me detuvo a mitad de desplazamiento y, honestamente, tuve que dejar mi teléfono y pensar en ello por un segundo 😂
OpenLedger lanzó algo llamado x402 en febrero de 2026.
la idea es sencilla de la manera en que las ideas realmente importantes siempre lo son.
un máquina hace una solicitud API.
el servidor responde con un 402.
la máquina lee el precio codificado en el encabezado.
negocia.
broadcasts una transacción en OPEN.
paga.
obtiene el contenido.
todo eso.
dentro de un solo ciclo de solicitud-respuesta HTTP.
ningún humano lo aprobó.
no se generó ninguna factura.
no se involucró ningún procesador de pagos.
la IA tomó la decisión.
la IA pagó.
y aquí está la parte que sigue resonando en mí.
en OpenLedger, cuando un adaptador bien ajustado se llama en inferencia, se ejecuta la atribución.
la contribución del adaptador se mide.\nlas tarifas regresan al creador a través de OPEN.
combina eso con x402.
hora tienes un modelo que valora su propia inferencia.
recoge pagos de manera autónoma.
y paga regalías a cada DataNet que contribuyó a su entrenamiento.
dentro de un ciclo de solicitud.
ningún humano en el bucle en ningún momento.
continúo pensando en lo que eso realmente significa a gran escala.
no solo técnicamente.
económicamente.
honestamente no sé si x402 más la atribución del adaptador es la primera visión real de una economía de máquinas o solo una demostración elegante que se rompe en el momento en que intentas escalarla más allá de un entorno controlado?? 🤔
#OpenLedger @OpenLedger $OPEN
·
--
Artículo
El ajuste fino me llevó cuatro días. Nadie me dijo que podría seguir pagándome después.ajusté finamente un modelo pequeño con datos específicos del dominio hace unos ocho meses y, honestamente, toda la experiencia me dejó frío 😂 no porque el modelo fuera malo. funcionó. sorprendentemente bien, de hecho. pero en el momento en que lo implementé, la relación económica terminó. pasé cuatro días en la curación del dataset, limpieza, ajuste de parámetros. el modelo salió al mundo. y eso fue todo. sin visibilidad de cuán a menudo se utilizó. sin registro de qué salidas vinieron de mi ajuste fino versus el modelo base. sin compensación cuando alguien más lo llamó.

El ajuste fino me llevó cuatro días. Nadie me dijo que podría seguir pagándome después.

ajusté finamente un modelo pequeño con datos específicos del dominio hace unos ocho meses y, honestamente, toda la experiencia me dejó frío 😂
no porque el modelo fuera malo.
funcionó.
sorprendentemente bien, de hecho.
pero en el momento en que lo implementé, la relación económica terminó.
pasé cuatro días en la curación del dataset, limpieza, ajuste de parámetros.
el modelo salió al mundo.
y eso fue todo.
sin visibilidad de cuán a menudo se utilizó.
sin registro de qué salidas vinieron de mi ajuste fino versus el modelo base.
sin compensación cuando alguien más lo llamó.
·
--
el mes pasado, moví activos a través de cuatro cadenas diferentes y, sinceramente, perdí la noción de qué aprobación era para qué, y al final, solo estaba haciendo clic en las ventanas emergentes como un zombi. no es una exageración. cada puente que usé tenía su propio flujo de firma. su propio requisito de gas en el token de origen. su propia ventana de confirmación que tenía que ver. ninguno de ellos me hizo aprobar el token, luego aprobar el contrato del puente, y luego firmar la transferencia real. tres ventanas emergentes de billetera separadas para un solo movimiento. y luego me enteré del Protocolo de Puente Genius. GBP es interoperabilidad basada en la intención. describes el movimiento que quieres. cadena de origen, cadena de destino, token, cantidad. eso es todo. el protocolo se encarga de la ruta. lógica de múltiples saltos, descubrimiento de liquidez, finalización del puente—todo abstracto. gas gratis sin firma tiempos de liquidación entre uno y treinta segundos. y es cinco veces más barato que las opciones de puente estándar que estaba utilizando antes. realmente volví y calculé lo que pagué en tarifas de puente el mes pasado. el número era embarazoso. me di cuenta esta semana —Genius ya procesó más de $3 mil millones en volumen total antes de que ocurriera TGE. la estructura de referidos paga el 35% de las tarifas de trading en efectivo. para siempre. Las Billeteras Fantasma son solo por invitación y aún se están llenando. esta cosa sigue creciendo en silencio. lo que me queda es que el puente siempre ha sido el momento en que DeFi se siente más hostil. es el paso que te recuerda que estás utilizando una infraestructura que realmente no fue hecha para humanos. GBP es la primera vez que un puente se siente como si lo fuera. sinceramente no sé si la interoperabilidad cruzada basada en la intención es lo que finalmente hace que multi-chain se sienta sin problemas o solo otra capa de abstracción que se rompe de maneras interesantes cuando las condiciones se vuelven raras?? #genius @GeniusOfficial $GENIUS {future}(GENIUSUSDT)
el mes pasado, moví activos a través de cuatro cadenas diferentes y, sinceramente, perdí la noción de qué aprobación era para qué, y al final, solo estaba haciendo clic en las ventanas emergentes como un zombi.
no es una exageración.
cada puente que usé tenía su propio flujo de firma.
su propio requisito de gas en el token de origen.
su propia ventana de confirmación que tenía que ver.
ninguno de ellos me hizo aprobar el token, luego aprobar el contrato del puente, y luego firmar la transferencia real.
tres ventanas emergentes de billetera separadas para un solo movimiento.
y luego me enteré del Protocolo de Puente Genius.
GBP es interoperabilidad basada en la intención.
describes el movimiento que quieres.
cadena de origen, cadena de destino, token, cantidad.
eso es todo.
el protocolo se encarga de la ruta.
lógica de múltiples saltos, descubrimiento de liquidez, finalización del puente—todo abstracto.
gas gratis
sin firma
tiempos de liquidación entre uno y treinta segundos.
y es cinco veces más barato que las opciones de puente estándar que estaba utilizando antes.
realmente volví y calculé lo que pagué en tarifas de puente el mes pasado.
el número era embarazoso.
me di cuenta esta semana —Genius ya procesó más de $3 mil millones en volumen total antes de que ocurriera TGE.
la estructura de referidos paga el 35% de las tarifas de trading en efectivo. para siempre.
Las Billeteras Fantasma son solo por invitación y aún se están llenando.
esta cosa sigue creciendo en silencio.
lo que me queda es que el puente siempre ha sido el momento en que DeFi se siente más hostil.
es el paso que te recuerda que estás utilizando una infraestructura que realmente no fue hecha para humanos.
GBP es la primera vez que un puente se siente como si lo fuera.
sinceramente no sé si la interoperabilidad cruzada basada en la intención es lo que finalmente hace que multi-chain se sienta sin problemas o solo otra capa de abstracción que se rompe de maneras interesantes cuando las condiciones se vuelven raras??

#genius @GeniusOfficial $GENIUS
·
--
Artículo
Finalmente entiendo qué es el VIBE-CODING....alguien me preguntó la semana pasada qué era realmente el vibecoding y, honestamente, me costó dar la respuesta 😂 no porque no lo entienda. porque la respuesta honesta es incómoda. describí un agente a OpenLedger en lenguaje sencillo qué debería monitorear qué condiciones deberían activarlo qué debería hacer cuando esas condiciones coincidan. y funcionó pero no pude explicar completamente el paso donde mis palabras se convirtieron en el comportamiento del agente. eso no es una crítica a la plataforma. ese es en realidad el punto de lo que construyó OpenLedger.

Finalmente entiendo qué es el VIBE-CODING....

alguien me preguntó la semana pasada qué era realmente el vibecoding y, honestamente, me costó dar la respuesta 😂
no porque no lo entienda.
porque la respuesta honesta es incómoda.
describí un agente a OpenLedger en lenguaje sencillo
qué debería monitorear
qué condiciones deberían activarlo
qué debería hacer cuando esas condiciones coincidan.
y funcionó
pero no pude explicar completamente el paso donde mis palabras se convirtieron en el comportamiento del agente.
eso no es una crítica a la plataforma.
ese es en realidad el punto de lo que construyó OpenLedger.
·
--
Tuve un momento interesante esta semana tratando de explicar vibecoding a alguien que nunca ha construido un agente y, honestamente, la explicación seguía fallando en el mismo punto. Seguían preguntando. "Pero, ¿dónde ocurre la traducción?" y yo seguía sin tener una respuesta clara porque la respuesta honesta es sucede dentro de la plataforma no en tus manos. El vibecoding de OpenLedger significa que describes al agente en lenguaje simple, lo que observó, qué lo activa, qué hace, y la configuración estructurada que realmente corre en producción se construye a partir de esa descripción. Nunca tocas el despliegue, jamás escribes el andamiaje, la idea entra, el agente sale. La parte que me hizo pensar es lo que OpenLedger dijo sobre hacia dónde se dirige esto: Mercado de IA confirmado para 2026, modelos y agentes desplegados allí, las tarifas de uso se dirigen automáticamente a los contribuyentes mediante contratos inteligentes. El vibecoding es cómo las personas que entienden el dominio—pero no el código—realmente pueden participar en esa economía. Honestamente, no sé si eliminar la capa de configuración hace que los agentes sean más accesibles o solo oculta la complejidad hasta que algo se rompe en producción?? #OpenLedger @Openledger $OPEN {future}(OPENUSDT)
Tuve un momento interesante esta semana tratando de explicar vibecoding a alguien que nunca ha construido un agente y, honestamente, la explicación seguía fallando en el mismo punto.
Seguían preguntando.
"Pero, ¿dónde ocurre la traducción?"
y yo seguía sin tener una respuesta clara
porque la respuesta honesta es
sucede dentro de la plataforma
no en tus manos.
El vibecoding de OpenLedger significa que describes al agente en lenguaje simple,
lo que observó,
qué lo activa,
qué hace,
y la configuración estructurada que realmente corre en producción se construye a partir de esa descripción.
Nunca tocas el despliegue,
jamás escribes el andamiaje,
la idea entra,
el agente sale.
La parte que me hizo pensar es lo que OpenLedger dijo sobre hacia dónde se dirige esto:
Mercado de IA confirmado para 2026,
modelos y agentes desplegados allí,
las tarifas de uso se dirigen automáticamente a los contribuyentes mediante contratos inteligentes.
El vibecoding es cómo las personas que entienden el dominio—pero no el código—realmente pueden participar en esa economía.
Honestamente, no sé si eliminar la capa de configuración hace que los agentes sean más accesibles o solo oculta la complejidad hasta que algo se rompe en producción??

#OpenLedger @OpenLedger $OPEN
·
--
he estado revisando cómo funcionan realmente los puntos de la Temporada 2 en Genius y, honestamente, la estructura es más interesante de lo que esperaba. la mayoría de los sistemas de puntos te dan una recompensa fija por alcanzar un objetivo. negocia X cantidad. obtén Y puntos. hecho. La Temporada 2 es diferente. 1500000 GP se distribuyen cada día. ese pool es fijo. lo que ganas es tu parte de eso. no es un número fijo. es un porcentaje. lo que significa que la pregunta nunca es "¿alcancé el objetivo?" sino "¿qué porcentaje del volumen total de la plataforma generé hoy?" es un juego fundamentalmente diferente. en un día cuando el volumen total de la plataforma es bajo, una operación más pequeña captura una mayor parte. la consistencia a lo largo de 120 días supera un gran pico. la persona que aparece todos los días posee más de la emisión acumulativa que la persona que opera en grande una vez y desaparece. noté esta semana —Genius alcanzó $2B en una sola semana después del anuncio de YZi Labs. CoinMarketCap destacó la tecnología de enrutamiento exclusiva de la plataforma en abril. este no es un proyecto silencioso. el pool de GP está fijado en 200M para la Temporada 2. sin inflación sin expansión tu parte es la única variable. honestamente no sé si el modelo diario pro-rata recompensa a los traders que más lo merecen o solo a los que descifraron la matemática más rápido?? #genius @GeniusOfficial $GENIUS {future}(GENIUSUSDT)
he estado revisando cómo funcionan realmente los puntos de la Temporada 2 en Genius y, honestamente, la estructura es más interesante de lo que esperaba.
la mayoría de los sistemas de puntos te dan una recompensa fija por alcanzar un objetivo.
negocia X cantidad.
obtén Y puntos.
hecho.
La Temporada 2 es diferente.
1500000 GP se distribuyen cada día.
ese pool es fijo.
lo que ganas es tu parte de eso.
no es un número fijo.
es un porcentaje.
lo que significa que la pregunta nunca es "¿alcancé el objetivo?"
sino "¿qué porcentaje del volumen total de la plataforma generé hoy?"
es un juego fundamentalmente diferente.
en un día cuando el volumen total de la plataforma es bajo,
una operación más pequeña captura una mayor parte.
la consistencia a lo largo de 120 días supera un gran pico.
la persona que aparece todos los días posee más de la emisión acumulativa que la persona que opera en grande una vez y desaparece.
noté esta semana —Genius alcanzó $2B en una sola semana después del anuncio de YZi Labs.
CoinMarketCap destacó la tecnología de enrutamiento exclusiva de la plataforma en abril.
este no es un proyecto silencioso.
el pool de GP está fijado en 200M para la Temporada 2.
sin inflación
sin expansión
tu parte es la única variable.
honestamente no sé si el modelo diario pro-rata recompensa a los traders que más lo merecen o solo a los que descifraron la matemática más rápido??

#genius @GeniusOfficial $GENIUS
·
--
pasé parte de esta mañana revisando cómo OpenLedger maneja la atribución para modelos grandes específicamente y honestamente, el enfoque del arreglo de sufijos es una de esas cosas que una vez que lo entiendes no puedes dejar de verlo 😂 la atribución basada en gradientes no escala. cuando un corpus de entrenamiento alcanza billones de tokens, las matemáticas que funcionan perfectamente para un pequeño modelo LoRA se vuelven completamente intractables. necesitas vectores de gradiente para cada punto de datos. necesitas acceso al modelo. necesitas computación que no existe a esa escala en ningún plazo razonable Infini-gram elude todo eso construye un índice de arreglo de sufijos sobre todo el corpus de entrenamiento. 7 bytes por token. todo el índice es consultable. cuando llega una salida de inferencia, encuentra el emparejamiento más largo entre esa salida y los datos de entrenamiento indexados. un emparejamiento largo único significa atribución casi determinista. un contexto corto común significa probabilístico no se requiere acceso al modelo en ningún momento el índice sostiene la prueba no los pesos verifiqué esta mañana OPEN subió 14.3% en los últimos siete días suministro circulante de 290 millones de tokens. OpenFin -el nuevo producto DeFAI- se insinuó en marzo. el proyecto está avanzando a parte de lo que sigo pensando es qué pasa cuando un modelo parafrasea en lugar de reproducir. Infini-gram atrapa la memorización al descubierto. la influencia parafraseada no deja rastro en el arreglo de sufijos en absoluto honestamente no sé si la atribución con arreglo de sufijos es el sistema de atribución de gran escala más honesto construido hasta ahora o uno que solo atrapa los casos obvios y se pierde los sutiles?? 🤔 #OpenLedger @Openledger $OPEN {future}(OPENUSDT)
pasé parte de esta mañana revisando cómo OpenLedger maneja la atribución para modelos grandes específicamente y honestamente, el enfoque del arreglo de sufijos es una de esas cosas que una vez que lo entiendes no puedes dejar de verlo 😂
la atribución basada en gradientes no escala. cuando un corpus de entrenamiento alcanza billones de tokens, las matemáticas que funcionan perfectamente para un pequeño modelo LoRA se vuelven completamente intractables. necesitas vectores de gradiente para cada punto de datos. necesitas acceso al modelo. necesitas computación que no existe a esa escala en ningún plazo razonable
Infini-gram elude todo eso
construye un índice de arreglo de sufijos sobre todo el corpus de entrenamiento. 7 bytes por token. todo el índice es consultable. cuando llega una salida de inferencia, encuentra el emparejamiento más largo entre esa salida y los datos de entrenamiento indexados. un emparejamiento largo único significa atribución casi determinista. un contexto corto común significa probabilístico
no se requiere acceso al modelo en ningún momento

el índice sostiene la prueba

no los pesos

verifiqué esta mañana

OPEN subió 14.3% en los últimos siete días

suministro circulante de 290 millones de tokens. OpenFin -el nuevo producto DeFAI- se insinuó en marzo. el proyecto está avanzando
a parte de lo que sigo pensando es qué pasa cuando un modelo parafrasea en lugar de reproducir. Infini-gram atrapa la memorización al descubierto. la influencia parafraseada no deja rastro en el arreglo de sufijos en absoluto

honestamente no sé si la atribución con arreglo de sufijos es el sistema de atribución de gran escala más honesto construido hasta ahora o uno que solo atrapa los casos obvios y se pierde los sutiles?? 🤔
#OpenLedger @OpenLedger $OPEN
·
--
Artículo
El Modelo Recordó la Oración. La Pregunta Es Si Alguien Puede Probarlo.Estaba leyendo sobre la memorización en modelos de lenguaje grandes hace unas semanas y, honestamente, lo que me inquietaba era que los modelos memorizan los datos de entrenamiento 😂 Todo el mundo sabe que lo hacen. Lo que me inquietaba era que no había una forma clara de probarlo bajo demanda. Podrías hacer experimentos. Podrías sondear el modelo. Podrías obtener una respuesta probabilística sobre si un contenido específico influyó en una salida específica. Pero la respuesta nunca fue determinista. Siempre era aproximada. Siempre costosa de calcular. Siempre dependiente de tener acceso a los internos del modelo que la mayoría de la gente simplemente no tiene.

El Modelo Recordó la Oración. La Pregunta Es Si Alguien Puede Probarlo.

Estaba leyendo sobre la memorización en modelos de lenguaje grandes hace unas semanas y, honestamente, lo que me inquietaba era que los modelos memorizan los datos de entrenamiento 😂
Todo el mundo sabe que lo hacen.
Lo que me inquietaba era que no había una forma clara de probarlo bajo demanda.
Podrías hacer experimentos. Podrías sondear el modelo. Podrías obtener una respuesta probabilística sobre si un contenido específico influyó en una salida específica. Pero la respuesta nunca fue determinista. Siempre era aproximada. Siempre costosa de calcular. Siempre dependiente de tener acceso a los internos del modelo que la mayoría de la gente simplemente no tiene.
Inicia sesión para explorar más contenidos
Únete a usuarios de criptomonedas de todo el mundo en Binance Square
⚡️ Obtén la información más reciente y útil sobre criptomonedas.
💬 Confía en el mayor exchange de criptomonedas del mundo.
👍 Descubre opiniones reales de creadores verificados.
Correo electrónico/número de teléfono
Mapa del sitio
Preferencias de cookies
Términos y condiciones de la plataforma