Continuando oggi con Google turboquant
@xingpt Questa è la parte saliente
Lo spazio HBM risparmiato non sarà considerato un costo risparmiato, ma sarà utilizzato per fare tre cose:
Finestra di contesto più lunga: Prima si poteva leggere solo un articolo, ora si possono leggere cento libri alla volta
Batch Size più grande: La stessa scheda grafica può servire più utenti contemporaneamente
Esplosione dell'AI Edge: Inserire grandi modelli nei telefoni e nei PC
Non capisci? Ecco una versione semplificata e nascosta
In Ai2.0, uno dei veri vincitori confermati è Guangtong