Continuând cu Google turboquant de astăzi
@xingpt Fratele, acest articol lovește punctele cheie
Spațiul HBM economisit nu va fi considerat un cost redus, ci va fi folosit pentru a face trei lucruri:
Fereastra de context mai lungă: În trecut, puteam citi doar un articol, acum putem citi o sută de cărți deodată
Dimensiune mai mare a lotului: Aceeași placă grafică poate deservi mai mulți utilizatori simultan
Explozia AI la marginea: Puneți modelele mari în telefoane mobile și PC-uri
Nu înțelegi? Iată o versiune TLDR pentru începători
Unul dintre adevărații câștigători confirmați din Ai2.0 - Guangtong