Влияние Google turboquant на будущее AI

Продолжение сегодняшнего Google turboquant
@xingpt брат, этот пост прямо в точку
Сэкономленное пространство HBM не будет считаться сэкономленными затратами, а будет использовано для трех вещей:
Более длинное контекстное окно: раньше можно было читать только одну статью, теперь можно читать сразу сто книг
Более крупный размер пакета: одна и та же видеокарта может одновременно обслуживать больше пользователей
Событие AI на краю (Edge AI): засунуть большие модели в телефоны и ПК
Не понимаешь? Давай краткую версию для новичков
Один из настоящих победителей в Ai2.0 - Guangtong
Увеличение вычислительных мощностей и количество обрабатываемого контекста означает, что объем обмена данными между узлами станет еще более пугающим, оптическая связь #AVGO , #MRVL  #LITE по-прежнему остается долгосрочным победителем
Независимо от изменений в моделях, $NVDA  базовое производство все равно будет зависеть от #TSM 
Стратегия выбора акций в области памяти:
Если вы собираетесь купить память, следует сосредоточиться на компаниях, которые выигрывают от спроса на хранение (SSD/NAND) и основного тренда #HBM (например, #Micron #MU)
Избегайте второстепенных производителей, которые раздувают концепцию SRAM с заменой на HBM (например, Winbond, Adata), потому что TurboQuant доказал, что программная компрессия является оптимальным решением проблемы узкого места HBM, и реальные заказы на эти заменители вскоре будут аннулированы.
Не забудьте подписаться на @WaterX_app здесь для заполнения списка ожидания
Буду продолжать усилия по поиску и агрегированию большего количества качественных активов, связанных с RWA на американском рынке 303…
https://x.com/waterx_app/status/2030308806807503279?s=61