Turboquant: Googles Kompression soll RAM-Bedarf von LLMs extrem senken

Turboquant soll den Ressourceneinsatz für KI mit mehreren Tricks senken. Aktuell sinken vor allem die Aktienkurse von RAM-Herstellern. (KI, Google)