1-Bit-LLMs: Neuer Ansatz will Rechenaufwand für Sprachmodelle reduzieren

Artikel auf www.heise.de

Datum: 2024-03-06 11:38:00

Um dem Hardwarehunger von großen Sprachmodellen Herr zu werden, setzt man auf Quantisierung. Einen neuen Ansatz stellen Microsoft-Forscher zur Diskussion.