Verfügbare KI-Modelle
Ressourceneffizienz ist uns wichtig. Daher betreiben wir fast ausschließlich quantisierte Modelle, die nur ein Viertel der ursprünglichen Größe haben und daher auch deutlich schneller sind, aber geringfügig an Genauigkeit verlieren. Zusätzlich setzen wir nicht nur die typische Rechenzentrums-Hardware von Nvidia ein, sondern punktuell auch Spezialtechnik aus dem Consumer-Bereich.
Spezialtechnik
Laufen aktuell auf Mac Studio M4 Max Rechnern mit 128 GB RAM bzw. Mac Studio M3 Ultra Rechnern mit 256 GB RAM
Diese sind nicht nur viel günstiger in der Anschaffung, sondern verbrauchen auch deutlich weniger Strom als die sonst notwendigen H200 Grafikkarten und liefern trotzdem sehr schnelle Ergebnisse.

