LayerNorm vs. RMSNorm: Warum RMSNorm reicht
LayerNorm zentriert und skaliert, RMSNorm nur skaliert. Warum die Zentrierung verzichtbar ist, ohne Modellqualität zu verlieren, zeigt eine geometrische Erklärung.
Notizen aus dem Studium und Gedanken zwischendurch.
LayerNorm zentriert und skaliert, RMSNorm nur skaliert. Warum die Zentrierung verzichtbar ist, ohne Modellqualität zu verlieren, zeigt eine geometrische Erklärung.
transpose() macht Tensoren non-contiguous (logische ≠ physische Reihenfolge). view() funktioniert nur mit contiguous Tensoren → RuntimeError. Lösung: reshape() statt view().
Wie ich ein LLAMA 3.1 Modell auf Schwäbisch fine-tune — Datenaufbereitung, QLoRA-Training und Evaluation aus der Praxis.
Ein einsteigerfreundlicher Guide zu neuronalen Netzen: vom einzelnen Neuron bis zum kompletten Python-Modell, das mit NumPy Hauspreise vorhersagt.
Eine Einführung in die lineare Regression: Modelldefinition, Kostenfunktion und Gradientenabstieg, erklärt am einfachen Beispiel von Schülern und ihren Lernstunden.