• RandomUserNr8@feddit.org
    link
    fedilink
    English
    arrow-up
    4
    ·
    13 hours ago

    Ich werde mal mit verschiedenen 8B Modellen starten. Muss dann mal schauen was klappt. hast du Tipps?

    • marv99@feddit.orgOPM
      link
      fedilink
      Deutsch
      arrow-up
      3
      ·
      10 hours ago

      Ich spiele mit Ollama bisher auf einem älteren PC mit 16GB RAM, ohne GPU, nur auf einer i5 CPU.
      Die von mir zuletzt getesteten Modelle passen daher nicht so gut zu Deiner 8B Vorgabe.
      Ich zähle sie trotzdem mal auf:

      1. lfm2.5-thinking:latest
        Das sehr kleines Thinking-Modell LFM2.5 von LiquidAI, liefert erstaunlich flott gute Resultate,
        Das müsste mit seinen knapp 750MB gut auf die GPU passen.

      2. hf.co/byteshape/Qwen3-30B-A3B-Instruct-2507-GGUF:Qwen3-30B-A3B-Instruct-2507-Q3_K_S-3.25bpw.gguf
        Dieses optimierte instruct-Modell war richtig gut, dafür dass es auf meinem PC läuft, leider mit 12GB wohl zu groß für Deine 8B.
        Ein Modell dieser optimierten “Sammlung”: https://huggingface.co/byteshape/Qwen3-30B-A3B-Instruct-2507-GGUF

      3. sam860/VibeThinker:1.5b-f16
        Da ich es aufgehoben habe, war es wohl ok, ich kann mich aber nicht mehr daran erinnern was Stärken und Schwächen waren.
        Mit seine 3.6GB passt es aber in die 8B rein.

      4. gpt-oss:20b
        Das größere der beiden neuen, offenen Modelle von OpenAI, mit 13GB deutlich zu groß für 8B, aber läuft (gerade so) bei mir auf CPU mit 16GB RAM.
        Gute Resultate, aber zu langsam für tägliche Nutzung.