• marv99@feddit.orgOPM
    link
    fedilink
    Deutsch
    arrow-up
    3
    ·
    10 hours ago

    Ich spiele mit Ollama bisher auf einem älteren PC mit 16GB RAM, ohne GPU, nur auf einer i5 CPU.
    Die von mir zuletzt getesteten Modelle passen daher nicht so gut zu Deiner 8B Vorgabe.
    Ich zähle sie trotzdem mal auf:

    1. lfm2.5-thinking:latest
      Das sehr kleines Thinking-Modell LFM2.5 von LiquidAI, liefert erstaunlich flott gute Resultate,
      Das müsste mit seinen knapp 750MB gut auf die GPU passen.

    2. hf.co/byteshape/Qwen3-30B-A3B-Instruct-2507-GGUF:Qwen3-30B-A3B-Instruct-2507-Q3_K_S-3.25bpw.gguf
      Dieses optimierte instruct-Modell war richtig gut, dafür dass es auf meinem PC läuft, leider mit 12GB wohl zu groß für Deine 8B.
      Ein Modell dieser optimierten “Sammlung”: https://huggingface.co/byteshape/Qwen3-30B-A3B-Instruct-2507-GGUF

    3. sam860/VibeThinker:1.5b-f16
      Da ich es aufgehoben habe, war es wohl ok, ich kann mich aber nicht mehr daran erinnern was Stärken und Schwächen waren.
      Mit seine 3.6GB passt es aber in die 8B rein.

    4. gpt-oss:20b
      Das größere der beiden neuen, offenen Modelle von OpenAI, mit 13GB deutlich zu groß für 8B, aber läuft (gerade so) bei mir auf CPU mit 16GB RAM.
      Gute Resultate, aber zu langsam für tägliche Nutzung.