Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

211

Base only

Active filters: sglang

nvidia/Cosmos3-Nano

16B • Updated 9 days ago • 165k • 274

z-lab/Qwen3.6-35B-A3B-DFlash

Text Generation • 0.4B • Updated 12 days ago • 143k • 255

poolside/Laguna-M.1

Text Generation • 226B • Updated 23 minutes ago • 3.31k • 101

PhalaCloud/GLM-5.2-W4AFP8

Text Generation • 392B • Updated 9 days ago • 16.2k • 23

nvidia/Cosmos3-Super

65B • Updated 9 days ago • 83.8k • 188

nvidia/Cosmos3-Super-Text2Image

Text-to-Image • 65B • Updated 15 days ago • 66.1k • 153

nvidia/Cosmos3-Super-Image2Video

Image-to-Video • 65B • Updated 15 days ago • 39.1k • 132

Mapika/GLM-5.2-NVFP4

Text Generation • 379B • Updated 14 days ago • 10.8k • 5

Doradus-AI/RnJ-1-Instruct-FP8

Text Generation • 9B • Updated Dec 7, 2025 • 541k • 5

z-lab/Qwen3.5-35B-A3B-DFlash

Text Generation • 0.4B • Updated 12 days ago • 6.58k • 39

AxionML/Qwen3.5-0.8B-NVFP4

Image-Text-to-Text • 0.7B • Updated Mar 3 • 824 • 1

z-lab/Qwen3.5-27B-DFlash

Text Generation • 2B • Updated 12 days ago • 4.72k • 111

z-lab/Qwen3.5-122B-A10B-DFlash

Text Generation • 0.8B • Updated 12 days ago • 8.23k • 18

88plug/Qwen3.6-27B-W8A16

Image-Text-to-Text • 27B • Updated 8 days ago • 1.29k • 1

AxionML/Gemma-4-12B-NVFP4

Image-Text-to-Text • 8B • Updated 27 days ago • 48.9k • 6

modal-labs/Qwen3.5-397B-A17B-DFlash

Text Generation • 1B • Updated 16 days ago • 713 • 5

z-lab/Qwen3.5-397B-A17B-DFlash

Text Generation • 1B • Updated 16 days ago • 4.61k • 7

modal-labs/Qwen3.5-27B-DFlash

Text Generation • 2B • Updated 14 days ago • 581 • 1

modal-labs/Qwen3.6-35B-A3B-DFlash

Text Generation • 0.4B • Updated 13 days ago • 872 • 11

MarshallHD/LFM2.5-230M-NVFP4

Text Generation • 0.2B • Updated 4 days ago • 23 • 1

SurfaceData/llava-v1.6-mistral-7b-sglang

Image-Text-to-Text • 8B • Updated Mar 7, 2024 • 14 • 9

SurfaceData/llava-v1.6-vicuna-7b-sglang

Image-Text-to-Text • 7B • Updated Mar 7, 2024 • 5 • 1

tclf90/qwen2.5-72b-instruct-gptq-int4

Text Generation • 73B • Updated May 12, 2025 • 106 • 2

tclf90/qwen2.5-72b-instruct-gptq-int3

Text Generation • 69B • Updated May 12, 2025 • 162

alvarobartt/grok-2-tokenizer

Updated Aug 27, 2025 • 3

unsloth/grok-2

Text Generation • Updated Sep 6, 2025 • 39 • 5

osmapi/MiniMax-M2-THRIFT

173B • Updated Nov 13, 2025 • 1.62k • 35

mradermacher/MiniMax-M2-THRIFT-GGUF

Updated Apr 28 • 2

JasmineBBB/Kimi-Linear-48B-A3B-Instruct-bnb-4bit

Text Generation • 49B • Updated Nov 5, 2025 • 10 • 1

mradermacher/MiniMax-M2-THRIFT-i1-GGUF

173B • Updated Apr 28 • 159 • 10