Gerald Stanje's picture

Gerald Stanje

Gerald001

·

AI & ML interests

None yet

Organizations

New activity in nvidia/gpt-oss-120b-Eagle3-short-context 2 months ago

Any plans for gpt oss 20b?

#1 opened 8 months ago by

New activity in robustintelligence/pi-mmbert-v3.5 3 months ago

Upload TRT model for Nvidia H100

#5 opened 3 months ago by

Upload TRT model for Nvidia H100

#4 opened 3 months ago by

Upload TRT model for Nvidia H200

#3 opened 3 months ago by

Upload TRT model for Nvidia L40S

#2 opened 3 months ago by

Upload ONNX model for Nvidia L40S

#1 opened 3 months ago by

New activity in nvidia/gpt-oss-120b-Eagle3-long-context 3 months ago

Eagle3 for 20b

#4 opened 8 months ago by

New activity in openai/gpt-oss-120b 4 months ago

how to disable the reasoning mode?

#50 opened 11 months ago by

New activity in unsloth/gpt-oss-120b-GGUF 4 months ago

GGUF is very slow for some reason

#12 opened 10 months ago by

New activity in onnxruntime/gpt-oss-20b-onnx 4 months ago

latency

#10 opened 4 months ago by

Model conversion info

#9 opened 4 months ago by

New activity in openai/gpt-oss-20b 4 months ago

NVIDIA L40S GPU's for MXFP4 quantization

#100 opened 11 months ago by

How to turn off thinking mode

#86 opened 11 months ago by

REASONING SETTING GUIDE 📚

#28 opened 11 months ago by

Update chat_template.jinja

#229 opened 5 months ago by

question: setting reasoning effort

#66 opened 11 months ago by

Unable to load gpt-oss-20b on dual L40 (48GB) GPUs with vLLM

#136 opened 10 months ago by

New activity in openai/gpt-oss-120b 4 months ago

assistantfinal, analysis keyword is contained in the huggingface gpt-oss-120 output. Is this intended?

#130 opened 10 months ago by

New activity in openai/gpt-oss-20b 4 months ago

deploying finetuned model on triton using vllm backend

#157 opened 8 months ago by

Guidance Needed: GPT-OSS 20B Fine-Tuning with Unsloth → GGUF → Ollama → Triton (vLLM / TensorRT-LLM)

#225 opened 5 months ago by