RLAIF Experimentation - a TitleOS Collection

TitleOS 's Collections

RLAIF Experimentation

Qwen3 Coder Heretic - Decensored

Spark 270M - Micro Local Utility LLM

Lightning 1.7B - Local Utility LLM

HomePhi4 - Home Assistant Reasoning LLM

HomeGem - Home Assistant Conversational LLM

Galactic Reasoning LoRA Adapters

RLAIF Experimentation

updated 4 days ago

Research into RLAIF (Reinforcement Learning from AI feedback) with the goal of Constitutional AI and Sycophancy Resistance.