7 35 41

Manan Shah

cs-mshah

https://cs-mshah.github.io/

AI & ML interests

Computer Vision

Recent Activity

upvoted a paper 3 days ago

Choreographing a World of Dynamic Objects

upvoted a paper 5 days ago

VINCIE: Unlocking In-context Image Editing from Video

upvoted an article 5 days ago

Generalist Robot Policy Evaluation in Simulation with NVIDIA Isaac Lab-Arena and LeRobot

View all activity

Organizations

upvoted a paper 3 days ago

Choreographing a World of Dynamic Objects

Paper • 2601.04194 • Published 5 days ago • 12

upvoted a paper 5 days ago

VINCIE: Unlocking In-context Image Editing from Video

Paper • 2506.10941 • Published Jun 12, 2025 • 4

upvoted an article 5 days ago

Article

Generalist Robot Policy Evaluation in Simulation with NVIDIA Isaac Lab-Arena and LeRobot

6 days ago

•

upvoted an article 6 days ago

Article

NVIDIA Cosmos Reason 2 Brings Advanced Reasoning To Physical AI

6 days ago

•

upvoted a paper 7 days ago

Evaluating Parameter Efficient Methods for RLVR

Paper • 2512.23165 • Published 14 days ago • 24

liked a dataset 7 days ago

genrobot2025/10Kh-RealOmin-OpenData

Updated 6 days ago • 76.2k • 132

liked a dataset 11 days ago

Daniellesry/TransPhy3D

Preview • Updated 12 days ago • 8.11k • 68

liked a Space 12 days ago

Evaluation Guidebook

📝

240

Display benchmark evaluation data for LLMs

upvoted 2 papers 12 days ago

ProEdit: Inversion-based Editing From Prompts Done Right

Paper • 2512.22118 • Published 17 days ago • 17

LiveTalk: Real-Time Multimodal Interactive Video Diffusion via Improved On-Policy Distillation

Paper • 2512.23576 • Published 14 days ago • 64

liked a Space 14 days ago

The Ultra-Scale Playbook

🌌

3.64k

The ultimate guide to training LLM on large GPU Clusters

upvoted a paper 16 days ago

Learning to Reason in 4D: Dynamic Spatial Understanding for Vision Language Models

Paper • 2512.20557 • Published 20 days ago • 49

upvoted an article 18 days ago

Article

SmolVLA: Efficient Vision-Language-Action Model trained on Lerobot Community Data

Jun 3, 2025

•

307

liked a model 19 days ago

Qwen/Qwen-Image-Edit-2511

Image-to-Image • Updated 20 days ago • 73.6k • • 679

liked a model 25 days ago

browser-use/bu-30b-a3b-preview

Image-Text-to-Text • 31B • Updated 19 days ago • 14.5k • 233

liked a model 28 days ago

lokiz666/Realgen-detection-models

Text-to-Image • Updated Dec 11, 2025 • 15

liked a Space 29 days ago

WindowSeat Reflection Removal Web

🪟

Remove reflections from images easily

upvoted an article about 1 month ago

Article

We Got Claude to Fine-Tune an Open Source LLM

Dec 4, 2025

•

571

liked 2 models about 1 month ago

oumoumad/Qwen-Edit-2509-Material-transfer

Image-to-Image • Updated Dec 2, 2025 • 32

oumoumad/Qwen-Edit-2509-Extract-materials

Updated Dec 3, 2025 • 9

Manan Shah

AI & ML interests

Recent Activity

Organizations

cs-mshah's activity

Generalist Robot Policy Evaluation in Simulation with NVIDIA Isaac Lab-Arena and LeRobot

NVIDIA Cosmos Reason 2 Brings Advanced Reasoning To Physical AI

Evaluation Guidebook

The Ultra-Scale Playbook

SmolVLA: Efficient Vision-Language-Action Model trained on Lerobot Community Data

WindowSeat Reflection Removal Web

We Got Claude to Fine-Tune an Open Source LLM