Zhi Yang's picture

5 1

Zhi Yang

yangzhi1

·

tobi0520

AI & ML interests

None yet

Recent Activity

upvoted a paper about 18 hours ago

Controlled Self-Evolution for Algorithmic Code Optimization

authored a paper about 20 hours ago

BizFinBench.v2: A Unified Dual-Mode Bilingual Benchmark for Expert-Level Financial Capability Alignment

authored a paper about 20 hours ago

FinEval: A Chinese Financial Domain Knowledge Evaluation Benchmark for Large Language Models

View all activity

Organizations

upvoted a paper about 18 hours ago

Controlled Self-Evolution for Algorithmic Code Optimization

Paper • 2601.07348 • Published 5 days ago • 104

authored 2 papers about 20 hours ago

BizFinBench.v2: A Unified Dual-Mode Bilingual Benchmark for Expert-Level Financial Capability Alignment

Paper • 2601.06401 • Published 7 days ago • 9

FinEval: A Chinese Financial Domain Knowledge Evaluation Benchmark for Large Language Models

Paper • 2308.09975 • Published Aug 19, 2023

authored 2 papers 2 days ago

FinVault: Benchmarking Financial Agent Safety in Execution-Grounded Environments

Paper • 2601.07853 • Published 8 days ago • 7

EvoFSM: Controllable Self-Evolution for Deep Research with Finite State Machines

Paper • 2601.09465 • Published 3 days ago • 38

upvoted 2 papers 2 days ago

KnowMe-Bench: Benchmarking Person Understanding for Lifelong Digital Companions

Paper • 2601.04745 • Published 9 days ago • 50

MemGovern: Enhancing Code Agents through Learning from Governed Human Experiences

Paper • 2601.06789 • Published 6 days ago • 73

upvoted a paper 3 days ago

FinVault: Benchmarking Financial Agent Safety in Execution-Grounded Environments

Paper • 2601.07853 • Published 8 days ago • 7

upvoted a paper 4 days ago

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Paper • 2601.06943 • Published 6 days ago • 201

liked a model over 2 years ago

IDEA-CCNL/Ziya-LLaMA-13B-v1

Text Generation • Updated Sep 13, 2023 • 1.2k • 275