🧮 LLM Math Reasoning Lab

이 프로젝트는 다양한 방식의 수학 문제 해결을 위한 LLM 응용 기법을 연구하고 구현한 프로젝트 모음입니다.
각 하위 디렉토리는 독립적인 실험 프로젝트로 구성되어 있으며, 다양한 모델 및 추론 방식에 기반하여 LLM을 이용해 수학 문제를 푸는 방법을 탐색합니다.

📂 서브 디렉토리 소개

프로젝트	설명
`verifier`	LLaDA-CoT의 출력을 검증하는 Verifier. DeepSeek 모델 기반으로 OpenMathReasoning dataset을 학습.
`chain-of-thought`	QLoRA 기반의 Chain-of-Thought 학습 및 오답 기반 재학습/라우팅 모델 포함.
`discrete-diffusion-llm`	Semi-AutoRegressive 방식으로 수학 추론을 수행하는 diffusion-style 모델.
`tool-integrated-reasoning`	Tool 호출 기반 수학 추론(TIR)을 Nemotron 모델 기반으로 구현한 실험.

📦 패키지 설치

각 서브 디렉토리의 requirements.txt 파일을 참고해주세요

🚀 실행 방법

각 프로젝트 디렉토리 안에 있는 README.md를 참고하세요.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🧮 LLM Math Reasoning Lab

📂 서브 디렉토리 소개

📦 패키지 설치

🚀 실행 방법

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
chain-of-thought		chain-of-thought
discrete_diffusion_llm		discrete_diffusion_llm
tool-integrated-reasoning		tool-integrated-reasoning
verifier		verifier
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

🧮 LLM Math Reasoning Lab

📂 서브 디렉토리 소개

📦 패키지 설치

🚀 실행 방법

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages