본문 바로가기

-333

Chain-of-Agents: End-to-End Agent Foundation Models viaMulti-Agent Distillation and Agentic RL 원문: https://arxiv.org/pdf/2508.13167프로젝트: https://chain-of-agents-afm.github.io/ SOCIAL MEDIA TITLE TAGSOCIAL MEDIA DESCRIPTION TAG TAGchain-of-agents-afm.github.ioAbstract최근 대규모 언어 모델(LLM)과 멀티에이전트 시스템은 복잡한 문제 해결에서 놀라운 성과를 보여주고 있습니다. 리서치, 프로그래밍, 수학적 추론처럼 고차원적인 작업들을 여러 에이전트가 협력해 처리하는 방식은 이미 다양한 실험을 통해 검증되었습니다. 하지만 기존 멀티에이전트 시스템에는 한계가 있습니다. 대부분 사람이 직접 프롬프트를 짜고, 복잡한 워크플로우를 설계해야 하며, 이는 계산 자원도 많이 들고 .. 2025. 8. 24.

WE-MATH 2.0: A Versatile MathBook System forIncentivizing Visual Mathematical Reasoning ABSTRACT멀티모달 대형 언어 모델(MLLMs)은 이미지와 텍스트를 동시에 다루며 다양한 일을 잘 수행하지만, 여전히 복잡한 수학적 추론에는 약점을 보입니다. 기존 연구들은 주로 데이터셋을 새로 만들거나 학습 방법을 조금씩 개선하는 데 집중했지만, 체계적인 수학 지식 설계나 모델 중심의 데이터 공간 설계는 상대적으로 소홀히 다뤄졌습니다. WE-MATH 2.0은 이러한 한계를 보완하기 위해 등장한 통합 시스템으로, 수학 지식 체계, 난이도별 데이터셋, 강화학습 기반 학습 방법, 그리고 종합 평가 도구를 결합하여 모델의 수학적 추론 능력을 향상시키는 것을 목표로 합니다.이 시스템의 핵심은 네 가지입니다.첫째, 수학 개념을 5단계로 나누어 491개의 지식 포인트와 1,819개의 원리를 담은 MathBook.. 2025. 8. 17.

FutureBench: AI가 미래를 예측할 수 있을까? 그동안 AI 벤치마크들을 보면, 대부분 이미 정답이 정해진 과거의 데이터로 AI를 테스트해왔습니다. HLE나 GPQA 같은 문제들도 결국 이미 알려진 지식을 얼마나 잘 기억하고 있는지 보는 것이었습니다. 심지어 웹 검색을 사용하는 BrowseComp나 GAIA 같은 벤치마크도 마찬가지입니다. 결국엔 이미 존재하는 정보에 대한 정답률을 측정하는 것이니까요.그런데 Hugging Face에서 나온 FutureBench는 좀 다릅니다. "AI가 과연 미래를 예측할 수 있을까?"라는 근본적인 질문을 던지는 것입니다. 생각해보면 미래 예측이야말로 진짜 고차원적인 능력이잖습니까? 단순히 패턴을 찾는 게 아니라, 여러 정보를 종합해서 불확실한 상황에서도 논리적인 추론을 해야 하니까요. 이런 능력이 바로 현실에서 쓸모 .. 2025. 8. 10.

From News to Forecast: Integrating Event Analysis inLLM-Based Time Series Forecasting with Reflection Abstract: AI가 뉴스를 읽고 미래를 예측한다: 새로운 시계열 예측 기법기존의 시계열 예측은 주로 과거의 수치 데이터에만 의존해왔습니다. 주식 가격을 예측할 때 과거 차트만 보거나, 경제 지표를 분석할 때 통계 수치만 활용하는 식이었죠. 하지만 실제 시장은 뉴스와 사회적 사건에 크게 영향을 받습니다. 대통령 선거, 자연재해, 기업 발표 등이 시장을 움직이는 주요 동력이 되곤 하죠.이번 연구는 이런 한계를 극복하기 위해 대형 언어모델(LLM)을 활용한 새로운 접근법을 제안했습니다. 핵심 아이디어는 AI가 뉴스 기사를 읽고 이해한 다음, 이를 기존의 수치 데이터와 결합해 더 정확한 예측을 만들어내는 것입니다.시스템의 작동 방식은 다음과 같습니다. 먼저 AI 에이전트가 매일 쏟아지는 뉴스 중에서 예측 .. 2025. 8. 3.

이전 1 2 3 4 5 6 7 ··· 84 다음

티스토리툴바