본문 바로가기

-320

WE-MATH 2.0: A Versatile MathBook System forIncentivizing Visual Mathematical Reasoning ABSTRACT멀티모달 대형 언어 모델(MLLMs)은 이미지와 텍스트를 동시에 다루며 다양한 일을 잘 수행하지만, 여전히 복잡한 수학적 추론에는 약점을 보입니다. 기존 연구들은 주로 데이터셋을 새로 만들거나 학습 방법을 조금씩 개선하는 데 집중했지만, 체계적인 수학 지식 설계나 모델 중심의 데이터 공간 설계는 상대적으로 소홀히 다뤄졌습니다. WE-MATH 2.0은 이러한 한계를 보완하기 위해 등장한 통합 시스템으로, 수학 지식 체계, 난이도별 데이터셋, 강화학습 기반 학습 방법, 그리고 종합 평가 도구를 결합하여 모델의 수학적 추론 능력을 향상시키는 것을 목표로 합니다.이 시스템의 핵심은 네 가지입니다.첫째, 수학 개념을 5단계로 나누어 491개의 지식 포인트와 1,819개의 원리를 담은 MathBook.. 2025. 8. 17.

FutureBench: AI가 미래를 예측할 수 있을까? 그동안 AI 벤치마크들을 보면, 대부분 이미 정답이 정해진 과거의 데이터로 AI를 테스트해왔습니다. HLE나 GPQA 같은 문제들도 결국 이미 알려진 지식을 얼마나 잘 기억하고 있는지 보는 것이었습니다. 심지어 웹 검색을 사용하는 BrowseComp나 GAIA 같은 벤치마크도 마찬가지입니다. 결국엔 이미 존재하는 정보에 대한 정답률을 측정하는 것이니까요.그런데 Hugging Face에서 나온 FutureBench는 좀 다릅니다. "AI가 과연 미래를 예측할 수 있을까?"라는 근본적인 질문을 던지는 것입니다. 생각해보면 미래 예측이야말로 진짜 고차원적인 능력이잖습니까? 단순히 패턴을 찾는 게 아니라, 여러 정보를 종합해서 불확실한 상황에서도 논리적인 추론을 해야 하니까요. 이런 능력이 바로 현실에서 쓸모 .. 2025. 8. 10.

From News to Forecast: Integrating Event Analysis inLLM-Based Time Series Forecasting with Reflection Abstract: AI가 뉴스를 읽고 미래를 예측한다: 새로운 시계열 예측 기법기존의 시계열 예측은 주로 과거의 수치 데이터에만 의존해왔습니다. 주식 가격을 예측할 때 과거 차트만 보거나, 경제 지표를 분석할 때 통계 수치만 활용하는 식이었죠. 하지만 실제 시장은 뉴스와 사회적 사건에 크게 영향을 받습니다. 대통령 선거, 자연재해, 기업 발표 등이 시장을 움직이는 주요 동력이 되곤 하죠.이번 연구는 이런 한계를 극복하기 위해 대형 언어모델(LLM)을 활용한 새로운 접근법을 제안했습니다. 핵심 아이디어는 AI가 뉴스 기사를 읽고 이해한 다음, 이를 기존의 수치 데이터와 결합해 더 정확한 예측을 만들어내는 것입니다.시스템의 작동 방식은 다음과 같습니다. 먼저 AI 에이전트가 매일 쏟아지는 뉴스 중에서 예측 .. 2025. 8. 3.

[나는 리뷰어다] 파인만의 컴퓨터 강의 2판 "한빛미디어 서평단 활동을 위해서 책을 협찬받아 작성된 서평입니다." 📌 한줄평컴퓨터 과학의 뼈대를 물리와 상상력으로 직조한 책 — AI 시대에 더욱 빛나는 파인만의 통찰을, 오늘의 엔지니어가 실전 감각으로 이어 읽다.📌 책의 구성과 특징파트 핵심 주제 엔지니어 시선에서 눈여겨볼 포인트1 컴퓨터 개론범용성·폰 노이만 아키텍처·명령어 집합“언어가 논리적으로 모두 범용적이다”라는 비유 → 프롬프트 디자인·멀티모달 모델에도 적용 가능2 컴퓨터 구조론논리 게이트·디코더·플립플롭“서류 정리원” 아날로지로 하드웨어를 직관화 → LLM 파이프라인(토큰 이동)과 놀라울 만큼 유사3 계산 이론유한 상태 기계·튜링 기계·종료 문제RAG 시스템 한계를 이해할 때 필요한 계산 가능성·불가능성 사고방식4 코딩·정보이론오류.. 2025. 7. 27.

이전 1 2 3 4 ··· 80 다음

티스토리툴바