반응형 전체 글321 Chain-of-Agents: End-to-End Agent Foundation Models viaMulti-Agent Distillation and Agentic RL 원문: https://arxiv.org/pdf/2508.13167프로젝트: https://chain-of-agents-afm.github.io/ SOCIAL MEDIA TITLE TAGSOCIAL MEDIA DESCRIPTION TAG TAGchain-of-agents-afm.github.ioAbstract최근 대규모 언어 모델(LLM)과 멀티에이전트 시스템은 복잡한 문제 해결에서 놀라운 성과를 보여주고 있습니다. 리서치, 프로그래밍, 수학적 추론처럼 고차원적인 작업들을 여러 에이전트가 협력해 처리하는 방식은 이미 다양한 실험을 통해 검증되었습니다. 하지만 기존 멀티에이전트 시스템에는 한계가 있습니다. 대부분 사람이 직접 프롬프트를 짜고, 복잡한 워크플로우를 설계해야 하며, 이는 계산 자원도 많이 들고 .. 2025. 8. 24. WE-MATH 2.0: A Versatile MathBook System forIncentivizing Visual Mathematical Reasoning ABSTRACT멀티모달 대형 언어 모델(MLLMs)은 이미지와 텍스트를 동시에 다루며 다양한 일을 잘 수행하지만, 여전히 복잡한 수학적 추론에는 약점을 보입니다. 기존 연구들은 주로 데이터셋을 새로 만들거나 학습 방법을 조금씩 개선하는 데 집중했지만, 체계적인 수학 지식 설계나 모델 중심의 데이터 공간 설계는 상대적으로 소홀히 다뤄졌습니다. WE-MATH 2.0은 이러한 한계를 보완하기 위해 등장한 통합 시스템으로, 수학 지식 체계, 난이도별 데이터셋, 강화학습 기반 학습 방법, 그리고 종합 평가 도구를 결합하여 모델의 수학적 추론 능력을 향상시키는 것을 목표로 합니다.이 시스템의 핵심은 네 가지입니다.첫째, 수학 개념을 5단계로 나누어 491개의 지식 포인트와 1,819개의 원리를 담은 MathBook.. 2025. 8. 17. FutureBench: AI가 미래를 예측할 수 있을까? 그동안 AI 벤치마크들을 보면, 대부분 이미 정답이 정해진 과거의 데이터로 AI를 테스트해왔습니다. HLE나 GPQA 같은 문제들도 결국 이미 알려진 지식을 얼마나 잘 기억하고 있는지 보는 것이었습니다. 심지어 웹 검색을 사용하는 BrowseComp나 GAIA 같은 벤치마크도 마찬가지입니다. 결국엔 이미 존재하는 정보에 대한 정답률을 측정하는 것이니까요.그런데 Hugging Face에서 나온 FutureBench는 좀 다릅니다. "AI가 과연 미래를 예측할 수 있을까?"라는 근본적인 질문을 던지는 것입니다. 생각해보면 미래 예측이야말로 진짜 고차원적인 능력이잖습니까? 단순히 패턴을 찾는 게 아니라, 여러 정보를 종합해서 불확실한 상황에서도 논리적인 추론을 해야 하니까요. 이런 능력이 바로 현실에서 쓸모 .. 2025. 8. 10. From News to Forecast: Integrating Event Analysis inLLM-Based Time Series Forecasting with Reflection Abstract: AI가 뉴스를 읽고 미래를 예측한다: 새로운 시계열 예측 기법기존의 시계열 예측은 주로 과거의 수치 데이터에만 의존해왔습니다. 주식 가격을 예측할 때 과거 차트만 보거나, 경제 지표를 분석할 때 통계 수치만 활용하는 식이었죠. 하지만 실제 시장은 뉴스와 사회적 사건에 크게 영향을 받습니다. 대통령 선거, 자연재해, 기업 발표 등이 시장을 움직이는 주요 동력이 되곤 하죠.이번 연구는 이런 한계를 극복하기 위해 대형 언어모델(LLM)을 활용한 새로운 접근법을 제안했습니다. 핵심 아이디어는 AI가 뉴스 기사를 읽고 이해한 다음, 이를 기존의 수치 데이터와 결합해 더 정확한 예측을 만들어내는 것입니다.시스템의 작동 방식은 다음과 같습니다. 먼저 AI 에이전트가 매일 쏟아지는 뉴스 중에서 예측 .. 2025. 8. 3. [나는 리뷰어다] 파인만의 컴퓨터 강의 2판 "한빛미디어 서평단 활동을 위해서 책을 협찬받아 작성된 서평입니다." 📌 한줄평컴퓨터 과학의 뼈대를 물리와 상상력으로 직조한 책 — AI 시대에 더욱 빛나는 파인만의 통찰을, 오늘의 엔지니어가 실전 감각으로 이어 읽다.📌 책의 구성과 특징파트 핵심 주제 엔지니어 시선에서 눈여겨볼 포인트1 컴퓨터 개론범용성·폰 노이만 아키텍처·명령어 집합“언어가 논리적으로 모두 범용적이다”라는 비유 → 프롬프트 디자인·멀티모달 모델에도 적용 가능2 컴퓨터 구조론논리 게이트·디코더·플립플롭“서류 정리원” 아날로지로 하드웨어를 직관화 → LLM 파이프라인(토큰 이동)과 놀라울 만큼 유사3 계산 이론유한 상태 기계·튜링 기계·종료 문제RAG 시스템 한계를 이해할 때 필요한 계산 가능성·불가능성 사고방식4 코딩·정보이론오류.. 2025. 7. 27. 테크포임팩트 2기 킥오프 새로운 시작테크포임팩트(https://techforimpact.io/) 2기 킥오프에 참석하고 왔습니다. 설렘과 기대감으로 가득했던 하루였는데, 생각보다 훨씬 더 많은 것들을 얻고 돌아온 것 같아요. 이번 기수에서는 7개의 랩이 있었고, 저는 쉬운 말 번안 서비스(B-Peach LAB)에 AI 엔지니어로 참여했습니다.https://techforimpact.io/lab/project/9 테크포임팩트테크포임팩트는 카카오임팩트의 기술 이니셔티브로, 기술 전문가와 사회혁신가를 연결해 돕는 기술을 만듭니다. 커뮤니티와 캠퍼스 프로그램을 통해 IT 기술로 사회문제를 해결하고, 임팩트의techforimpact.io 인상 깊었던 순간들오프닝 세션 TECH FOR IMPACT“제대로 쓰이는 기술은 임팩트를 가속화 한.. 2025. 7. 20. 랭체인으로 RAG 개발하기: VectorRAG & GraphRAG ※ 도서 협찬: 본 글은 길벗 출판사로부터 '랭체인으로 RAG 개발하기: VectorRAG & GraphRAG' 도서를 제공받아 제작되었습니다.AI, 똑똑하게 답변하게 만드는 비법이 궁금해요? RAG 기술 파헤치기!AI가 가끔 엉뚱한 대답을 해서 당황한 적이 있나요? 마치 시험을 볼 때 답을 제대로 모르는 것처럼 말이죠. 왜 AI는 우리가 원하는 정확한 답변을 주지 못할 때가 있을까요? 1. AI가 엉뚱한 대답을 할 때, 왜 그럴까요?AI, 특히 llm은 몇 가지 한계를 가지고 있습니다.첫째, 최신 정보를 잘 모를 수 있어요. 학습이 끝난 시점 이후의 정보는 알 수 없기 때문이죠. 최신 뉴스를 물어보면 모른다고 대답할 수 있어요.둘째, 특정 데이터에 대한 지식이 부족합니다. 만약 우리 회사 내부 데이터에.. 2025. 7. 13. WebSailor: Navigating Super-human Reasoning for Web Agent 원문: https://arxiv.org/pdf/2507.02592github: https://github.com/Alibaba-NLP/WebAgent GitHub - Alibaba-NLP/WebAgent: 🌐 WebAgent for Information Seeking bulit by Tongyi Lab: WebWalker & WebDancer & WebSailor http🌐 WebAgent for Information Seeking bulit by Tongyi Lab: WebWalker & WebDancer & WebSailor https://arxiv.org/pdf/2507.02592 - Alibaba-NLP/WebAgentgithub.com Abstract웹에서 복잡한 정보를 찾는 일에서 인간보다.. 2025. 7. 6. 이전 1 2 3 4 ··· 41 다음 반응형