본문 바로가기
반응형

전체 글291

A Generalization of Transformer Networks to Graphs 원문: https://arxiv.org/pdf/2012.09699 ## 1. 연구 배경 및 목적이 연구는 자연어 처리(NLP)에서 큰 성공을 거둔 트랜스포머 네트워크를 그래프 데이터에 적용하기 위한 혁신적인 방법을 제안합니다. 기존의 트랜스포머는 텍스트 데이터와 같은 순차적 데이터를 처리하는 데 탁월했지만, 복잡한 그래프 구조를 다루는 데는 한계가 있었습니다. 연구진은 이러한 한계를 극복하고 그래프의 구조적 특성을 효과적으로 활용할 수 있는 새로운 아키텍처를 개발했습니다.## 2. 주요 혁신점### 2.1 위치 인코딩의 혁신### 라플라시안 행렬(Laplacian Matrix)- 그래프의 구조적 특성을 수학적으로 표현하는 행렬- 차수 행렬(Degree Matrix)에서 인접 행렬(Adjacency Mat.. 2025. 1. 5.
[나는 리뷰어다] 파이썬으로 배우는 통계학 교과서 2판 "한빛미디어  활동을 위해서 책을 제공받아 작성된 서평입니다."총평: '교과서'라는 말이 참 잘어울리는 책. 스터디 및 수업 교재로 사용해도 좋을 것 같습니다. 책의 전반적인 구성이 책은 통계학의 기초부터 머신러닝까지 10개의 장으로 구성되어 있으며, 각 장은 체계적이고 단계적인 학습이 가능하도록 구성되어 있습니다. 특히 통계 이론과 파이썬 실습이 균형적으로 배치되어 있어서, 책을 따라가면서 개념을 이해하고 즉시 실습해볼 수 있다는 점이 특히 좋습니다. 탄탄한 기초 다지기 (1-2장)- 1장에서는 기술통계와 추론통계의 개념을 명확히 구분하여 설명하고, 왜 이러한 구분이 필요한지 실제 사례를 통해 설명합니다.- 2장에서는 파이썬과 주피터 노트북의 기초부터 시작하여, NumPy와 Pandas까지 다루며 데이.. 2024. 12. 29.
KAG: Boosting LLMs in Professional Domains viaKnowledge Augmented Generation 원문: https://arxiv.org/pdf/2409.13731v3 1. KAG의 필요성과 성능최근 개발된 RAG(이중 난수 추출) 기술이 분야 특화 애플리케이션의 효율적 구축을 가능하게 하지만, 벡터 유사성과 지식 논리의 민감성 부족 등 한계가 존재한다.KAG(Knowledge Augmented Generation)은 이러한 한계를 극복하고 지식 그래프(KG)와 대규모 언어 모델(LLM)을 상호 강화하여 생성 및 추론 성능을 개선하는 것을 목적으로 한다. KAG는 다섯 가지 핵심 측면을 통해 LLM과 KG를 양방향으로 강화한다. KAG는 기존 RAG방법을 다중 연쇄 질의응답에서 능가하며, 특정 Q&A 과제에 적용해 전문성 향상효과를 입증했다. KAG는 곧 오픈소스 KG 엔진 OpenSPG를 통해 개발.. 2024. 12. 15.
Vector Database Management Techniques and Systems 원문: https://www.cs.purdue.edu/homes/csjgwang/pubs/SIGMOD24_VecDB_Tutorial.pdf 벡터 데이터베이스 관리 기술에 대한 포괄적인 개요를 제공하는 논문.벡터 쿼리 처리, 저장 및 인덱싱, 그리고 최적화 및 실행의 다양한 기법들을 다루며, 이를 통해 효율적인 데이터 검색의 중요성을 강조하고 있다. 또한, 기존의 전통적인 데이터 관리 시스템들이 벡터의 복잡성에 대응하지 못하는 문제와 이에 대한 해결책을 제시한다.벡터 데이터베이스 시스템(VDBMS)의 최신 기술이 산업에서 어떻게 응용되는지를 알 수 있는 논문이다. 벡터 데이터베이스 관리의 필요성과 발전기존의 전통적인 데이터베이스 관리 시스템은 특징 벡터의 고유한 특성을 처리하는데 부적합하다 . 벡터 데이터.. 2024. 12. 8.
Retrieval-Augmented Generation with Knowledge Graphs forCustomer Service Question Answering 원문: https://arxiv.org/html/2404.17723v1 Retrieval-Augmented Generation with Knowledge Graphs for Customer Service Question AnsweringIn defining the knowledge graph structure for historical issue representation, we employ a dual-level architecture that segregates intra-issue and inter-issue relations, as illustrated in Figure 1. The Intra-issue Tree 𝒯i⁢(𝒩,ℰ,ℛ)subscript𝒯arxiv.org이 연구는 고객 서비스 분야.. 2024. 12. 1.
[나는 리뷰어다] 밑바닥부터 시작하는 딥러닝 5 "한빛미디어  활동을 위해서 책을 제공받아 작성된 서평입니다."  『밑바닥부터 시작하는 딥러닝』 시리즈의 새로운 책 등장!딥러닝 공부하면서 한 번쯤은 봤을 '밑시딥' 시리즈가 이번에는 생성 모델을 다룹니다. 밑시딥 시리즈로 스터디를 꾸준히 진행하고 있었는데요. (https://aiheroes.ai/community/104) 곧 밑시딥4 스터디를 시작하려는 참에 밑시딥5를 먼저 접하게 되었습니다. 밑시딥5에서는 특히 요즘 핫한 이미지 생성 AI 모델 Stable Diffusion의 핵심 기술인 확산 모델을 상세히 파헤치고 있습니다. 시리즈를 쓴 사이토 고키 교수의 특유의 친절한 설명이 이번에도 빛을 발합니다.기초부터 차근차근, 하지만 제대로책의 매력은 뭐니뭐니해도 탄탄한 구성입니다. 정규 분포와 MLE 같.. 2024. 11. 27.
HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction 원문: https://arxiv.org/pdf/2408.04948v1 1. 하이브리드 RAG의 필요성과 금융 정보 추출금융 애플리케이션에서 비정형 텍스트 데이터의 복잡한 정보를 추출하고 해석하는 것은 LLMs에게 여전히 큰 도전 과제이다 . 도메인별 용어와 복잡한 문서 형식으로 인해 전통적인 Vector RAG기법은 금융 문서에서 정보 추출에 한계가 있다 . 하이브리드 RAG는 Knowledge Graphs 기반의 Graph RAG와 Vector RAG기법을 결합하여 정확하고 맥락에 맞는 답변을 생성하는 새로운 접근 방식이다 . 실험 결과, 하이브리드 RAG는 전통적인 Vector RAG와 Graph RAG보다 정보 검색 정확성과 답변 생성에서 더 뛰어나다 . 제안된 기술은 금융 분야를 넘어 다양한 영역.. 2024. 11. 24.
The Surprising Effectiveness ofTest-Time Training for Abstract Reasoning 원문: https://arxiv.org/pdf/2411.07279Abstract언어 모델은 훈련 데이터 내의 작업에서는 뛰어난 성능을 보이지만, 복잡한 추론이 필요한 새로운 문제에서는 종종 어려움을 겪습니다. 우리는 테스트 시점 학습(Test-Time Training, TTT)을 사용하여 모델의 추론 능력을 향상시키는 방법을 연구했습니다. TTT란 추론(모델 예측)을 수행하는 동안 입력 데이터를 기반으로 한 손실(loss)을 이용해 모델의 파라미터를 임시로 업데이트하는 기법입니다. 이 연구에서는 추상적 추론 데이터셋(ARC, Abstraction and Reasoning Corpus)을 벤치마크로 사용하여 TTT의 효과를 평가했습니다. 실험을 통해 TTT를 성공적으로 적용하기 위해 필요한 세 가지 중요한.. 2024. 11. 17.
반응형