본문 바로가기

ML & DL72

[나는 리뷰어다] 쉽고 빠르게 익히는 실전 LLM(2판) "한빛미디어 서평단 활동을 위해서 책을 협찬받아 작성된 서평입니다."🖋 한줄평실무 중심의 명쾌한 해설로 LLM의 활용법을 구체적으로 제시하는 가이드북✔ 책의 구성책은 크게 세 부분으로 구성되어 있습니다.1부 LLM 소개: LLM의 개념과 주요 모델(GPT, BERT, T5 등)을 설명하고, 의미 기반 검색, 벡터 데이터베이스, RAG 파이프라인 및 AI 에이전트 구축 사례를 다룹니다.2부 LLM 활용법: 모델을 최적화하고 맞춤형 프롬프트 엔지니어링 및 임베딩 조정을 통해 실질적으로 활용할 수 있는 방법을 제시합니다.3부 고급 LLM 사용법: RLHF, 피드백 기반 강화 학습 등 고급 기술을 통해 오픈소스 LLM을 세밀히 조정하는 방법을 심도 있게 다룹니다.부록에서는 자주 묻는 질문(FAQ), 용어 해.. 2025. 4. 25.

AUDITING LANGUAGE MODELSFOR HIDDEN OBJECTIVES 원문: https://arxiv.org/pdf/2503.10965 이 논문은 대형 언어 모델의 답변 신뢰도를 높이기 위해 RCI라는 새로운 내부 평가 방식을 제안하고 실험적으로 입증한 연구입니다. 특히 답변 생성 중 내부에서 스스로 검증(Internal Verification)하는 과정이 신뢰성 향상에 매우 효과적이라는 것이 핵심 메시지라고 할 수 있습니다. 1. Introduction이 논문은 AI 모델이 겉으로는 좋아 보이는 행동을 하지만, 실제로는 개발자가 원치 않는 숨겨진 목표를 추구할 가능성이 있음을 지적함.따라서 겉모습만 평가하는 것이 아니라, AI의 숨겨진 목표까지도 찾아내는 ‘감사(audit)’의 필요성을 강조함.2. TerminologyObjective(목표): AI가 일관되게 행동을 유.. 2025. 4. 20.

Training Large Language Models to Reason in aContinuous Latent Space 원문: https://arxiv.org/pdf/2412.06769 24년 12월 Meta에서 발표한 논문으로, 사람이 생각을 머릿속으로 하는 것처럼, LLM도 Reasoning을 토큰으로 출력하는 대신 Latent Space에서 수행할 수 있도록 하는 방법론인 COCONUT을 제안합니다.0. Abstract- LLM이 일반적으로 chain-of-thought (CoT)를 사용할 때, “언어 공간"에서만 추론 과정을 표현할 수 있다.- 그러나, 언어 공간이 추론에 항상 최적인 것은 아닐 수 있다. 대부분의 토큰은 텍스트 일관성을 위한 것이며 추론에 필수적이지 않고, 일부 토큰만이 reasoning에 중요한 역할을 한다.- **COCONUT**: 자연어 대신 잠재 공간에서 LLM이 추론하게하자. - 가.. 2025. 4. 13.

[나는 리뷰어다] 파이썬으로 웹 크롤러 만들기(3판) "한빛미디어 서평단 활동을 위해서 책을 협찬받아 작성된 서평입니다."🖋 한줄평AI 시대, 경쟁력을 확보를 위한 데이터 수집 실전 무기를 갖출 수 있는 책✔ 왜 웹 크롤러를 만들어야 하는가?오늘날 우리는 수많은 정보가 웹에 존재하는 시대에 살고 있습니다. 하지만 웹사이트를 하나하나 직접 브라우저로 열어보는 방식만으로는 이렇게 방대한 데이터를 제대로 활용하기가 쉽지 않죠. 이럴 때 큰 도움이 되는 것이 바로 웹 스크레이핑입니다. 웹 스크레이핑은 원하는 정보를 빠르고 효율적으로 수집할 수 있게 도와주는 아주 강력한 도구예요.웹 스크레이핑이란, 웹 여기저기에 흩어져 있는 데이터를 자동으로 모으고, 이를 우리가 활용할 수 있도록 정리해주는 기술입니다. 사람이 직접 하나하나 페이지를 넘기며 데이터를 복사·붙여넣.. 2025. 3. 28.

이전 1 2 3 4 ··· 18 다음

티스토리툴바