본문 바로가기

LLM

(4)

OpenAI 실용 가이드로 정리한 AI 에이전트 구축 체크리스트 (모델·도구·가드레일) 요약OpenAI가 공개한 A practical guide to building agents를 개발자 관점에서 ‘바로 적용 가능한 체크리스트’로 재구성했습니다.핵심은 모델(Model)·도구(Tools)·지시문/가드레일(Instructions) 3요소를 분리하고, 단일 에이전트 → 멀티 에이전트로 점진 확장하는 것입니다.운영에서 무너지는 패턴(도구 오남용, 종료조건 불명확, 예외 처리 누락)을 가드레일과 평가(evals)로 통제하는 게 포인트입니다.무슨 일이 있었나OpenAI가 제품/엔지니어링 팀이 “처음 에이전트를 만들 때” 어디서부터 시작해야 하는지 정리한 가이드를 공개했습니다. 여기서 말하는 에이전트는 단순 챗봇이 아니라,(1) LLM이 워크플로 실행을 관리하고,(2) 외부 도구(API/시스템/UI)를..

SWE-bench 통과해도 머지 못 한다? AI PR ‘절반이 막히는’ 진짜 이유 Photo by Desola Lanre-Ologun on Unsplash (https://unsplash.com/photos/YgOCJz9uGMk)요약AI 코딩 에이전트가 “벤치마크에서 몇 점”을 받았다는 건, 그 자체로는 실무에서 “곧바로 머지 가능한 코드”를 만든다는 뜻이 아닙니다. METR는 SWE-bench Verified에서 테스트를 통과한 AI PR을 실제 오픈소스 메인테이너들이 리뷰하게 했고, 그 결과 대략 절반가량은 메인 브랜치에 들어가기 어렵다는 결론을 냈습니다.이 글에서는 “왜 이런 차이가 생기는지”와 “우리 팀이 바로 적용할 수 있는 운영 가드레일”을 정리합니다.무슨 일이 있었나 (쉽게 말하면)SWE-bench 같은 벤치마크는 보통 “이슈(버그/기능) → PR 제출 → 자동 테스트로 ..

page-agent: <script> 한 줄로 웹페이지에 AI 에이전트 붙이기 — 도입 체크리스트(보안/운영 포함) 이미지: Ubaid E. Alyafizi / Unsplash 요약웹사이트에 “에이전트 UI”를 붙이고 싶을 때, page-agent는 브라우저 안에서 동작하는 프론트엔드 기반 에이전트를 지향합니다. 데모는 쉽지만, 실제 서비스에 붙일 때는 모델 엔드포인트/권한/로깅/비용까지 함께 설계해야 합니다. 무슨 프로젝트인가GeekNews에서 화제가 된 page-agent는 “한 줄 스크립트 삽입”으로 웹페이지에 자연어 명령 기반 에이전트를 붙이는 접근을 소개합니다. 소개 페이지에서는 Python/헤드리스 브라우저/서버 없이도 시작할 수 있다는 메시지를 전면에 둡니다. 인용“No Python. No headless browser. No server. One script tag — that's it.”— page-a..

LLM이란? 대형 언어 모델의 원리와 활용, 미래까지 한눈에 LLM이란? 대형 언어 모델의 원리와 활용, 미래까지 한눈에인공지능(AI)과 자연어처리(NLP)가 빠르게 발전하면서 ‘LLM이란 무엇인가?’라는 질문이 IT 업계와 일반 사용자 모두에게 중요한 주제가 되었습니다. LLM(Large Language Model, 대형 언어 모델)은 챗GPT, 구글 바드, 네이버 하이퍼클로바 등 첨단 AI 서비스의 핵심이 되는 기술로, 텍스트 생성, 질의응답, 번역, 요약 등 다양한 분야에서 혁신을 이끌고 있습니다. 이 글에서는 LLM의 기본 개념, 동작 원리, 실제 활용 사례, 그리고 앞으로의 전망까지 쉽고 자세하게 설명합니다.LLM(대형 언어 모델)의 정의와 주요 특징LLM은 ‘Large Language Model’의 약자로, 방대한 텍스트 데이터를 학습해 인간과 비슷한 ..

이전 1 다음

티스토리툴바