Junyeong Song

Software Engineer

Toolformer: 스스로 도구 사용법을 배우는 LLM

최대 1 분 소요

1. 핵심 질문

기존에는 사람이 프롬프트로 “이럴 땐 이 도구를 써”라고 가르쳤다 (In-context Learning). Toolformer는 묻는다.

“모델이 스스로 도구 사용법을 깨우칠 순 없을까?”

2. 학습 방법 (Self-supervised)

텍스트 중간중간에 무작위로 도구 호출([CALL] calc(...))을 넣어본다.
도구를 썼을 때, 원래 텍스트를 예측하는 손실(Loss)이 줄어들면 “이 도구 호출은 유용했다”고 판단한다.
유용한 케이스만 모아서 모델을 다시 학습(Fine-tuning)시킨다.

결과적으로 모델은 “계산이 필요한 순간”이나 “검색이 필요한 순간”을 스스로 감지하고 도구를 호출하게 된다.

공유하기

X Facebook LinkedIn Bluesky

댓글남기기

참고

Tool-Augmented LLM: 도구를 손에 쥔 언어 모델

최대 1 분 소요

1. 개념 LLM에게 계산기, 검색엔진, 파이썬 인터프리터 같은 도구(Tool)를 쥐여주는 것이다. 모델은 직접 답을 생성하는 대신, “어떤 함수를 어떤 인자로 호출할지”를 결정한다 (Function Calling).

ReAct: 생각하고(Reason) 행동하는(Act) AI

최대 1 분 소요

1. 기존 LLM의 한계 단순히 텍스트만 생성하는 LLM은: 외부 정보 부재: 실시간 정보나 계산 능력이 없다. 환각(Hallucination): 모르는 것도 아는 척한다.

Label Smoothing & Temperature Scaling: 모델의 과잉 확신 막기

최대 1 분 소요

딥러닝 모델은 종종 틀릴 때조차 99.9% 확신을 가진다(Overconfidence). 이는 의료나 자율주행 같은 분야에서 위험하다.

Focal Loss: 데이터 불균형을 해결하는 우아한 방법

최대 1 분 소요

1. 문제: Easy Negative Object Detection(예: YOLO, RetinaNet)에서는 배경(Background)이 객체보다 압도적으로 많다. 모델 입장에서 배경은 맞추기 너무 쉬운 문제(Easy Negative)인데, 이들의 수가 너무 많아 총 Loss를 지...