검색 여닫기
검색
메뉴 여닫기
515
223
4
2천
noriwiki
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
특수 문서 목록
파일 올리기
환경 설정 메뉴 여닫기
notifications
개인 메뉴 여닫기
로그인하지 않음
지금 편집한다면 당신의 IP 주소가 공개될 수 있습니다.
user-interface-preferences
한국어
개인 도구
로그인
KV Cache: 편집 역사
도움말
noriwiki
문서 공유하기
다른 명령
이 문서의 기록 보기
특정판 필터링
펼치기
접기
끝 날짜:
태그
필터:
wikieditor (숨긴 태그)
넘겨주기 대상 변경
넘겨주기 제거
되돌려진 기여
비우기
새 넘겨주기
서버측 업로드
수동 되돌리기
시각 편집
시각 편집: 전환됨
선택 반전
판 보이기
차이 선택: 비교하려는 판의 라디오 버튼을 선택한 다음 엔터나 아래의 버튼을 누르세요.
설명:
(최신)
= 최신 판과 비교,
(이전)
= 이전 판과 비교,
잔글
= 사소한 편집
2025년 3월 31일 (월)
최신
이전
04:09
2025년 3월 31일 (월) 04:09
Ahn9807
토론
기여
3,751 바이트
+3,258
편집 요약 없음
태그
:
시각 편집: 전환됨
최신
이전
03:45
2025년 3월 31일 (월) 03:45
Ahn9807
토론
기여
493 바이트
+493
새 문서:
분류: Transformer model
== 개요 ==
Autoregression
모델에서, KV Cache는 전에 계산한 K값과 V값들을 캐싱하여, 현재 토큰을 계산하는데 필요한 중복되는 연산을 줄여서 생성 속도의 향상을 꾀하는 Caching모델이다. KV Cache는 대표적인 Computing & Memory trade-off를 이용한 방법이다. == 필요성 == 파일:KV_Cache.gif|프레임없음|600픽셀|가운데|https://medium.com/@joaolages/kv-caching-explained-2765...
태그
:
시각 편집: 전환됨