<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ko">
	<id>http://junhoahn.kr/noriwiki/index.php?action=history&amp;feed=atom&amp;title=Time_to_first_token</id>
	<title>Time to first token - 편집 역사</title>
	<link rel="self" type="application/atom+xml" href="http://junhoahn.kr/noriwiki/index.php?action=history&amp;feed=atom&amp;title=Time_to_first_token"/>
	<link rel="alternate" type="text/html" href="http://junhoahn.kr/noriwiki/index.php?title=Time_to_first_token&amp;action=history"/>
	<updated>2026-05-19T09:46:34Z</updated>
	<subtitle>이 문서의 편집 역사</subtitle>
	<generator>MediaWiki 1.43.0</generator>
	<entry>
		<id>http://junhoahn.kr/noriwiki/index.php?title=Time_to_first_token&amp;diff=2014&amp;oldid=prev</id>
		<title>Ahn9807: 새 문서: 분류: 인공지능  == 개요 == Time to first token(TTFT)는 LLM의 성능을 평가하는 지표로, 사용자가 프롬프트를 입력한 후 첫 번째 토큰이 생성될 때까지 걸리는 시간을 의미한다. LLM의 Latency를 측정하는 데 사용된다.  TTFT는 LLM이 &quot;첫 반응을 제공하는 속도&quot;를 나타내며, 사용자 경험에 큰 영향을 미친다.  &lt;syntaxhighlight lang=python&gt; import time   import openai    start_time = time.time()...</title>
		<link rel="alternate" type="text/html" href="http://junhoahn.kr/noriwiki/index.php?title=Time_to_first_token&amp;diff=2014&amp;oldid=prev"/>
		<updated>2025-03-27T05:42:40Z</updated>

		<summary type="html">&lt;p&gt;새 문서: &lt;a href=&quot;/noriwiki/index.php?title=%EB%B6%84%EB%A5%98:%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5&quot; title=&quot;분류:인공지능&quot;&gt;분류: 인공지능&lt;/a&gt;  == 개요 == Time to first token(TTFT)는 &lt;a href=&quot;/noriwiki/index.php?title=LLM&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;LLM (없는 문서)&quot;&gt;LLM&lt;/a&gt;의 성능을 평가하는 지표로, 사용자가 프롬프트를 입력한 후 첫 번째 토큰이 생성될 때까지 걸리는 시간을 의미한다. LLM의 Latency를 측정하는 데 사용된다.  TTFT는 LLM이 &amp;quot;첫 반응을 제공하는 속도&amp;quot;를 나타내며, 사용자 경험에 큰 영향을 미친다.  &amp;lt;syntaxhighlight lang=python&amp;gt; import time   import openai    start_time = time.time()...&lt;/p&gt;
&lt;p&gt;&lt;b&gt;새 문서&lt;/b&gt;&lt;/p&gt;&lt;div&gt;[[분류: 인공지능]]&lt;br /&gt;
&lt;br /&gt;
== 개요 ==&lt;br /&gt;
Time to first token(TTFT)는 [[LLM]]의 성능을 평가하는 지표로, 사용자가 프롬프트를 입력한 후 첫 번째 토큰이 생성될 때까지 걸리는 시간을 의미한다. LLM의 Latency를 측정하는 데 사용된다.&lt;br /&gt;
&lt;br /&gt;
TTFT는 LLM이 &amp;quot;첫 반응을 제공하는 속도&amp;quot;를 나타내며, 사용자 경험에 큰 영향을 미친다.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;syntaxhighlight lang=python&amp;gt;&lt;br /&gt;
import time  &lt;br /&gt;
import openai  &lt;br /&gt;
&lt;br /&gt;
start_time = time.time()  &lt;br /&gt;
response = openai.ChatCompletion.create(model=&amp;quot;gpt-4&amp;quot;, messages=[{&amp;quot;role&amp;quot;: &amp;quot;user&amp;quot;, &amp;quot;content&amp;quot;: &amp;quot;Hello!&amp;quot;}], stream=True)  &lt;br /&gt;
&lt;br /&gt;
for chunk in response:  &lt;br /&gt;
    if chunk[&amp;quot;choices&amp;quot;][0][&amp;quot;delta&amp;quot;]:  &lt;br /&gt;
        first_token_time = time.time() - start_time  &lt;br /&gt;
        print(f&amp;quot;TTFT: {first_token_time:.3f} seconds&amp;quot;)  &lt;br /&gt;
        break  &lt;br /&gt;
&amp;lt;/syntaxhighlight&amp;gt;&lt;/div&gt;</summary>
		<author><name>Ahn9807</name></author>
	</entry>
</feed>